|
|||||||||||||||||||||||||||
Jesper Bunch wrote:
> Nu fatter jeg ingenting af hvorfor der bliver brugt ?: (har ikke
> sat mig ind i perl regex endnu.)
Se "man perlre"
s/fisk(a|b|c)hest/$1/i;
Ovenstående vil matche fx. fiskahest og 'a'
gemmes som en reference \1 i sed $1 i perl.
Dvs. ovenstående regex vil restatte alle ord, der starter med
fisk og ender med hest, med det bogstab der står i midten.
s/fisk(?:a|b|c)hest/$1/i;
vil matche de samme ord, men uden at der gemmes ting
i en reference, dvs. den fungere bare som en parentes for
(a|b|c) udtrykket.
> Men anyway...
> (?:(?:[a-z0-9]+[a-z0-9-]*)+\.) kan ikke laves om med \w da der
> ikke må være _ i et domæne navn og du må ikke have et domæne navn
> med - til at starte med (hvilket din såvidt jeg kan se din
> tillader).
Det er sandt. Men typisk vil risikoen for at folk indtaster
syntaktisk ukorrekte email addresser der ikke virker, være ret
begrænset, og så længe whitespaces ikke er inkluderet så burde
forskellen være stort set det samme..
> Og (?:[a-z]{2,}) sørger jo netop for at der er 2 ellere flere
> bogstaver i topdomænet så fx .com virker.
Korrekt. Jeg havde læst forkert i man siden.
--
* Kurosawa: http://www.designlabs.dk/husetsbio *
* Email: Carsten dot Svaneborg at risoe dot dk *
* http://www.fys.risoe.dk/fys/External/casv/ *
|
||||||||||||||
|
||||||||||||||