SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [PERL] email grab



Jesper Bunch wrote:
> Nu fatter jeg ingenting af hvorfor der bliver brugt ?: (har ikke
> sat mig ind i perl regex endnu.)

Se "man perlre"

s/fisk(a|b|c)hest/$1/i;

Ovenstående vil matche fx. fiskahest og 'a'
gemmes som en reference \1 i sed $1 i perl. 

Dvs. ovenstående regex vil restatte alle ord, der starter med
fisk og ender med hest, med det bogstab der står i midten.

s/fisk(?:a|b|c)hest/$1/i;

vil matche de samme ord, men uden at der gemmes ting
i en reference, dvs. den fungere bare som en parentes for
(a|b|c) udtrykket.

> Men anyway...
> (?:(?:[a-z0-9]+[a-z0-9-]*)+\.) kan ikke laves om med \w da der
> ikke må være _ i et domæne navn og du må ikke have et domæne navn
> med - til at starte med (hvilket din såvidt jeg kan se din
> tillader).

Det er sandt. Men typisk vil risikoen for at folk indtaster
syntaktisk ukorrekte email addresser der ikke virker, være ret
begrænset, og så længe whitespaces ikke er inkluderet så burde
forskellen være stort set det samme..

> Og (?:[a-z]{2,}) sørger jo netop for at der er 2 ellere flere
> bogstaver i topdomænet så fx .com virker.

Korrekt. Jeg havde læst forkert i man siden.

-- 
* Kurosawa: http://www.designlabs.dk/husetsbio *
* Email: Carsten dot Svaneborg at risoe dot dk * 
*  http://www.fys.risoe.dk/fys/External/casv/  *



 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 19:53
Denne side vedligeholdes af MHonArc .