SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [PERL] email grab



Kaare Rasmussen wrote:
> m/((?:[_a-z0-9-])+(?:\.[_a-z0-9-]+)*@
> (?:(?:[a-z0-9]+[a-z0-9-]*)+\.)+(?:[a-z]{2,}))/mg;

\w = [_a-z0-9]  alle alfanumeriske chars.

Så vidt jeg forstår er missionen med den første konstruktur at undgå
'.' som første char i email, men hvad bare en negative-look-back
assertion (?<!.) og (?!.) istedet?

Så hvad med at skrive
while ($file ~= /(?<!.)(sslug@sslug)(?!.)/gic ) print $1;

Hvor $file er indeholdet i html siden.

Dog vil denne regex også fange emails fra et domæne med mere
end 2 bogstaver fx. .com osv.

-- 
* Kurosawa: http://www.designlabs.dk/husetsbio *
* Email: Carsten dot Svaneborg at risoe dot dk * 
*  http://www.fys.risoe.dk/fys/External/casv/  *



 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 19:53
Denne side vedligeholdes af MHonArc .