SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [PERL] Smart måde at checke på?



In <sslug@sslug> Carsten Svaneborg <sslug@sslug> writes:

>Jeg har ca. 6800 patentkoder af formen EP01234567.

>Jeg vil gerne lavet et filter således at det læser en liste
>af kendte patent koder fra en fil, og fra stdin læser en strøm,
>der også indeholder patent koder, og filtret skal udskrive til
>stdout alle de patentkoder i stdin, der IKKE var i filen.
>Dvs. nye patenter. Antallet af input er formodeligt i størrelses
>ordnen 10k patent koder. Så der er mange af dem!

En simpel måde med GNU textutils 'comm' programmet kunne
være (fil1 = koderne, fil2=din stdin fil)
  sort <fil1 >fil1.sort
  sort <fil2 >fil2.sort
  comm -2 fil11.sort fil2.sort

Se 'man comm' for andre muligheder. 'uniq -u' kan måske også bruges.

Det kan sikkert gøres uden de store sværdslag i perl/python/whatever.
At sortere input først gør nok processen en del nemmere.
-- 
Henrik Storner <sslug@sslug> 



 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 19:54
Denne side vedligeholdes af MHonArc .