|
|||||||||||||||||||||||||||
In <sslug@sslug> Carsten Svaneborg <sslug@sslug> writes: >Jeg har ca. 6800 patentkoder af formen EP01234567. >Jeg vil gerne lavet et filter således at det læser en liste >af kendte patent koder fra en fil, og fra stdin læser en strøm, >der også indeholder patent koder, og filtret skal udskrive til >stdout alle de patentkoder i stdin, der IKKE var i filen. >Dvs. nye patenter. Antallet af input er formodeligt i størrelses >ordnen 10k patent koder. Så der er mange af dem! En simpel måde med GNU textutils 'comm' programmet kunne være (fil1 = koderne, fil2=din stdin fil) sort <fil1 >fil1.sort sort <fil2 >fil2.sort comm -2 fil11.sort fil2.sort Se 'man comm' for andre muligheder. 'uniq -u' kan måske også bruges. Det kan sikkert gøres uden de store sværdslag i perl/python/whatever. At sortere input først gør nok processen en del nemmere. -- Henrik Storner <sslug@sslug>
|
||||||||||||||
|
||||||||||||||