SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [LOCALE] Webskanning



> Jeg har lige pakket et lille program til at hente ord fra
> websteder sammen:
> 
>    http://hugin.ldraw.org/temp/gafl_tekst_fra_websted-20010312.tar.gz
> 
> Jeg håber du kan bruge det til noget.

Det ser meget interessant ud da det er noget mere struktureret end hvad jeg selv 
har gjort. Men jeg syntes ikke helt det spiller. Hvis jeg sætter den i gang med 
f.eks:

./gafl cst.ku.dk dk - 1&

eller bare

./gafl cst.ku.dk dk

står den ganske vist og tygger på det kan jeg se med "top", men nu har jeg haft 
den stående i 24 timer og der sker ikke rigtigt noget.

Hvis jeg kigger ned i tmp ser det heller ikke ud til at der sker så meget:

sslug@sslug gafl_tekst_fra_websted-20010312]$ more /tmp/*
::::::::::::::
/tmp/gftw-all-0AEHkT
::::::::::::::
http://cst.ku.dk/
::::::::::::::
/tmp/gftw-buffer-6TNaZW
::::::::::::::
::::::::::::::
/tmp/gftw-head-jMo7tV
::::::::::::::
HTTP/1.0 200 Document follows
Server: CERN/3.0A
Date: Tue, 13 Mar 2001 08:16:46 GMT
Content-Type: text/html
Content-Length: 2394
Last-Modified: Wed, 24 Jan 2001 07:50:15 GMT


::::::::::::::
/tmp/gftw-scanned-9eLNSR
::::::::::::::
http://cst.ku.dk/
::::::::::::::
/tmp/gftw-text-jlA31U
::::::::::::::
::::::::::::::
/tmp/gftw-unprocessed-EGHM2T
::::::::::::::

*** /tmp/lost+found: directory ***

sslug@sslug gafl_tekst_fra_websted-20010312]$  


Er der noget jeg har misforstået?

/Bo


 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:52
Denne side vedligeholdes af MHonArc .