|
|||||||||||||||||||||||||||
On Wed, 29 May 2002 01:17:41 +0200 (MET DST), Jacob Sparre Andersen <sslug@sslug> wrote: >> Jeg synes det er lang tid siden at jeg har hørt noget om >> ordbogen. Sker der noget eller er projektet gået i stå? > > Ja. > > Der sker noget. Men det er primært kedelige tekniske ting. Det lyder godt. > Bo Pedersen, Henrik Grove og jeg har i de seneste par uger > arbejdet på en automatiseret grammatisk kategorisering af > ordene i ordlisten (over 50% af ordene kan kategoriseres > automatisk med vores nuværende systemer). Ved at kigge på ordendelser og så se at alle formenerne er der eller hvad? Fx hvis X, Xen, Xe, Xene er i ordbogen og X kun indeholder små bogstaver (ingen store bogstaver, mellemrum eller andre tegn), er det nok et navneord med X som rod. > Og så sent som i dag har Henrik Grove og jeg siddet og rodet > med problemet med at implementere en webgrænseflade til > ordlisten, der kan bruges til at tilføje grammatisk > information. Hvis der er nogle hajer til at implementere > webgrænseflader til databaser, så er der en beskrivelse af > databasens design her: > > http://jacob.sparre.dk/temp/referat-2002-03-12.ps.gz Det er jeg ikke haj til. Uanset hvilket program jeg har lavet, har brugergrænsefladen været det kedelige. Hvor langt er i nået med at lave webgrænsefladen? Hvordan kommer der nye ord i ordbogen? Ud fra de ord jeg har set går jeg ud fra at der er blevet hentet hjemmesider eller news ind, og brugt som data. Er det korrekt? Blandt andet den store mængde af engelske ord får mig til at tro det. Hvis man hiver ord ind fra news eller hjemmesider, ville det være rart hvis sætningen eller afsnittet også blev gemt, så man kan se i hvilken kontekst ordet forekommer i. Det er ret svært at vide om et ord er stavet forkert eller i virkeligheden er et andet ord. Dette gælder specielt for egennavne. En anden feature, som jeg synes manglede ved den gamle webgrænseflade, var at man kunne få det samme ord flere gange, selvom man havde svaret "ved ikke" til om det var stavet korrekt. Det kunne være smart, hvis man loggede ind, og kun fik ord som man ikke havde kigget på før. -- Anders Bo Rasmussen
|
||||||||||||||
|
||||||||||||||