|
|||||||||||||||||||||||||||
sslug@sslug (Anders Bo Rasmussen) writes: > Ved at kigge på ordendelser og så se at alle formenerne er der eller > hvad? Fx hvis X, Xen, Xe, Xene er i ordbogen og X kun indeholder små > bogstaver (ingen store bogstaver, mellemrum eller andre tegn), er det > nok et navneord med X som rod. Ja, blandt andet. Bo fra CST (Center for SprogTeknologi) har også kørt ordlisten gennem deres tagger. De to metoder er tilsyneladende gode til forskellige ting. > Hvordan kommer der nye ord i ordbogen? I øjeblikket vist kun ved at vi selv skriver dem ind i logfilerne. > Ud fra de ord jeg har set går jeg > ud fra at der er blevet hentet hjemmesider eller news ind, og brugt som > data. Er det korrekt? I en periode blev flere nyhedssider dagligt scannet for ord. > Hvis man hiver ord ind fra news eller hjemmesider, ville det være rart > hvis sætningen eller afsnittet også blev gemt, så man kan se i hvilken > kontekst ordet forekommer i. Det er ret svært at vide om et ord er > stavet forkert eller i virkeligheden er et andet ord. Dette gælder > specielt for egennavne. Det kan systemet ikke håndtere endnu. > En anden feature, som jeg synes manglede ved den gamle webgrænseflade, > var at man kunne få det samme ord flere gange, selvom man havde svaret > "ved ikke" til om det var stavet korrekt. Det kunne være smart, hvis man > loggede ind, og kun fik ord som man ikke havde kigget på før. Det var bevidst at det ikke var et krav at man loggede ind, vi har en ide om at det får flere til at hjælpe. Du har selvfølgelig ret i at der kunne være fordele forbundet med at logge ind, og vi vil da også overveje at implementere muligheden, men det har ikke høj prioritet. .Henrik -- Linux overalt! - og det kan kun gå for langsomt!
|
||||||||||||||
|
||||||||||||||