Re: [LOCALE] ordlistornas källkod
Quoting Lars Aronsson <sslug@sslug>:
> Goran Andersson wrote:
>
> > > 10-30 ord/minut under effektivt arbete. Min svenska aspell-lista (den
> > > expanderade, som används på susning.nu) är idag 176.000 ord, vilket
> >
> > Intressant, den är 50% "större" än än den officiella svenska
> ispell/aspell-
> > ordlistan. Är det möjligt att hämta den från nätet någonstans? Under
> > vilken licens? Bygger den på någon annan ordlista, eller har du skapat den
> > från grunden?
>
> En orsak till att min lista är större, är att jag anser "fri
> sammanfogning" vara en styggelse. Därför har jag slagit av den
> funktionen i ispell/aspell. Då rapporteras sammansatta ord som
> stavfel, varvid jag för in dem i min ordlista.
Ja, även jag föredrar att ta med sammansatta ord i ordlistan men
räknar inte med att kunna få med "alla" möjliga sammansättningar :-)
> Jag har utgått från allt jag kommit över, främst givetvis
> aspell-listan. Idag har jag kollat lite på dina nyare varianter, och
> har följande kommentarer:
>
> De här orden är väl fel: rekommenera, illustera, Norstetds
Ja, de stavades fel då de lades in i ordlistan.
> Förekommer "existera" och "hisna" verkligen i passivum? Har du några
> exempel på sådana meningar?
Det återstår för mig att fundera ut en strategi vad gäller passivformerna
av verb. Det jag gjort i nuvarande (test-)version av XD är att markera
dem som giltiga för alla de ord som klassificerats som verb. Jag skulle
behöva hjälp av en språkvetare för att få en uppfattning om i vilken
utsträckning passivformerna kan betraktas som giltiga (om än krystade).
Jag kommer att lägga till ett nytt "böjningsmönster" för verben, så att man
får välja mellan "de,t" eller "de,t inklusive passiv form".
Vilken strategi har du när det gäller att tillåta/förbjuda verbens passiva
former?
Participformerna är inte alls lika allmänt förekommande som de passiva
formerna, så dem låter jag inte vara med som default.
> Är böjningen "avvägade", "avvägades", "avvägat", "avvägats" rätt?
Nej. Någon har råkat tillämpa fel böjningsmönster på verbet "avväga".
> Ska det verkligen vara genitiv-s på bransch, brosch, bräsch, depesch,
> dusch, hasch, haschisch, kibbutz, marsch, match, musch och Schweiz?
Vet inte. Vad anser du?
> Vad är "siret", "sirets", "vasset" och "vassets"?
Tja, "siret" är bestämd form av substantivet "sir" (som i adjektivet
"sirlig"). Däremot kommer nog "vasset" av att substantivet "vass"
av misstag trotts vara neutrum.
> > > munchlist (ett program som följer med ispell) kan reducera till 38.000
> > > stammar. Munchlist hittar dock en del fuskmönster, t.ex. kan den tro
> >
> > Ja, det behövs mycket intelligentare verktyg för att kunna hantera din
> > källkod utan att förstöra den. Jag minns att jag hade samma problem
>
> Jag skiljer på min källkod (.txt) och utdata från munchlist (som jag
> kallar .ispell).
Jag måste upprepa att jag är mycket intresserad av källkoden eftersom den
inte bara förbättrar rättstavningordlistan avsevärt, utan också (i princip)
anger ordklass och böjningsmönster. Finns den tillgänglig på nätet? Om inte,
kommer den att släppas vid ett senare tillfälle?
--
Göran
 |
 |
 |
| |
|
|
 |
| |
|
Henvendelse vedrørende websiderne til <www_admin>.
|
Senest ændret
2005-08-10, klokken 20:53
Denne side vedligeholdes af
MHonArc
.
|
|
|
 |
 |
 |