SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Re: [LOCALE] ordlistornas källkod



Veronica Loell wrote:

> Kan nämnas att det finns två läger vad gäller verbets stam, ena lägret vill
> ha imperativformen, som jag personligen tycker känns enklast av morfologiska
> skäl. Det andra lägret vill ha infinitivformen och infogar stamförändringar
> istället. Rent datalingvistiskt så är det mycket enklare att använda imperativ
> eftersom man då slipper ändra i stammen innan man lägger till böjningssuffix.
> Om man inte använder sig av morfologi för att blåsa upp ordformer från grund-
> form utan listar alla former i lexikonet istället så spelar det naturligtvis
> inte någon roll vad man använder.

Att plocka bort a:et är inte alls svårt, syntaxen för ispells
affix-fil är kraftfull nog för det, men att skilja verb som i presens
har -ar från verb som har -er är svårt om man utgår från infinitiven.
Om jag skulle utgå från infinitiven, skulle jag behöva två olika
flaggor, en som plockar bort a:et och lägger på -er, och en annan
flagga som bara lägger på -r för att få presensformen, så här:

  läsa/x         ->   -a,er   ta bort a och lägg på er
  gäspa/y        ->   r       lägg på r

Men om jag utgår från imperativen, kan jag med ispell använda en och
samma flagga, som känner igen

  läs/x          ->  [^a] er  om ordet slutar på icke-a, lägg på er
  gäspa/x        ->  a    r   om ordet slutar på a, lägg på r

På det viset får min ispell-affix-fil färre flaggor att röra sig med,
som blir lättare att komma ihåg utantill.  Och min flagga för svaga
verb heter givetvis /v och inte /x eller /y.

Det finns en viss risk för att jag konstruerar min grammatik utifrån
de begränsningar som finns i programmet (ispell), men just det här
fallet tror jag är rätt generellt.


-- 
  Lars Aronsson (sslug@sslug)
  Aronsson Datateknik - http://aronsson.se/



 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:53
Denne side vedligeholdes af MHonArc .