SkÃ¥ne Sjælland Linux User Group - http://www.sslug.dk Forside   Tilmelding   Postarkiv   Forum   Kalender   Søg
MhonArc Dato: [Date Prev] [Kronologisk oversigt] [Date Next]   TrÃ¥d: [Date Prev] [Oversigt trÃ¥de] [Date Next]   MhonArc
 

Grammatik fra munchlist



Vi har  snakket lidt om hvordan vi kunne bruge munchlist til at opnå
grammatisk information. Her er et bud på en start:

1. Vi finder typiske affix mønstre for navne-, udsagns- og tillægsord 
(AZX whatever..)

2. vi grep'er på disse mønstre i munchlisten og indfører disse rødder i
ordlisten som rigtige ord (med 0 accept) og grammatisk information
svarende til hvilken klasse de tilhører, med sig selv som rod, og den
bøjning som munchlisten er konstrueret efter at give som rod.
Der vil være en del ord (biord, ord som er i to klasser etc) som ikke
bliver fanget men det er da en begyndelse.

3. Nu finder vi alle de ord i listen som stammer fra denne rod. grep med
regexp skulle vist kunne klare det? vi sætter deres rod, og mon ikke vi
også skulle kunne gætte deres grammatik med lidt perl magi?

4. Tilsidst sætter vi et web interface op så man kan tjekke et helt ord,
med alle dets bøjninger.

1 og 2 skulle være rimelig lige ud af landevejen og i det mindste har vi
så rødderne på plads. 3 kræver lidt mere arbejde men jeg tror ikke det er
så umuligt hvis vi sætter os ned og kigger nøje på Henriks glimrende affix
fil. 4 overlade jeg trygt til Jacob og Ada :-)

Sune



 
Forside   Tilmelding   Postarkiv   Oversigt   Kalender   Søg

 
 
Henvendelse vedrørende websiderne til <www_admin>. Senest ændret 2005-08-10, klokken 20:52
Denne side vedligeholdes af MHonArc .