|
|||||||||||||||||||||||||||
Vi har snakket lidt om hvordan vi kunne bruge munchlist til at opnå grammatisk information. Her er et bud på en start: 1. Vi finder typiske affix mønstre for navne-, udsagns- og tillægsord (AZX whatever..) 2. vi grep'er på disse mønstre i munchlisten og indfører disse rødder i ordlisten som rigtige ord (med 0 accept) og grammatisk information svarende til hvilken klasse de tilhører, med sig selv som rod, og den bøjning som munchlisten er konstrueret efter at give som rod. Der vil være en del ord (biord, ord som er i to klasser etc) som ikke bliver fanget men det er da en begyndelse. 3. Nu finder vi alle de ord i listen som stammer fra denne rod. grep med regexp skulle vist kunne klare det? vi sætter deres rod, og mon ikke vi også skulle kunne gætte deres grammatik med lidt perl magi? 4. Tilsidst sætter vi et web interface op så man kan tjekke et helt ord, med alle dets bøjninger. 1 og 2 skulle være rimelig lige ud af landevejen og i det mindste har vi så rødderne på plads. 3 kræver lidt mere arbejde men jeg tror ikke det er så umuligt hvis vi sætter os ned og kigger nøje på Henriks glimrende affix fil. 4 overlade jeg trygt til Jacob og Ada :-) Sune
|
||||||||||||||
|
||||||||||||||