Hallo PAX,
ich habe mir eigene Wörterbücher erstellt, und durfte mich eben auch mal mit dieser affix-Datei rumschlagen.
1. Zeile der Affix-Definition
Also in der
1. Spalte deiner affix-Datei gibst du an ob es sich um eine Suffix "SFX" (also um einen Wortanhang) oder um eine Praefix "PFX" (also um eine Worterweiterung vor dem Wort - keine Ahnung wie man das nun verdeutscht). Allerdings gibt es hier noch die Option "REP", aber da bin ich noch nicht drauf gekommen.
In der
2. Spalte gibst du den Definitionsbuchstaben an. Es ist egal ob du hierfür Groß- oder Kleinbuchstaben benutzt. Wobei du mit "A" und "a" zwei Unterschiedliche Definitionen festlegen kann.
Die
3. Spalte legt fest ob das Wort Suffixe und/oder Praefixe erhalten kann. "N" = nur Suffix , "Y" Suffix und Praefix.
Spalte 4 gibt die Anzahl der Affix-Definitionen an.
ab 2. Zeile der Affix-Definition
Spalte 1 und 2 entsprechend Zeile 1.
3. Spalte: zu ersetzende Wortendung. "0" (Null) = Keine Ersetzung der Buchstaben am Wortende. Wenn man dort z.B. "um" angibt wird diese Buchstabenfolge am Wortende mit der Angabe in Spalte 4 ersetzt.
4. Spalte: Entspricht der Affix (Suffix/Praefix). Z.B. "a" ersetzt die Buchstabenfolge die man in der 3. Spalte angegeben hat.
Die
5. Spalte definiert, wie ein Wort enden muß bevor die Suffix angefügt wird. Buchstaben in eckigen Klammern "[]" legen fest, daß das Wort nicht mit den Buchstaben enden darf. Wenn man die Buchstaben nicht einklammert muß das Wort so enden. Wobei das ^-Zeichen wohl einzelne Buchstaben festlegt. Ansonsten gilt die Buchstabenkombination.
Ein Beispiel:
SFX u Y 1
SFX u um a um
==> Es handelt sich um die Affix-Definition "u", die Suffixe und Affixe zuläßt und es gibt 1 Definitionszeile
==> 3. Spalte: die Wortendung "um" wird, durch den in Spalte 4 angegebenen Buchstaben "a" ersetzt.
==> Die Suffix wird aber nur angefügt, wenn das Wort mit "um" endet.
In der .dic-Datei steht z.B. Praktikum/u
==> Praktik
um -> Praktik
a
Du kannst natürlich wie von Joke bereits erwähnt mehrere Affixe für ein Wort festlegen. "Wort/uABC" hier werden die Affix-Definitionen "u", "A", "B", "C" abgefragt.
Editieren tu' ich diese Dateien gewöhnlich mit einem ganz ordinären Texteditor. Und speichere die Dateien mit der ISO-8859-15 Kodierung und UNIX-Zeilenende.
So ich hoffe ich konnte ein wenig Dunkel ins Licht bringen
Viel Spaß