Ich muss eine Software schreiben, mit der man OOo's Affix-Dateien editieren/erstellen kann. Deshalb bin ich gerade dabei, ersteinmal zu verstehen, wie sie überhaupt aufgebaut sind und funktionieren.
Bekanntlich existiert ja eine Hilfedatei, in der "einiges" darüber erklärt wird (http://lingucomponent.openoffice.org/affix.readme). Das scheint allerdings nicht alles zu sein, was man an Möglichkeiten hat. Denn schaue ich mir zum Beispiel die de_DE.dic-Datei an, fallen Einträge auf, die zum Beispiel nicht die Affix-Referenz /S haben (was dies bedeutet, ist ja erklärt), sondern /ox (oder /pST etc.) (man beachte die Kleinbuchstaben). Auch ist mir noch unklar, was Einträge bedeuten, an denen (z.B.) /EPS angehängt ist (ich würde jetzt nur einmal vermuten, dass in diesem Fall bei diesem Wort die Affix-Regeln E, P und S aus der Affix-Datei anwendbar sind).
Es stellen sich mir also folgende Fragen:
- Gibt es eine Erklärung zu diesen vielen weiteren komplexer erscheinenden Anhänge an den Wörter in der Wortliste?
- Existieren bereits (Java-)Klassen/Bibliotheken, mit derren Hilfe ich Affix-Dateien editieren kann, ohne die ganzen Algorithmiken/Implementierungen dafür selbst programmieren zu müssen?
PAX