Habt ihr eine deutsche Anleitung, die mich in der Lage versetzen kann, um mich mit der added.txt zu beschäftigen und selbst zu ergänzen. Z. B. für meine frei erfunden Wörter oder auch für Wörter, die alle benötigen?
Ich würde mich über eine schnelle Antwort freuen. Ihr könnt mir direkt sagen, wenn es zu komplex werden könnte. Ich möchte nur gern selbst Wörter hinzufügen können, um nicht immer euch zu frage, dass ihr diese einfügt. Das spart Zeit und ich muss nicht immer die neuste Version herunterladen, sondern nur diese Datei aktualisieren.
Soweit ich weiß, ist die Datei tagset.txt die einzige Dokumentation, die wir haben. Ohne Beispiele wird man daraus nicht so richtig schlau (ich zumindest nicht), aber an Beispielen herrscht ja kein Mangel.
Das Grundprinzip ist, dass die sog. Tags (wörtlich: Etiketten) wie zum Beispiel “SUB:NOM:SIN:MAS” uns sagen, mit welcher Wortart und mit welcher grammatischen Form eines Wortes wir es zu tun haben. Die Tags sind im Grunde bloß Abkürzungen für die grammatischen Begriffe, die du aus der Schule kennst: SUB steht für “Substantiv”, NOM für “Nominativ”, SIN für “Singular” usw. Steht alles in tagset.txt.
added.txt enthält pro Zeile eine Wortform, die zugehörige Grundform (wie sie in einem normalen Wörterbuch stehen würde), sowie diese besagten Tags, durch Tabulatorzeichen getrennt.
Als Beispiel mal die Tags für das Wort “Vollidiot” [das Wort ist nur ein zufällig gewähltes Beispiel und soll niemanden beleidigen] in der Reihenfolge, wie man sie aus der Schulgrammatik kennt:
Vollidiot Vollidiot SUB:NOM:SIN:MAS [wer? der Vollidiot]
Vollidioten Vollidiot SUB:GEN:SIN:MAS [wessen? des Vollidioten]
Vollidioten Vollidiot SUB:DAT:SIN:MAS [wem? dem Vollidioten]
Vollidioten Vollidiot SUB:AKK:SIN:MAS [wen? den Vollidioten]
Vollidioten Vollidiot SUB:NOM:PLU:MAS [wer? die Vollidioten]
Vollidioten Vollidiot SUB:GEN:PLU:MAS [usw.]
Vollidioten Vollidiot SUB:DAT:PLU:MAS
Vollidioten Vollidiot SUB:AKK:PLU:MAS
Vollidiotin Vollidiotin SUB:NOM:SIN:FEM
Vollidiotin Vollidiotin SUB:GEN:SIN:FEM
[usw.]
Es beginnt mit “Substantiv, Nominativ, Singular, Maskulinum” und geht mit Genitiv, Dativ, Akkusativ weiter. Anschließend wird in den Plural gewechselt, danach kommt alphabetisch die weibliche Form.
Sehr gut. Ich habe auch fest damit gerechnet, dass du das hinbekommst. Dass du die Datei added.txt überhaupt gefunden hast, zeigt ja schon, dass du dich mit der Software intensiv beschäftigt hast.
Hier schlägt LT vermutlich deswegen keinen Alarm, weil “mit der <MAS|NEU>” nicht zwingend überall falsch ist:
Die Maschine, mit der Autos angetrieben werden, wird Motor genannt.
Wenn du da was machen willst, ist das ein Fall für die Datei grammar.xml.