[DE] Das Problem Stück

Moin liebes LanguageTool-Team,

ihr habt euch zwar in diesem Thread im Forum nicht zu der Frage bezüglich der Mithilfe geäußert, weswegen ich das Editieren erstmal auslasse. Aber ich habe einen Fehler gefunden, der das Niveau von “Spielzug/Spielzeug” hat. Nachzulesen in diesem Thread.

Hier gebe ich euch nur eine kleine Auswahl von Wörtern, die das LanguageTool als legitime Wörterkombinationen erlaubt. Dabei handelt es natürlich um falsche Wörterkombinationen.

Stückzitronentorte
Stückzitronenkuchen
Stückcomputer
Stückhaushalt
Stückschwert
Stückschüler
Stückschülerinnen
und viele mehr

Dieser Fehler ist mir selbstverständlich zunächst in LibreOffice aufgefallen, weswegen der Fehler in OpenOffice ebenfalls vorhanden ist. Beide Programme nutzen nämlich dasselbe Wörterbuch mit denselben Fehlern. Update leider nicht in Aussicht. Beim LangaugeTool kann man dies nicht sagen, also getestet und Treffer versenkt.

Das LanguageTool hat diesen Fehler, den ich nicht beheben kann. Ich müsste vermutlich tausende, wenn nicht sogar zigtausend Wörter hinzufügen und es würde kein Ende nehmen. Hier müsst ihr ran. Ihr kennt die Abkürzungen, die ich nicht kenne.

Es würde mich, wenn ihr diesen Fehler zum nächsten großen Update behoben habt. Davon profitieren garantiert sehr viele und diese fehlerhafte Wortkombinationen verschwinden.

Ich melde mich wieder, sobald ich erneut so einen Fehler gefunden habe, ansonsten kommen die typischen Fehlerlarme auf Github.

Grüße Dallun511

Hallo Dallun511,
danke für deine interessanten Beiträge. Auch für mich ist es hilfreich, zu verstehen, was das Tool kann und wo es seine Schwächen/blinden Flecken hat.
In diesem Fall (willkürlich zusammengestellte Komposita, wenn ich richtig verstehe) frage ich mich spontan: Wer schreibt so etwas? Wie oft kommt das überhaupt vor? Ich habe schon unfassbar viel geschrieben und noch viel mehr gelesen; das Wort “Stückzitronentorte” ist mir in all den Jahrzehnten nicht untergekommen.
Ich sehe auch keine ähnlichen Wörter, mit denen “Stückzitronentorte” verwechselt werden könnte.
M. a. W.: Irgendwo hört es möglicherweise auf, was man sinnvoll durch einen Algorithmus prüfen lassen kann. Und gerade bei Komposita haben wir im Deutschen unendlich viele Möglichkeiten.
Die Alternative wäre ggf. eine Fehlermeldung in der Art “Unbekanntes Kompositum”, die stur gegen das Wörterbuch prüft. Die würde dann aber wohl auch wieder zu recht vielen “false negatives” führen.

Oder verstehe ich dein Problem falsch?

Ich bin kein Programmierer, weil ich es nie gelernt habe. Aber im Falle des Wörterbuches kenne ich den Grund für diesen Fehler. Ich habe nämlich Kontakt zu den Entwicklern, die das Wörterbuch pflegen.

Die deutsche Sprache hat sehr viele Komposita, welche selten einzeln in eine Liste geschrieben werden, weswegen Abkürzungen genutzt werden, um eine große Vielzahl Komposita zu ermöglichen. Dabei entstehen selbstverständlich Komposita, die nicht legitim sind.

Wenn die fehlhaften Komposita nicht gemeldet werden, können diese auch nicht entfernt werden. Vorher müssen sie nur in freier Wildbahn gesichtet werden.

Im Falle vom LanguageTool ist die Sache auch einfach. Die Basis ist dasselbe Wörterbuch, welches auch OpenOffice und LibreOffice nutzen. Das LanageuageTool-Team hat dieses Wörterbuch auf ihre Bedürfnisse erweitert und fehlehafte Komposita entfernt.

Ich hoffe, ich konnte die Frage beantworten