[DE] Ein Wörterbuch für das LanguageTool?

Moin liebes LanguageTool-Team

LibreOffice und OpenOffice nutzen das gleiche Wörterbuch, welches nicht mehr auf dem aktuellen Stand ist und viele Wörter der Zusammenschreiung kennt dieses Wörterbuch nicht, genau wie Kleidungsstücke, welche es nicht seit Gestern existieren. Selbst Technik sind Fremdwörter in diesem Wörterbuch, aber das Wörterbuch kennst Wörter, welches offiziell und ungangssprachlich nicht existieren.

Ich komme zum Problem. Die Per­for­mance nimmt immer mehr ab, weil ich eigene benutzerdefinierte Wörterbücher, weil sonst das LanguageTool nicht in der Lage Fehler zu erkennen. Erst analysiert LibreOffice oder OpenOffice ob das Wort im Wörterbuch exisitert, wenn das Wort im Wörterbuch steht, schaut sich das LanguageTool das Wort an und schaut ob die grammatischen Regeln eingehalten werden. Danach wird der Satz blau markiert oder nicht. Aber wenn LibreOffe oder OpenOffice das Wort nicht kennt, dann kann das LanguageTool nichts machen.

Ein Beispiel: “Ich möchte, dass du zurückkommst.”

Dieses Wort kennt das Wörterbuch nicht, also kann das LanguageTool nicht arbeiten und macht nichts, was eigentlich sehr schade ist, denn der Satz könnte auch so aussehen.

Das Beispiel: “Ich möchte, dass wir zurückkommst.”

Hier waren einen Fehler, welcher das LanguageTool auch erkkennt, aber wenn das Wort nicht mal im Wörterbuch steht, kann das LanguageTool noch so clever sein, wie es will. Es wird von LibreOffice und OpenOffice ausgebremst, obwohl es mehr kann.

Meine Per­for­mance für LibreOffice ist mittlerweile kritisch, denn meine Wörterbücher sind für LibreOffice schon zu viele und es werden immer mehr und nicht weniger. Wenn ich jetzt ein neues Wort ins benutzerdefinierte Wörterbuch eintrage, läggt und ruckelt es sehr stark und ich kann nicht weiter schreiben und muss warten. Heute ist mir sogar LibreOffice komplett abgestürzt, was mir langsam sorge macht, denn ich muss Wörter neu eintragen, damit das LanguageTool überhaupt arbeiten kann.

Ich habe mich erkundigt und finde nirgendwo eine Anleitung um ein eigenes Wörterbuch zu schreiben, um dieses Problem zu lösen, denn für mich ergibt der Sinn ein eigenes geschriebenes Wörterbuch mehr Sinn, als das Wörterbuch von LibreOffice zu nutzen, was Gefühlt nicht mehr geupdatet wird.

Ohne ein Wörterbuch kann das LanguageTool nichts machen, denn es kann seine Regeln nicht anwenden, um Fehler zu melden und ich brauche das LanguageTool, um mich weiterzuentwickeln. Das LanguageTool braucht ein funktionieres und aktuelles Wörterbuch, um zu funktionieren. Die Frage ist jetzt, wer kann ein Wörterbuch schreiben? Ich würde, wenn man mir es beibringen kann. Ich habe schon Bekannte gefragt, aber niemand weiß, wie das geht. Vielleicht wisst ihr das?

Grüße Dallun511

Danke für deine Bereitschaft.

Mein Vorschlag ist: Wende dich per Mail an Karl Zeiler. Der ist für das deutsche Sprachpaket von LibreOffice zuständig und wird am besten wissen, was zu tun ist. Letzte bekannte Mailadresse: <vorname>.<nachname>@t-online.de [Anti-Spam-Maßnahme].

Vermutlich wird er dich an Franz Michael “Frami” Baumann verweisen, dem du dann deine Liste schicken kannst.

Der Vorteil ist, dass deine Vorschläge einer großen Community weiterhelfen; der Nachteil ist: Es kann Monate dauern, bis es ein Update des Wörterbuchs gibt.

Ich habe vor zehn Jahren selbst mal ein Erweiterungswörterbuch zusammengestellt. Das war auch nicht schwierig, aber nach meinem Kenntnisstand funktioniert das nicht mehr, weil LibreOffice nur noch ein Wörterbuch pro Sprache erlaubt.

Ich weiß keinen besseren Weg.

Ich wäre zufrieden, wenn es überhaupt mal geupdatet wird, denn meine Wörterbücher sorgen schon für starke Probleme, weil es schon zu viele für LibreOffice sind, um einen Überblick für mich zu behalten.

Ich konnte problemlos ein zweites Wörterbuch installieren, aber es war genau veraltet, wie das andere, also lohnte es sich nicht.

Ich habe ja ein Wörterbuch als ODT-Datei, was ich nur noch anpassen muss, weil nicht alle Wörter in ein offizielle Wörterbuch gehören, wie z.B. mein Name “Dallun511” Ich hoffe nur, dass es überhaupt ein Update gibt, denn die LibreOffice-Entwickler machen gefühlt nichts.

Grüße Dallun511

Falls es euch interessiert. Ich habe jetzt eine TXT erstellt, welche Wörter beinhaltet, welche LibreOffice nicht nativ kennt, worunter auch die Vornamen sind, die euch geschickt habe. Ein Wort was in meiner Liste enthalten ist, ist das Wort “LanguageTool”, damit jeder Wort richtig schreiben kann. Ich werde noch weiter sammeln und am Ende Sonntag die E-Mail schreiben. Ich möchte schließlich so viele Wörter wie möglich aufeinmal schicken, damit es sich wirklich lohnt.

Ich habe sogar an den Uhrzeiten gedacht von 00:00:00 bis 24:00:00, welche nativ nicht im Wörterbuch sind und wenn man Zahlen in Wörtern verbietet, dann werden auch die Uhrzeiten als Fehler makiert. Auch die Klassenstufen 1a bis 13d sind dabei.

Habt ihr vielleicht noch Wörter, welche das Wörterbuch nicht nativ kennt?
Dann sagt mir Bescheid.

Grüße Dallun511

Man sollte dir den Beinamen Bugfinder geben.

:scream: Ich falle vom Glauben ab: In OpenOffice Writer 4.1.3 ist das auch so. Anscheinend wurde übersehen, dass der Doppelpunkt ein Worttrenner und kein Buchstabe ist. Ich werde mich morgen mal hinsetzen und einen Fehlerbericht für das LibreOffice-Team schreiben, falls das Problem nicht schon bekannt ist.

Die Uhrzeiten ins Wörterbuch aufzunehmen, ist in meinen Augen keine Lösung. Wenn ich richtig gerechnet habe, gibt es 86.400 Uhrzeiten in dem von dir angegebenen Format, plus 1440 im Format 12:30 ohne die Sekunden. Das wird etwas zu viel. :wink:

Wenn LibreOffice alle Vornamen aus deiner Liste nicht kennt, dann hast du höchstwahrscheinlich eine uralte Version des Wörterbuchs installiert. Kannst du mal bitte im Menü Extras den Extension Manager aufrufen und gucken, was da zum deutschen Wörterbuch steht?

Nicht alle, aber viele.


und mein Wörterbuch ist genau das gleiche, was du hast.

Alle Urhzeiten sind betroffen, was circa 80 Prozent der Wörterlist ist, weil Uhrzeiten wichtig sind. Ich kann auf dauer auf sie nicht verzichten, Selbst die Ordnungszahlen sind nicht enthalten und ich habe absolut keine Ahnung, wie die heißen.

Bsp. 1ster, 2ter usw.

Ich finde nur die englischen Versionen, aber keine Tabelle einer deutschen Version.

Zum LibreOffice-Team. Ich warte bis heute, dass sie den Bug fixen, dass Wörter wie … verlassen haben.Ich will nicht …" Nicht mehr in der Wortergänzung zu gelassen werden oder, dass der LibreOffice-Schnellstarter mein Arbeistsspeicher wieder frei gibt, wenn das letzte Dokument geschlossen wurde, denn LibreOffice, wie euch bekannt 2,5 GB, die erst wiederkriege, wenn ich das Programm brutal mit dem TaskMananger kille und nicht vorher, weil ein No-Go sein sollte. Wir haben Juli und ich habe das im Frebuar gemeldet. Geändert hat sich bis heute nichts, was wirklich schade ist. Ich habe keine Hoffnung mehr, dass sich an diesen Problemen war ändern wird.

Ob LibreOffice sich mit den Uhrzeiten beschäftigen bezweifele ich sehr stark, denn gefühlt machen sie nichts. Ich habe schon auf drei Probleme hingewiesen und das ist leider schon vier Monate hin.

Ich hoffe, dass der weise Schreiber mehr erfolg hat, aber ich habe die Hoffnung aufgegeben, dass die Performanz bei großen Dateien besser wird, sowohl das Schnellstarter Problem oder die Wortergänzung.

Grüße Dallun511

Das liegt daran, dass diese Schreibweise im Deutschen nicht üblich ist.

Es ist der Sinn des Schnellstarters, dass er genau das nicht tut. Er behält das Programm teilweise im Arbeitsspeicher, damit es schneller startet.
Hast du mal ausprobiert, den Schnellstarter in den Optionen abzuschalten?
2018-07-13-125749_1024x768_scrot

Ich muss den Schnellstarter aktiviert lassen, damit überhaupt meine großen Datei schnell nutzen kann, aber das LanguageTool nihmmt sich sofort nach der ersten Taste auf der Tastatur sofort die 1,5 bis 2,5 GB und hält sie fest. LibreOffice selbst benötigt eigentlich nur 500 MB und mit diesem Wert könnte ich problemlos leben, aber 2,5 GB sind ehrlich zu viel.

Grüße Dallun511

Die Uhrzeiten sind jetzt in einer separten Wörterliste, weil ich sie vielleicht als Übergangslösung selber brauche.

Was fragen wollte, ist, ob es auch möglich ist, ihn darum zu bitten, Wörter welche es nicht gibt oder falsch geschrieben aus dem Wörterbuch zu entfernen?

Beispiel
grafik

Walkie-Talkie wird offiziell nur so geschrieben.

Grüße Dallun511

Ja. Ich bin nicht sicher, ob das bei Wörtern funktioniert, die einen Bindestrich enthalten, aber grundsätzlich geht das. Die Rechtschreibprüfung hat eine sog. blacklist, in die man falsche Wörter wie “Schülerrinnen” mit zwei r aufnehmen kann.

Du kannst dir die Arbeit mit diesem Makro erleichtern. Es kann Benutzerwörterbücher aus LibreOffice in Textdateien exportieren, die du dann an Frami Baumann oder Karl Zeiler verschicken kannst.

Du kannst das im Zip-Archiv enthaltene Dokument einfach mit LibreOffice öffnen.

Ich weiß jetzt nicht, was du meinst.

Meine Benutzerwörterbücher sehen so aus.

Die ich problemlos mit einem Editor einsehen kann.

Wo hier was mit Zip sein soll, weiß ich jetzt nicht.

Hast du auch dieses Wörterbuch?
grafik

Selbst Internet steht in diesem Wörterbuch.

Sorry, da habe ich offenbar eine Entwicklung verpennt. Früher wurden die Wörterbücher in einem obskuren Binärformat gespeichert.

Nicht schlimm. War nur verwirrt. Was mir aufgefallen ist, dass der einfache Editor und Notepad++ Probleme mit dem ẞ haben.

Weiser Jan

Bevor ich hunderte Wörter suche, die ein ß haben. Kann meine eine einfache Regel/Variabel im Code des Wörterbuch programmen, die auch das ẞ berücksichtigt? Ich meine früher wurden in Druck “Straße” so geschrieben “STRASSE” und nicht “STRAẞE”, wie es heute möglich ist.

Hoffe auf eine schnelle Antwort.

Grüße Dallun511

Die E-Mail “Die Bitte der Aktualisierung des Wörterbuches “Deutsch (Deutschland)””, womit abgeschickt und jetzt heiß es abwarten. Es sind 1352 Wörter, welche ich gefunden habe und hoffentlich alle angenommen werden.

Ich bedanke mich an deiner Hilfe weiser Jan Schreiber. Ich hoffe nur, dass die E-Mail auch ankommt.

Grüße Dallun511 Ferewo

Mach dir bitte keine Arbeit mit der Liste. Falls wir eine Liste von Wörtern mit ß brauchen sollten, kann ich in ein paar Minuten eine erzeugen, die über 37.000 Wörter enthält.

Wie du vorgeschlagen hast, ist es aber natürlich eleganter, das Problem im Programmcode zu lösen. Fragt sich nur, ob jemand Zeit dafür hat im Moment.

Die ist nicht angekommen. Schau bitte mal, ob ein Tippfehler in der Adresse ist.

Die E-Mail ging an Karl Zeiler, welche sich auf das Wörterbuch beziehen.

Grüße Dallun511

1 Like

Mich würde es brennend interessieren, ob du schon einen Fehlerbericht abgeschickt hast und wenn ja, ob du schon eine Antwort hast.

Ich habe leider noch keine E-Mail von Karl Zeiler gekriegt, was natürlich nichts zu bedeuten hat. Vielleicht sieht er sich erstmal die Liste an, bevor er eine Antwort schreibt.

Grüße Dallun511