[DE] prohibit.txt Weitergabe

Moin @dnaber @Jan_Schreiber @Knorr

Ist es gestattet den Inhalt der prohibit.txt an Franz Baumann weiterzuleiten, damit diese Wörter ins Deutsch (Deutschland) einzufügen, um sie anschließend als Rechtschreibfehler erkennen zu lassen?

Grüße Dallun511

1 Like

Ja, gerne.

2 Likes

Ich bedanke mich für die schnelle Antwort und beginne sofort mit der Arbeit.

Grüße Dallun511

1 Like

liebgewonnen steht in Zeile 1708. Warum? Das Verb existiert Duden

1 Like

Vermutlich ein Fehler in der Datei - aber lass uns lieber dein Feedback erstmal sammeln, damit wir nicht jedes Wort einzeln behandeln.

Ist mir nur beim Überfliegen aufgefallen. Ich werde jetzt nicht wegen einzelnen Wort fragen.
Ich werde die einzelnen Wörter sammeln und auf Github verföffentlichen.

Ich habe leider keinen alten Duden zur Hand, aber ich halte es nicht für ausgeschlossen, dass die Zusammenschreibung zwischen 1996 und 2006 nicht erlaubt war. Es kann aber auch einfach ein Irrtum vorliegen.

Das ist auch der Grund, wahrscheinlich wurde das Wort nie entfernt.

Das war mal eure Prohibit.txt Ich habe ordentlicht verkürzt und verbessert. Ihr könnt sie euch ansehen.

Verbotene Wörter Ultimate.zip (19.0 KB)

Güße Dallun511

Danke, da muss aber nochmal jemand drüberschauen. Zum Beispiel steht in deiner Liste Aktienkur/S, also würde damit auch “Aktienkurs” verboten.

1 Like

Ich sehe mir die Datei gerade an.

Frage an @dnaber: Könnte man Anwendungsstandart.* und Verwandte verkürzen zu .*standart.*, oder funktioniert .* nur entweder am Anfang oder am Ende?

Erstes Feedback an @Dallun511: Zunächst mal: Danke.

Eine Sache, die mir aufgefallen ist: Mit diesem ominösen .* muss man sehr vorsichtig umgehen. Deine Zeile Aufenthaltsgen.* würde jedes Wort verbieten, das so anfängt, also auch “Aufenthaltsgenehmigung”. Das ist nun gerade nicht der Sinn der Sache, es soll nur das verstümmelte Pseudowort “Aufenthaltsgen” nicht mehr akzeptiert werden. Hunspell akzeptiert es deswegen, weil es ein Kompositum aus “Aufenthalt” und “Gen” ist.

Außerdem hast du dir in meinen Augen stellenweise unnötig Arbeit gemacht, z.B. mit dem Wort “Anstellungsuhrkundinnen”. Wenn Hunspell das durchlässt, halte ich das für unproblematisch, auch wenn es ein ziemlich abstruses Wort ist. Dass jemand das aus Versehen schreibt, scheint mir praktisch ausgeschlossen.

Am besten kurz testen, geht schneller als das im Code nachzuschauen :slight_smile:

1 Like

Vielleicht war es nicht nötig, aber für war es nötig, denn mit LRS kann schnell dazu verleitet werden, Wörter neuzuerfinden, wodurch -uhrkundinnen passieren kann, was natürlich eine geringe Wahrscheinlichekt hat.

Ich war sowieso nicht mehr ganz bei der Sache, denn ich hat mich sehr traurig gemacht, dass über 90 Prozent durch das Wörterbuch gingen, worunter Sachen sind, die sehr oft verwechselt werden. Standart- statt Standard. Werkstadt statt Werkstatt. Das ist nicht wirklich hilfreif, wenn diese nie gefunden werden.

Ich war wohl einfach bereit, alles hineinzuballern, was mir gerade in dem Sinn kam, weswegen ich auch andere Kombinationen ausprobiert habe.

“.*” kann sein, dass ich es zu häufig verwendet habe, aber irgendwann setzt der Autopiliot ein, dass das man nicht ganz genau nachdenkt, was die Auswirkungen sind.

Grüße Dallun511

Das ist nicht zielführend. Millionen von Menschen weltweit verlassen sich auf Hunspell und LanguageTool. Wir sind wie die Feuerwehr: Nach uns kommt (orthographisch gesehen) niemand mehr. Wenn wir es nicht packen, wer dann?

Das ist eine große Verantwortung. Geh sorgsam damit um. “Patience you must have, my young padawan.” (Master Yoda)

Das kann ich nicht nachvollziehen:

verwechsl

Hm! Millionen weltweit. Irgendwann sind meine Ressourcen auch verbraucht. LibreOffice habe ich es schon aufgeben, was zu verändern. Das LanguageTool macht ebenfalls fertig. Regeln lassen sich nicht mehr deaktivien, was ziemlich nervig sein kann. Und den Wörterbuch renne ich schon über ein Jahr hinterher.

Ich habe Franz Baumann schon mal Bescheid gegeben, dass ich etwas Zeit brauche, um mir das Dokument nochmal gründlich anzuschauen, nur die Motivation ist gerade ein ziemliches Problem.

LibreOffice stürzt zu gern ab oder hängt sich auf. Ich bin froh, dass Notepad++ stattendessen stabiler läuft, was das Bearbeiten vereinfacht. Leider muss ich LO benutzen, um einen “wahren” Fehler zu finden.

Das LanguageTool kann das, aber LO kann das nicht. Darauf wollte ich mich beziehen, falls ich es vergessen habe.

Kinderwerkstadt, Kindertagesstädte etc.

1 Like

Das ist mehr als verständlich (passiert mir auch), aber manchmal muss man eben dreimal hingucken.

1 Like

Wo kann ich mit Hunspell ein Wort eintragen, um mögliche Kombinationen vorgeschlagen zu bekommen.

Alkoholgenus Das ist die Basis

wie es weiter gehen könnte.
Alkoholgenuss
Alkoholgenusses
Alkoholgenuses

Damit es leichter ist, zu entscheiden, wann ich .* einsetzen kann.

Zur prohibit.txt

Könnt ihr hinzufüngen, wenn ihr wollt.
Charaktereigen
Charaktereigenschaf
Charaktereigenschafen
Charaktereigenschafs

Heldeneigen
Heldeneigenschaf
Heldeneigenschafen
Heldeneigenschafs
Heldeneigenschafes

Körpereigenschafen
Körpereigenschafs
Körpereigenschafes

Softwareendwicklung
Softwareendwicklungen

Sondereigenschafen
Sondereigenschafes
Sondereigenschafes
Sondereigenschaf
Sondereigen

Hochpunk
Hochpunks
Bei Hochpunk schlägt eine Regel an, die sich aber nicht indifizieren lässt. Welche Regel schlägt dort ein?

Update:
Personalau
Personalaue
Personalauen

Sektrat
Sektrate
Sektrates
Sektrats
Sekträte
Sekträten

Entfernen:
starkmachen Zeile 2464 Duden

Fehler gefunden:
Zeile:7815 bis 7818
Hirnrichtungsraum
Hirnrichtungsräume
Hirnrichtungsräume/NS
Hirnrichtungsraum/S

Ich vermute, dass hier ein Parameter verrutscht ist, denn es fehlt Hirnrichtungsraumes


Zu der neusten Version, könnt ihr euch ansehen, wenn ihr wollt.
Version 2 Verbotene Wörter Ultimate Version 2.zip (23.4 KB)
Ich werde mir das Dokement in den nächsten Tagen nochmal ansehen.

@Jan_Schreiber Der Autolpilot war deaktiviert, weswegen ich viele Fehler vermieden habe. Z. B. ein .* bei Uhrzeit, was ich gelöscht habe und mit den alten Wörtern ergänzt habe.

100.000 Wörter zu überprüfen und dabei nicht in dem Autopilotenmodus zu wechseln, ist sehr schwer, aber es geht, wenn dabei die Musik voll aufdreht und vermehrt Pausen vollzieht.

Trotzdem gibt es noch eine Verteidigung nach euch, aber wie stark die Verteidigung ist, das ist widerum eine andere Frage, die schwer zu beantworten ist. Ich versuche meine Bestes, dass es gar nicht zur letzten Verteidigung kommt.

Grüße Dallun511 Ferewo