[de] Nun sag, wie hältst du’s mit den Eigennamen?

Eine längst überfällige Diskussion in meinen Augen: Wie gehen wir mit Eigennamen um? Ich habe eine Liste der einschlägigen Benutzervorschläge angelegt, die aber für nichts benutzt wird und im Moment einfach nur Daten für die potentielle spätere Verwendung anhäuft.

Ich habe dazu ein paar Ideen:

  • Nachnamen würde ich eher nicht aufnehmen, außer wenn sie extrem häufig sind (Beispiel: Rademacher).
  • Vornamen würde ich tendenziell eher aufnehmen (Beispiel: Samantha). Es nervt schon, wenn alltägliche Namen als Rechtschreibfehler angezeigt werden.
  • Ortsnamen sind ein schwieriges Thema. Wie sollen wir hier vorgehen? Nach Einwohnerzahl oder wie? Ortsteile von Kleinstädten in Südbaden möchte ich eher nicht im Wörterbuch haben, aber Stadtteile von z. B. Berlin oder Frankfurt schon. Ideen?

Ich entscheide hier schon eine ganze Weile in Gutsherrenmanier und fühle mich nicht recht wohl dabei.

Zu der Häufigkeit von Namen müsste es ja irgendwie Daten geben. Zu Deinen Kriterien würde ich noch hinzufügen: Wie nah ist das Wort an einem bestehenden Wort, sowohl von hunspell als auch aus unseren Erweiterungen. Gäbe es z. B. eine Stadt namens “Huus”, liegt das nah an “Haus” und wäre ein Argument, es nicht aufzunehmen.

Erster Schritt wäre nach meiner Meinung: Daten entweder direkt suchen (Häufigkeiten von Namen) oder über Korpora (z. B. DWDS).

1 Like

Proper names should indeed not be mentioned as a ‘possible spelling error’, when they are correct. Unfortunately, there is a lot of freedom in creating proper names as fare as accents and spelling are concerned.

I think a tool like LT should be able to suggest the most common forms at least. So adding them by usage frequency is a good idea. There are lists of places in Wikipedia that are easy to add.

About confusion between proper names and nouns: even when not wrong, a message could be given in case of possible confusion.

Da stimme ich zu. Mit genau diesem Argument kicke ich immer wieder einige Benutzervorschläge raus.
Eine Frage dazu, die mich schon länger umtreibt: Gilt hier der Umkehrschluss, d. h. sollten wir Toponyme immer dann aufnehmen, wenn sie nicht nahe an anderen Wörtern sind?
Ein kürzlich vorgeschlagenes Beispiel ist “Käppelestraße”. Ich sträube mich instinktiv gegen eine Aufnahme ins Wörterbuch, aber warum eigentlich? Einen naheliegenden Tippfehler sehe ich hier nicht. “Goethestraße” und “Bismarckplatz” würde ich dagegen bedenkenlos aufnehmen.

Ich würde Käppelestraße nicht aufnehmen, auch weil es ja andere ähnlich geschriebene Straßen geben kann. Auch hier wäre ein Korpus hilfreich, man könnte z. B. die Daten aus OpenStreetMap ziehen.

I could supply word count for German. Even for different top domains.

Der Liste fehlen noch viele Vornamen und Nachnamen, sowie Straßennamen, die es fast überall gibt, aber das Projekt ist bestimmt immer noch Arbeit und man überlegt, welche Namen aller Art noch hinzugefügt wird.

Meine Wörterliste für LibreOffice beinhaltet auch Vornahmen, welche LibreOffice nicht, worunter einfach Vorname, wie Laura oder Klara sind, selbst Vorname ist dort vertreten und mein Vorname ist schon lange nicht mehr selten.

Grüße Dallun511

Wo könnte man Vorschläge einreichen?

Grüße Dallun511

Wenn du eine Liste hast, kannst du sie mir per E-Mail zuschicken: jan.schreiber (at) languagetool.org

Dann wird der waise Schreiber heute noch eine E-Mail von mir kriegen. ODT oder TXT?

Ist egal. Möglichst ein Wort pro Zeile, den Rest mache ich. Danke für dein Engagement!

Sortiert oder unsotiert?

Du kannst mir einen Arbeitsschritt abnehmen, wenn du sie vorher sortierst, aber für mich ist es kein echter Mehraufwand, wenn ich sie sortiere.

dann kriegst du gleich eine sortierte Version. Sind circa über 100 Vornamen^^

E-Mail verschickt und ein kleiner Tipp (At) statt ein @ macht es für Boots einfacher E-Mail zu finden.

Grüße Dallun511