[de] Auseinandergeschriebene Begriffe

Ist es möglich, Begriffe, die auseinandergeschrieben werden, dem Lexikon hinzuzufügen? Konkret geht es um “Hard Disk”. “Hard” möchte ich eigentlich nicht als einzelnes Wort in die spelling.txt schreiben, weil es im Deutschen ja außerhalb des Kontext nicht existiert.

Seit einiger Zeit kann man in die spelling.txt auch Mehrwortbegriffe eintragen, z. B. World Wide Web/S.

1 Like

Wie Daniel schon geschrieben hat können in spelling.txt auch Begriffe aus mehreren Wörtern eingegeben werden. Im Hintergrund wird für diesen Begriff eine DisambiguationPatternRule erzeugt, so als hätte man in disambiguation.xml einen Eintrag gemacht.

Danke für den Hinweis, mir war nämlich nicht klar, wie das technisch umgesetzt ist.

@Discostu Im Moment wird das Problem mit zwei Dateien gelöst: disambiguation.xml und spelling.txt. In einigen wenigen Fällen ist der Weg über disambiguation.xml sogar einfacher, weil man dort mit regulären Ausdrücken arbeiten kann. Zum Beispiel (Z. 664):

<rule name="en vogue" id="EN_VOGUE">
    <pattern>
        <token>en</token>
        <token regexp="yes">vogue|gros|masse|passant|détail</token>
    </pattern>
    <disambig action="ignore_spelling"/>
</rule>
1 Like