Back to LanguageTool Homepage - Privacy - Imprint

[DE] DE_AGREEMENT und zusammengesetzte Nomen

Hallo zusammen,

wie bringe ich LanguageTool am besten bei, den Begriff “Content Management System” in dieser Schreibweise in einem deutschen Text nicht als Fehler zu erkennen (Regel: DE_AGREEMENT, “Wenn es sich um ein zusammengesetztes Nomen handelt, wird es zusammengeschrieben.”)?

Ein Setting direkt gibt es glaube ich nicht, man müsste dazu lokal das hier aus der Datei ./org/languagetool/resource/de/compounds.txt auskommentieren oder löschen:

Content-Management*
Content-Management-System*
Content-Management-Systems*
Content-Management-Systeme*

Interessanterweise reicht es nicht aus, alle Einträge bezüglich “Content-Management” und “Content-Management-System” aus ./org/languagetool/resource/de/compounds.txt und ./org/languagetool/resource/de/hunspell/de_DIC.txt auszukommentieren oder zu löschen und entsprechende Einträge mit der getrennten Schreibweise “Content Management System” in ./org/languagetool/resource/de/added.txt und ./org/languagetool/resource/de/hunspell/spelling.txt hinzuzufügen, um die DE_AGREEMENT-Fehlermeldung loszuwerden.

“Content Management” gefällt LanguageTool aus mir nicht bekannten Gründen dann immer noch nicht.
Bei anderen Begriffen wie “Batch Processing” hat es hingegen funktioniert.

Ich habe es immer noch nicht geschafft, dass der Begriff Content Management in einem Satz wie Das Content Management System ist toll. in dieser getrennten Schreibweise keine DE_AGREEMENT-Fehlermeldung erzeugt.

Das Problem scheint jetzt der falsche Artikel Das für Content (Maskulinum) zu sein, wobei ich Content Management und auch Content Management System in der Datei added.txt als Neutrum definiert habe. Aber das scheint nicht die korrekte Lösung zu sein.

Lösungsvorschläge sind willkommen. =)

Ich habe das Problem bezüglich der Getrenntschreibung der Begriffe Content Management und Content Management System mit den folgenden beiden Disambiguation-Regeln gelöst:

<rule name="Content Management" id="CONTENT_MANAGEMENT">
    <!-- Getrennte Schreibweise des Begriffs "Content Management" -->
    <pattern case_sensitive="yes">
        <token postag="ART:.*" postag_regexp="yes"/>
        <marker>
            <token>Content</token>
            <token>Management</token>
        </marker>
    </pattern>
    <disambig postag="SUB:NOM:SIN:NEU,SUB:DAT:SIN:NEU,SUB:AKK:SIN:NEU"/>
</rule>

<rule name="Content Management System" id="CONTENT_MANAGEMENT_SYSTEM">
    <!-- Getrennte Schreibweise des Begriffs "Content Management System" -->
    <pattern case_sensitive="yes">
        <token postag="ART:.*" postag_regexp="yes"/>
        <marker>
            <token>Content</token>
            <token>Management</token>
            <token>System</token>
        </marker>
    </pattern>
    <disambig postag="SUB:NOM:SIN:NEU,SUB:DAT:SIN:NEU,SUB:AKK:SIN:NEU"/>
</rule>

Sorgt diese Lösung gegebenenfalls für unerwünschte Seiteneffekte?