Regel, die über das erkannte Satzende hinausgeht

Hallo zusammen,

ich habe ein Problem mit lateinischen Kombinationen für einen Medizinwortschatz, die geprüft werden sollen. Da gibt es zum Beispiel die sehr übliche Abkürzung A. für Arteria z.B. in der Kombination A. thoracica interna. Wenn ich jetzt eine Regel bastele, die falsche Varianten korrigieren soll, funktioniert diese innerhalb von Sätzen ganz gut. Steht die Kombination aber am Anfang eines Satzes, z.B. bei “A. thoracica interna konnte problemlos dargestellt werden.”, dann interpretiert LT das A. wohl als Aufzählung und erkennt einen Satzübergang. Dies wäre noch nicht so problematisch, aber ich scheitere im Moment daran, eine Regel zu basteln, die über das Satzende hinausgeht, um die fehlerhafte Stelle auch in diesem Kontext anzuzeigen. Gibt es dafür überhaupt eine Möglichkeit? So scheint es jedenfalls nicht zu funktionieren.

<pattern case_sensitive="yes">
    <token>A</token>
    <token>.</token>
    <token postag="SENT_START"/>
    <token>thoracicus</token>
</pattern>

Viele Grüße

dsma_bell

Das geht tatsächlich nicht. Man kann aber in der segment.srx die Satzgrenzenerkennung an diesen Stellen so verhindern:

<rule break="no">
    <beforebreak>A. </beforebreak>
    <afterbreak>thoracica</afterbreak>
</rule>

Vielen Dank, das hilft mir weiter.

Die Datei scheint in LanguageTool 6.3 noch nicht enthalten zu sein, ich finde sie in meiner lokalen Installation nicht.

Sorry, da war ein Tippfehler, die Datei heißt segment.srx, sie liegt in der ZIP-Datei languagetool-core.jar.

Danke