Back to LanguageTool Homepage - Privacy - Imprint

[ar] Suggestion match with regexp_match not working when using tashkeel

@sohaibafifi
Example :

<rule id="word_use_0005_muta2akid" name="متأكد">
        <pattern>
          <token inflected="yes">متأكد</token>
        </pattern>
        <message>يفضل أن يقال:
        <suggestion><match no="1" regexp_match="متأكد" regexp_replace="متحقِّق"/></suggestion>
        <suggestion><match no="1" regexp_match="متأكد" regexp_replace="متيقِّن"/></suggestion>
متيقن أو متحقق بدلا من متأكد</message>
        <example correction="متحقِّق|متيقِّن" type="incorrect"> هل أنت <marker>متأكد</marker>؟</example>
        <!--  Wrong: هل أنتَ متأكِّد؟ -->
        <!--Correct: هل أنتَ متيقِّن؟ / هل أنتَ متحقق؟ -->
</rule>

with the sentence :

هل أنتَ مُتأكِّد أنّنا نسير في الاتّجاه الصّحيح؟

output:

1 .) Line 1, column 9, Rule ID: word_use_0005_muta2akid[4]
Message: يفضل أن يقال:
‘مُتأكِّد’
‘مُتأكِّد’
متيقن أو متحقق بدلا من متأكد
Suggestion: مُتأكِّد
Rule source: /org/languagetool/rules/ar/grammar.xml
هل أنتَ مُتأكِّد أنّنا نسير في الاتّجاه الصّحيح؟
^^^^^^^^

The problem: regexp_match is not matching if the word contains tashkeel.

We need help to remove diacritics before matching in suggestion match.
@sohaibafifi

Closed