Novazelandès no és nova-zelandès ni nova zelandès

pep.bofarull · October 25, 2022, 9:49pm

El gentilici de Nova Zelanda és neozelandès.

Entenc que quan es detecta una errada ortogràfica l’algoritme intenta trobar una paraula correcta que se li assembli.

Novazelandès: LT dona com a alternativa “Nova zelandès”.
Nova zelandès: LT diu: error de concordança.
Nova-zelandès: LT no dona error, però no és correcte, hauria de ser “neozelandès”.
Neozelandès: LT no diu res.
No sé si s’hauria de crear una regla per aquest cas concret o no acceptar “nova-zelandès” com a correcta.

Aquesta podria ser la regla, el que no sé és si per les altres paraules errònies, s’ha de fer una regla per cadascuna o posar més tokens.

<rule id="" name="NOVAZELANDÈS-NEOZELANDÈS">
 <pattern>
<token> regexp="yes">novazeland(ès|esa|esos|eses)</token>
</pattern>
 <message>Gentilici incorrecte de Nova Zelanda.</message>
<suggestion><match no="1" regexp_match="novazeland" regexp_replace="neozeland"/></suggestion>
 <example correction=''>Aquest <marker>novazelandès</marker> no parla català.</example>
 <example>Aquest neozelandès no parla català.</example>
</rule>

jaumeortola · October 25, 2022, 11:20pm

Gràcies. Aquesta regla està molt bé. Després en caldria una altra amb aquest patró (funcionarà amb guionet i sense). Amb això ja ho tindríem complet. (També hi posarem l’accentuació valenciana -és.)

 <pattern>
<token>nova</token>
<token min="0">-</token>
<token> regexp="yes">zeland(ès|és|esa|esos|eses)</token>
</pattern>

jaumeortola · October 26, 2022, 7:58am

Ja he afegit la regla: [ca] new rule NEOZELANDES, thanks to Pep Bofarull · languagetool-org/languagetool@91ade2e · GitHub
Moltes gràcies.