El gentilici de Nova Zelanda és neozelandès.
Entenc que quan es detecta una errada ortogràfica l’algoritme intenta trobar una paraula correcta que se li assembli.
Novazelandès: LT dona com a alternativa “Nova zelandès”.
Nova zelandès: LT diu: error de concordança.
Nova-zelandès: LT no dona error, però no és correcte, hauria de ser “neozelandès”.
Neozelandès: LT no diu res.
No sé si s’hauria de crear una regla per aquest cas concret o no acceptar “nova-zelandès” com a correcta.
Aquesta podria ser la regla, el que no sé és si per les altres paraules errònies, s’ha de fer una regla per cadascuna o posar més tokens.
<rule id="" name="NOVAZELANDÈS-NEOZELANDÈS">
<pattern>
<token> regexp="yes">novazeland(ès|esa|esos|eses)</token>
</pattern>
<message>Gentilici incorrecte de Nova Zelanda.</message>
<suggestion><match no="1" regexp_match="novazeland" regexp_replace="neozeland"/></suggestion>
<example correction=''>Aquest <marker>novazelandès</marker> no parla català.</example>
<example>Aquest neozelandès no parla català.</example>
</rule>