Hello @tiff @jaumeortola
I am trying to fix false positives in the rule:
<rule id="UPPERCASE_AFTER_COMMA" name="Maiúsculas depois de uma vírgula">
I added:
<!-- MARCOAGPINTO 2020-06-08 *START* -->
<!-- "Falemos da: Universidade de Lisboa." -->
<!-- "Falemos da: Universidade Federal do Rio de Janeiro." -->
<!-- "Falemos da: República Dominicana." -->
<antipattern>
<token regexp='yes'>universidade|república</token>
<token min="0" max="1" regexp="yes">federal|estadual</token>
<token min="0" max="1" regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>
<!-- MARCOAGPINTO 2020-06-08 *END* -->
However, the stand-alone tool still complains about:
Falemos da: República Lisboa.
Falemos da: República Dominicana.
What is wrong with my antipattern?
Thanks!
I have found a workaround:
<!-- MARCOAGPINTO 2020-06-08 *START* -->
<!-- "Falemos da: Universidade de Lisboa." -->
<!-- "Falemos da: Universidade Federal do Rio de Janeiro." -->
<!-- "Falemos da: República Dominicana." -->
<antipattern>
<token regexp='no'>universidade</token>
<token min="0" max="1" regexp="yes">federal|estadual|estatal</token>
<token min="0" max="1" regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>
<antipattern>
<token regexp='no'>república</token>
<token min="0" max="1" regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>
<!-- MARCOAGPINTO 2020-06-08 *END* -->
I had the same kind of problems using multiple min=0 in one antipattern. Try to do the same with a bit more patterns, using no or just one min=0, that might help.
<antipattern>
<token regexp='no'>universidade</token>
<token regexp="yes">federal|estadual|estatal</token>
<token min="0" max="1" regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>
<antipattern>
<token regexp='no'>universidade</token>
<token min="0" max="1" regexp="yes">federal|estadual|estatal</token>
<token regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>
<antipattern>
<token regexp='no'>universidade</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>