Back to LanguageTool Homepage - Privacy - Imprint

[pt] Issue with antipattern - 2020-06-08

Hello @tiff @jaumeortola

I am trying to fix false positives in the rule:

<rule id="UPPERCASE_AFTER_COMMA" name="Maiúsculas depois de uma vírgula">

I added:

<!-- MARCOAGPINTO 2020-06-08 *START* -->
<!-- "Falemos da: Universidade de Lisboa." -->
<!-- "Falemos da: Universidade Federal do Rio de Janeiro." -->
<!-- "Falemos da: República Dominicana." -->
      <antipattern>
		  <token regexp='yes'>universidade|república</token>	  
		  <token min="0" max="1" regexp="yes">federal|estadual</token>
		  <token min="0" max="1" regexp='yes'>das?|de|dos?</token>
		  <token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
      </antipattern>
<!-- MARCOAGPINTO 2020-06-08 *END* -->

However, the stand-alone tool still complains about:

Falemos da: República Lisboa.
Falemos da: República Dominicana.

What is wrong with my antipattern?

Thanks!

I have found a workaround:

<!-- MARCOAGPINTO 2020-06-08 *START* -->
<!-- "Falemos da: Universidade de Lisboa." -->
<!-- "Falemos da: Universidade Federal do Rio de Janeiro." -->
<!-- "Falemos da: República Dominicana." -->
      <antipattern>
		  <token regexp='no'>universidade</token>	  
		  <token min="0" max="1" regexp="yes">federal|estadual|estatal</token>
		  <token min="0" max="1" regexp='yes'>das?|de|dos?</token>
		  <token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
      </antipattern>
      <antipattern>
		  <token regexp='no'>república</token>	  
		  <token min="0" max="1" regexp='yes'>das?|de|dos?</token>
		  <token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
      </antipattern>	  
<!-- MARCOAGPINTO 2020-06-08 *END* -->

I had the same kind of problems using multiple min=0 in one antipattern. Try to do the same with a bit more patterns, using no or just one min=0, that might help.

<antipattern>
<token regexp='no'>universidade</token>	  
<token regexp="yes">federal|estadual|estatal</token>
<token min="0" max="1" regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>

<antipattern>
<token regexp='no'>universidade</token>	  
<token min="0" max="1" regexp="yes">federal|estadual|estatal</token>
<token regexp='yes'>das?|de|dos?</token>
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>

<antipattern>
<token regexp='no'>universidade</token>	  
<token postag="NP[CFM][SP]000|NP[CFM][SP]G00" postag_regexp='yes'/>
</antipattern>