[de] Mehr Tags für Verben?

Ein Benutzer hat mich kürzlich (per Mail) auf die Idee gebracht, für Verben noch folgende Tags hinzuzufügen:

  • Valenz
  • (in)transitiv
  • (ir)reflexiv

Ist das mit vertretbarem Aufwand machbar? Das Thema Valenz halte ich für spannend und fruchtbar, weil man mit dieser Information unvollständige Sätze finden kann.

Was Valenz angeht: Es gibt oft sehr viele Lesarten, das sieht mal bei einer Suche hier: https://grammis.ids-mannheim.de/verbvalenz (E-VALBU). Da müsste man also erstmal klären, woher die Daten kommen und dann ob man sie wirklich als Tags im System haben möchte, inklusive der damit einhergehenden Komplexität, oder ob man sie anders abbilden kann. Aber wenn sich jemand damit beschäftigen möchte, wäre das toll.

Hi @Jan_Schreiber,

Das Valenzthema ist auf jeden Fall hochinteressant! Am besten wäre, wenn irgendwo ein Valenzwörterbuch frei verfügbar wäre. Es sollte zudem unserer Logik folgen, insbesondere was die von Daniel erwähnten Lesarten angeht (“lesen” und “singen” sollten z.B. als mono- und bivalent gelistet sein). Noch besser wäre, wenn die Argumente explizit genannt wären, z. B.: “singen” braucht ein Subjekt, kann ein Akkusativobjekt haben, erlaubt ein Dativobjekt sowie Adverbialia aller Couleur.

Mit so einer Ressource unvollständige Sätze zu finden, ist denkbar, wenn die Liste so geartet ist. Allerdings kann das fehlende Argument außerhalb des Satzes zu finden sein. Isoliert ist der Satz unvollständig, im Kontext ist er korrekt:

- Hast du den Hund gefüttert?
-Habe ich.

Wenn in einem Satz jedwedes Prädikat fehlt, ist entweder (a) die Verbform falsch geschrieben (b) die Verbform vergessen oder ( c ) das Prädikat einer vorausgehenden Äußerung impliziert. Entsprechend schwer sind solche Sätze zu korrigieren, bzw. false positives zu vermeiden:

- Wie viele Fische hast du gefangen?
- Gestern keine, heute immerhin zwei.

Ich würde beim anderen Extrem ansetzen: Sind zu viele Argumente da?

- Ich habe Kinder Lieder gesungen.

Per Valenz kann hier die falsche Getrenntschreibung gefunden werden.

Wir könnten aus so einer Ressource auf jeden Fall viel machen. Hast du eine Idee, wo so etwas zur Verfügung stehen könnte?

1 Like

Ich freue mich sehr, dass die Idee mit der Valenz grundsätzlich auf Gegenliebe stößt. Die Idee, die ich hatte, war, dass ein Satz wie

Hans gibt Inge

mit sehr hoher Wahrscheinlichkeit nicht so intendiert war, sondern aus Unaufmerksamkeit unvollständig geblieben ist. Solche Patzer sind mir selbst schon ab und zu passiert.

Zu der Frage, wo wir die Daten herbekommen, habe ich noch gar nicht recherchiert. Ich halte es aber für sehr wahrscheinlich, dass z. B. Universitäten gerne bereit sind, uns ihre Daten für die nichtkommerzielle Nutzung zur Verfügung zu stellen.

Wenn wir irgendwo eine gute Datenbasis herbekommen und einen Prototypen zustande bringen, kann man den ja (wie gehabt) gegen ein Korpus laufen lassen und mal schauen, was die Idee taugt. Intuitiv rechne ich mit einer sehr großen Zahl von false positives im ersten Anlauf, aber das Problem lässt sich ja lösen. Wäre nicht das erste Mal. Wenn bloß ein Viertel der Regeln den Test überlebt, wäre das wahrscheinlich immer noch ein Gewinn.

Ich stelle hier völlig unausgegorenes Zeug in den Raum, aber manchmal ist so etwas ja der Anfang von einem fruchtbaren Projekt.

Ich musste mich erstmal informieren, was überhaupt eine Valenz ist. Wieder ein Thema, welches in der Schule nie vorkam, dabei ist das Thema interessant. Vorest würde mich nur interessieren, ob es dadurch auch zu Fehlalarmen kommen kann, weil wir auch Wörter in den Listen haben, die wahrscheinlich in der neuen Listen nicht vorhanden sind. Müssen dieses dann angepast werden und wenn ja? Wie?

Ich kann mir nämlich gerade nicht vorstellen, wie die Tags aussehen könnten, wenn z. B. ich neue Verben hinzufüge oder alte ergänzen muss. Wie sieht es mit Verben aus, die auch Adjektive sein können? Z. B. Ich bin zu gelassen. Ich bin zugelassen. Bei diesem Beispiel gibt es einen Fehlalarm. Es gibt das Verb zulassen und das Adjektiv gelassen. Könnte dieser Art von Fehlalarm häufiger vorkommen oder vielleicht sogar vermieden werden?

Egal für welchen Schritt ihr euch entscheiden werdet, ich werde mich anpassen und hoffentlich weiterhin eine Hilfe sein.

2 Likes

Ganz vage angedacht: Ich stelle mir vor, dass Verben zusätzliche Tags wie VAL1, VAL2 oder so ähnlich haben könnten. Deren Fehlen oder Vorhandensein darf die Arbeit mit den jetzt bereits vorhandenen Tags selbstverständlich nicht stören; mit dieser Gefahr rechne ich aber auch nicht. Der Übergang müsste problemlos sein. Man hätte nur zusätzliche Informationen, die man bei Bedarf benutzen kann, aber nicht muss.

Wie zurzeit der aktuelle Stand dieser Idee aus? Kommt die Testversion in den nächsten Tagen oder Wochen, denn ich würde sie sehr gern testen, bevor Band 1 fertig ist und vermutlich weniger Zeit LT weiter zu testen.

Das wird noch monatelang dauern, wenn überhaupt etwas daraus wird.