[DE] Leichte Sprache: Tests zur Textprüfung

Knorr · February 1, 2019, 7:43pm

Ich habe den Workaround von damals wieder eingebaut.

@Fred.Kruse : Kannst du dir’s bitte nochmal ansehen?

sabiman · February 4, 2019, 10:45am

Hier ist schon mal ein Zwischentest zur Markierung langer Sätze mit Klammern:

(1)
Die ‘konstruierten’ Beispiele oben werden jetzt korrekt beim 13. Wort markiert. Dabei werden die eingeklammerten Wörter nicht mitgezählt.

(2)
Einige ‘echte’ Beispiele aus den getesteten Texten werden noch nicht richtig markiert:

Wir finden es unter Mischwort, Koppelwort, Kofferwort, Wortkreuzung (oder Kreuzungswort), Kombiwort, Wortverschmelzung (oder Verschmelzungswort), Wortverschränkung, Schachtelwort, Tandemwort u.v.a.m. (< 9. und 13. Wort markiert)
So fahren wir mit dem Moped (Motor + Pedale) in ein Motel (Motor + Hotel) und machen dort Kurlaub (Kur + Urlaub). (< 7. und 13. Wort markiert)
Viele ärgern sich über eine Demokratur (Demokratie + Diktatur), die Glokalisierung (Globalisierung + Lokalisierung), den Teuro (teuer + Euro), vor allem aber über das über sie in den Medien verbreitete Kompromat (kompromittierendes Material, aus dem Jargon des sowjetischen Geheimdienstes stammend). (< 7., 9. und 13. Wort markiert)

Dabei ist allerdings zu berücksichtigen, dass diese Sätze ungewöhnlich viele Klammern enthalten (was nicht nur das LT-System, sondern auch den Leser verwirrt!).

Fred.Kruse · February 5, 2019, 3:02pm

Die Regel zu langen Sätzen habe ich weitgehend überarbeitet. Der Markierungsfehler sollte nicht mehr auftreten (Den Workaround habe ich wieder herausgenommen).
Die Frage, wie Klammerausdrücke oder auch wie ein Doppelpunkt, Semikolon und direkte Rede gehandhabt werden, können wir noch diskutieren.
Zurzeit ist es so gelöst, dass der Inhalt zwischen Klammerausdrücken wie ein eigenständiger Satz behandelt wird. Ab einem Doppelpunkt, Semikolon etc. beginnt die Zählung von vorn.
Ursprünglich hatte ich bei der Entwicklung der Regel weniger einfache Sprache im Blick. Es ging mir eher um den allgemeinen Ratschlag an Autoren, keine zu langen Sätze zu schreiben, und damit leichter zu lesende und oft auch spannendere Texte zu erstellen. In diesem Zusammenhang kamen mir die oben genannten Regeln sinnvoll vor.
Aber ich kann es auch ändern, wenn es gute Argumente dafür gibt.

sabiman · February 6, 2019, 2:28pm

Vielen Dank @Fred.Kruse!

Die oben zitierten langen Sätze mit Klammerausdrücken werden jetzt einheitlich markiert: jeweils einmal auf dem 13. Wort, ohne den Klammerausdruck einzubeziehen.

Zu deiner FRAGE, wie Klammerausdrücke oder auch wie ein Doppelpunkt, Semikolon und direkte Rede gehandhabt werden:

Ich denke, dass bei langen Sätzen alle Wörter mitgezählt werden sollten: einschließlich Klammerausdrücken, direkter Rede und Satzteilen nach Semikolon oder Doppelpunkt).

Denn die Regel in Leichter Sprache, lange Sätze zu vermeiden, gilt ganz allgemein.

Der Leser muss ja den ganzen Satz von vorn bis hinten als Sinneinheit erfassen und dafür sein Arbeitsgedächtnis strapazieren. Und das fällt Leuten, die nur mühsam lesen, besonders schwer.

Zudem sind Klammern und Semikolons für ungeübte Leser eher hinderlich und sollen daher in Leichter Sprache vermieden werden.

Was meint ihr zu diesen Überlegungen?

Fred.Kruse · February 7, 2019, 7:02pm

Bei den Klammerausdrücken stimme ich vollkommen mit dir überein. Ursprünglich hatte ich die Behandlung als separaten Satz für eine gute Idee gehalten, jetzt denke ich auch das Klammern eher einen Satz verkomplizieren und die Worte mitgezählt werden sollten. Ähnlich sehe ich das Anführungszeichen, unabhängig davon ob sie ein Zitat, eine Auszeichnung oder direkte Rede einschließen.
Wenn hier allgemeine Zustimmung herrscht, nehme ich das aus der Regel wieder heraus.
Etwas anders sehe ich das bei einem Doppelpunkt oder einem Semikolon. Von meinem Gefühl her würde ich die eher wie einen Punkt behandeln. Ich lasse mich aber gerne vom Gegenteil überzeugen.
Diese Regeln sollten dann aber für die gesamte Funktion gelten, unabhängig davon, ob sie für leichte Sprache oder für Standard-Deutsch verwendet wird (mit Ausnahme der Satzlänge natürlich).

Die Frage des grundsätzlichen Verwendens von Klammern und Semikolon ist aus meiner Sicht davon getrennt zu sehen. Es ist vielleicht eine gute Idee eine Funktion, die die Verwendung markiert, ausschließlich für leichte Sprache zu schreiben.

sabiman · February 8, 2019, 2:47pm

Hallo @Fred.Kruse, das sind interessante Überlegungen!

Gern stimme ich deinem Vorschlag zu, die Wörter in Klammern und in Anführungszeichen (Zitat, Auszeichnung oder direkte Rede) mitzuzählen.

Auch finde ich es sinnvoll, dass Regeln zu Doppelpunkt und Semikolon für LT insgesamt gelten sollten.

Wie man diese beiden Zeichen behandeln könnte, hängt wohl von ihrer Funktion in einem Satz ab, zum Beispiel:

Doppelpunkt oder Semikolon können wie ein Punkt zwischen vollständigen Sätzen stehen.
Ein Doppelpunkt kann aber auch vor Aufzählungen stehen, und ein Semikolon kann innerhalb von Aufzählungen stehen. Geschieht das in Fließtexten, dann könnten diese Zeichen auch wie ein Komma funktionieren.

Ob LT solche feinen Unterschiede berücksichtigen kann, sei dahingestellt. Einfacher wäre es gewiss, die häufigste Anwendung zur Regel zu machen. Aus dieser Sicht würde ich dir zustimmen, Doppelpunkt und Semikolon wie einen Punkt zu behandeln!

Fred.Kruse · February 10, 2019, 1:41pm

Das habe ich heute angepasst, kann ab morgen getestet werden.

Im Übrigen ist es jetzt (der Snapshot ab morgen) auch möglich in der Libre Office Erweiterung “Deutsch (Leichte Sprache)” einzustellen und damit auch bei der Texterfassung den Text schon auf die Regeln hin zu überprüfen.

sabiman · February 10, 2019, 1:49pm

Gerade hatte ich meine letzte Antwort noch mal überarbeitet (s.o.). Ich teile deine Ansicht, Doppelpunkt und Semikolon wie einen Punkt zu behandeln. Nun bin ich also gespannt auf den morgigen Test!

sabiman · February 11, 2019, 10:34am

Vielen Dank @Fred.Kruse, für die angepasste Regel!

In meinem heutigen Schnelltest wurde das 13. Wort in langen Sätzen wie vereinbart markiert:

die Wörter in Klammern und Anführungszeichen wurden mitgezählt,
nach Doppelpunkt oder Semikolon wurden die Wörter neu gezählt.

sabiman · February 16, 2019, 2:28pm

Hallo @Knorr,

beim Test von Texten werden viele abstrakte und vor allem schwierige Wörter noch nicht erkannt. Dazu wäre es sinnvoll, die Liste der typischen Vor- und Nachsilben zu erweitern (solange wir keine kompletten Wörterlisten nutzen können).

Für die abstrakten Wörter haben wir bisher die Nachsilben -heit, -keit, -ung.

Zusätzlich konnte ich folgende Nachsilben ermitteln: -nis, -sal, -schaft, -tum, -wesen.

Beispiele: Ärgernis, Trübsal, Meisterschaft, Reichtum, Gemeinwesen.

Für schwierige Wörter (d.h. Fremdwörter) habe ich auch schon zusätzliche Vor- und Nachsilben gesammelt. Wie soll ich sie am besten auflisten? So wie die bisherigen Silben in der Regel (…|ambi.+|anti.+|asy.+|…)?

Die endgültige Auswahl überlasse ich natürlich euch!

Knorr · February 17, 2019, 7:14am

Diese Nachsilben habe ich in die Regel aufgenommen.

Das wäre mir am liebsten.

sabiman · February 17, 2019, 6:36pm

Vielen Dank @Knorr für dein Feedback!

Und hier kommen die Vor- und Nachsilben für schwierige Wörter (Fremdwörter).

Ein paar Anmerkungen dazu:

Die Sammlung ist alphabetisch. Alle bereits in der Regel enthaltenen Silben habe ich probehalber eingereiht und mit * gekennzeichnet. Eine solche Gesamtliste wäre übersichtlicher, auch für nachfolgende Ergänzungen oder Korrekturen.
Nicht übernommen habe ich ‘diffizil’ (stattdessen haben wir diff+) und ‘ge(nehmigen|statten)’, weil diese Wörter hier nicht reinpassen.
Einige Silben, die auch in alltäglichen Wörtern enthalten sind (wie ‘auto+’ und ‘post+’), habe ich mit Fragezeichen versehen. Sollten sie besser wegfallen?

Wie gesagt: bitte entscheidet was sinnvoll ist!

Knorr · February 17, 2019, 7:13pm

Jetzt bin ich doch ein wenig verwirrt, da ich nicht weiß, was du mit *abnor+ oder [i]ist meinst.
Vielleicht ist es doch einfacher, du schickst mir einfach eine Liste mit den hinzugekommen Vor- und Nachsilben. Einfach mit Komma getrennt; z. B. itis,phobien,…

sabiman · February 18, 2019, 12:28pm

Hallo @Knorr, danke für deine Rückfrage!

Ich hatte zwar eben eine Liste ‘B’ versucht, aber ich wollte sie noch mal verbessern.

Hier ist die neueste Fassung!

Die bisherigen Silben aus der Regel sind enthalten (eben noch mal auf aktuellem Stand abgeglichen). Auch ‘abnor+’ ist von dort übernommen.
In der gesamten Liste habe ich alle Extrazeichen und Varianten weggelassen.

Ich hoffe, jetzt ist alles in korrekter Schreibweise!

Knorr · February 18, 2019, 6:28pm

Danke! Habe die Silben übernommen:

sabiman · February 19, 2019, 7:00pm

Vielen Dank @Knorr für dein schnelles Update der abstrakten und schwierigen Wörter!

Ich habe alle Silben-Vorschläge mit je einem Beispiel getestet: Alles wird wunschgemäß markiert.
Nur ein paar kleine Verbesserungen würde ich vorschlagen:

die Vorsilbe ‘phio-’ sollte bestimmt ‘philo-’ heißen (hatte ich übersehen!);
die vorgeschlagene Vorsilbe ‘poli-’ würde ich drin lassen (z.B. für Poliklinik);
auf das noch verbliebene Wort ‘gestatten’ sollten wir verzichten. Dafür brauchten wir eine Extraliste von “verstaubten” Wörtern!

Und noch eine Frage:
Wäre es möglich, bei Substantiven mit gelisteten Nachsilben auch Pluralformen zu erkennen?
Also z.B. ‘Masseure, Faschisten, Statistiken, Bastionen’?

Soweit ich sehe, klappen solche Ableitungen bereits bei den Adjektiven und Verben mit gelisteten Nachsilben (z.B. ‘zentrierte, impulsiver’) - prima!

Knorr · February 19, 2019, 7:29pm

korrigiert

Dann wird aber auch “Polizei” als schwieriges Wort gemeldet. Ich habe das jetzt so geändert, dass Polizei trotzdem erlaubt bleibt

Sollten wir erst bei Bedarf ändern, da die Regel momentan einen Testfall hat, der darauf basiert.

sabiman · February 24, 2019, 3:53pm

Vielen Dank @Knorr für dein Feedback zu den letzten Fragen.

Wie ich sehe, werden inzwischen bei Fremdwörtern mit bestimmten Nachsilben auch die Pluralformen angezeigt, z.B. Masseure, Faschisten, Statistiken, Bastionen - prima!

Nun werde ich die ‘schwierigen Wörter’ bei weiteren Tests beobachten…

sabiman · March 9, 2019, 1:59pm

Hallo @Knorr,

hier kommen weitere Test-Ergebnisse zu den Vor-/Nachsilben bei Fremdwörtern:

Die Vorsilben auto- und post-: Als Fehler werden auch Zusammensetzungen mit den bekannten Wörtern Auto und Post gemeldet, z.B. Autowerkstatt und Postwertzeichen. Wie im Duden zu sehen, sind diese Zusammensetzungen mindestens so zahlreich wie die Fremdwörter mit den Vorsilben auto- und post-. Es wäre deshalb besser, denke ich, diese beiden Vorsilben in unserer Liste zu löschen.
Die Nachsilbe -ist: Hier werden deutsche Wörter gemeldet, bei denen -ist zum Wortstamm gehört, z.B. List, Listen, Mist; meist, Meister, Geist, Geister, Kleister. Diese Silbe müssen wir wohl auch löschen. Oder hast du noch eine rettende Idee?

Eine häufige Nachsilbe, die wir noch ergänzen sollten, ist -ität, z.B. Elektrizität, Nationalität. Hier gibt es hoffentlich keine unerwünschten Fehlermeldungen

Knorr · March 9, 2019, 2:09pm

Da ich keine bessere Idee habe, habe ich die vorgeschlagenen Änderungen übernommen