[de] Texte nachträglich korrigieren

wenn man ein Buch im PDF Format hat, dass man lieber (z.B. in der S-Bahn) als ePub lesen möchte (weil der Reader PDF’s nicht mag) folgt der Versuch des Konvertierens. Leider besteht eine grundsätzliche Diskrepanz zwischen PDF und ePub denn man könnte den PDF Inhalt als “Seitenbeschreibung” und das ePub als Fließtext bezeichnen. Resultat jeder Konvertierung ist unter Rechtschreib-Gesichtspunkten eine Katastrophe, denn egal welchen Weg man geht hat das ePub zumindest unsinnige Silbentrennungen. Von Hand lassen sich diese z.B. in Sigil mit RegEx so

([a-z])-(\s){0,1}([a-z])
replace with
\1\3

finden und korrigieren. Nachteil = Der Inhalt eines ePub’s sind viele html Dateien und in den html Anweisungen gibt es massenhaft sinnvolle Kommandos die einen - enthalten der mit der RegEx Methode ebenfalls angesprungen wird = grrrrrrrrrrrrrrrrrr.

Man kann (neben sicher vielen weiteren Wegen) 2 Wege bei der Konvertierung gehen

  1. aus Acrobat heraus eine Word Datei exportieren
  2. alle Seiten des PDF als hoch auflösende Grafik exportieren und diese dann von Abbyy Finereader lesen lassen.

= lässt sich eine nachträgliche automatische Korrektur mittels dem LanguageTool und LibreOffice realisieren?