Sackgasse LaTeX?

Seit vielen Jahren schreibe ich die meisten meiner Bücher mit LaTeX. Zwar ist die Layout-Bastelei oft mühsam, ansonsten ist LaTeX für meine Anforderungen aber perfekt geeignet — egal, ob das Buch 100 oder 1000 Seiten umfasst. Erst seit ich versucht habe, aus meinen LaTeX-Quelltexten eBooks in den Formaten ePub oder AZW (Amazon) zu erzeugen, zweifle ich an der Zukunft von LaTeX.

LaTeX liefert als Ergebnis wahlweise PostScript- oder PDF-Dateien, die sowohl für den Buchdruck als auch für die Weitergabe als PDF-Dokument gut geeignet sind. Moderne eBook-Formate basieren aber durchwegs auf HTML.

Nun gibt es durchaus keinen Mangel an LaTeX-zu-HTML-Konvertern. Das Problem ist nur, dass ich keinen einzigen Konverter gefunden habe, der auch nur einigermaßen praxistauglich ist. Reale LaTeX-Projekte zeichnen sich dadurch aus, dass ihre Autoren diverse LaTeX-Erweiterungspakete sowie selbst definierte Makros verwenden. Und genau an diesem Punkt sind alle von mir getesteten Konverter kläglich gescheitert.

Als ich vor zwei Monaten zwei meiner eBooks in das Amazon-Format AZW umgewandelt habe, bin ich einen Umweg über Pandoc gegangen. Pandoc enthält zwar selbst eine Funktion zum LaTeX-Import, diese hat sich aber als ebenso unbrauchbar erwiesen wie alle übrigens LaTeX-zu-HTML-Konverter. Erst mit diversen sed-Scripts und einer Menge Handarbeit ist es mir gelungen, meine LaTeX-Quellen in den Pandoc-Markdown-Syntax umzuwandeln. Pandoc kann dann daraus ein HTML5-Dokument erzeugen, das wiederum weitgehend problemlos von den Kindle-Authoring-Werkzeugen in das AZW-Format übersetzt werden kann.

Kurzum: Der Weg von LaTeX in ein modernes eBook-Format ist steinig und mit soviel manuellem Aufwand verbunden, dass er sich selten lohnt. (Rechenaufgabe: Die Umwandlung eines LaTeX-Manuskripts in ein Kindle-eBook beansprucht bei einer Textmenge von ca. 150 Seiten ca. zwei Tage. Pro verkauftem Exemplar erhalten Sie z.B. 5 EUR. Wieviel Stück müssen Sie verkaufen, damit Sie einen angemessenen Stundenlohn für die eBook-Umwandlung erzielen? In den meisten Fällen weit mehr, als zu erwarten ist …)

An eBooks geht kein Weg mehr vorbei. Als Autor oder Verlag brauchen Sie also ein Werkzeug, das gleichermaßen in der Lage ist, qualitativ hochwertige PDF-Dokumenten für den Druck als auch funktionierende und ansprechend gestaltete HTML-Dokumente für die Weiterverarbeitung in die diversen eBook-Formate zu erzeugen.

Word und OpenOffice/LibreOffice aber auch Apples neuer iBook Author scheitern am ersten Punkt, LaTeX versagt am zweiten. Das schon erwähnte System Pandoc, dem ich demnächst einen eigenen Blog-Beitrag widmen werde, ist auch nur ein Kompromiss: es liefert zwar bei Bedarf sowohl LaTeX- als auch HTML-Output, aber auch in diesem Fall ist eine Menge manuelles Nacharbeiten erforderlich. Professionelle Publishing-Werkzeuge (z.B. Adobe Impress) sind nicht nur teuer, sondern überdies kaum zum Schreiben geeignet, weil sie als Werkzeuge rein zum Setzen/Publizieren konzipiert sind.

Sie sehen schon: Dieser Blog-Beitrag beschreibt die Frage, gibt aber keine Antwort. Lösungsvorschläge werden gerne angenommen (verwenden Sie die Kommentar-Funktion!).

Update Juni 2013

Was die Produktion meiner eigenen eBooks betrifft, bin ich mittlerweile von LaTeX auf Pandoc umgestiegen. Lesen Sie dazu auch meinen Blog-Beitrag Kindle-eBooks mit Pandoc erstellen sowie mein neues eBook Markdown und Pandoc.

Vor kurzem bin ich über den Blog des Verlags openSourcePress gestolpert. Interessanterweise ist man kürzlich auch dort LaTeX bye-bye gesagt. Als neues Schreibformat kommt dort allerdings nicht Markdown, sondern das im Prinzip ganz ähnliche Format AsciiDoc zum Einsatz.

Update November 2014

Mittlerweile bin ich noch einen Schritt weiter: Meine beiden letzten Bücher bei Galileo Press, nämlich Raspberry Pi — Das umfassende Handbuch und Java — Der Grundkurs, haben ich und meine Co-Autoren ebenfalls in der Markdown-Syntax verfasst. Mit Pandoc und diversen sed- und python-Scripts habe ich daraus (fast) vollständig automatisiert LaTeX- und HTML-Quellen für die Druckdateien (PS/PDF) bzw. für die eBooks (EPUB/MOBI) erzeugt. Vielleicht schaffe ich es demnächst, den Prozess ausführlich zu dokumentieren. (Trivial ist es nicht, aber letztlich hat es verblüffend gut funktioniert. Cool auch, dass sich Galileo Press darauf eingelassen hat.)

4 Gedanken zu „Sackgasse LaTeX?“

  1. Hallo, Herr Kofler,

    Sie werden sich sicherlich nicht mehr erinnern, aber Sie waren einst so freundlich mir bei einem Buchprojekt für Addison-Wesley (LaTeX — der typographische Einstieg) aus einem technischen Schlamassel zu helfen … sei es drum: Ja, ich kann Ihre Kritik an LaTeX verstehen, da ich sie partiell teile. Es ist für Sie vermutlich mittlerweile keine Alternative mehr, doch mein Weg in die Zukunft von TeX heißt nun ConTeXt => eine Makrosprache für LuaTeX von Hans Hagen — für mich das LaTeX des 21. Jahrhunderts! Kosequent entwickelt, kann mit ePub ebenso freudig wie mit XML (single-souced), zu Perl und Python gibt es Schnittstellen, Lua und Metafun sind eingebettet und die typographischen Möglichkeiten sind die gewohnten. Ist irgendwie das Rad nochmals zu erfinden, aber einen Test unbedingt wert, sofern das für Sie überhaupt noch ein Thema ist.

    Viele Grüße,
    Tobias Berndt

    1. Hallo Herr Berndt,

      nett von Ihnen zu hören. Ja, die neuen LaTeX-Dialekte sind wirklich interessant, aber ob ich je dazu komme, mir das in Ruhe anzusehen. Da müsste ich schon ein Buch darüber schreiben :-)

      Liebe Grüße,

      Michael Kofler

  2. Ich habe mir wegen des Artikels Markdown angesehen. Es ist eine „nicht sehr mächtige Auszeichnungssprache“ Das bedeutet auf den ersten Blick aber unter Umständen dass man das Nachbearbeitungsproblem in Grün bekommt. Das was man nicht in Markdown erledigen kann, muss in den Zielformaten nachbearbeitet werden.

    1. Das stimmt prinzipiell. Mein privater Workflow, mit dem ich nun etliche Bücher für den Rheinverlag geschrieben und gesetzt habe, sieht so aus: Ich schreibe den Text als Markdown, mache mit Pandoc LaTeX-Dateien und daraus dann die PDF/Druckdateien. Diese Vorgehensweise ermöglicht es mir, wo notwendig in die Markdown-Quellen LaTeX-Code einzubetten. Pandoc ignoriert LaTeX-Anweisungen für die HTML-Fassung, berücksichtigt sie aber für LaTeX.

      Dann bleibt immer noch das Problem, dass Markdown zu wenig Auszeichnungen unterstützt. In meinen Büchern brauche ich z.B. eine Schrift für Menükommandos und noch eine für Tastenkürzel. Dieses Problem habe ich mit eigenen ‚Erweiterungen‘ gelöst, die ich per sed verarbeite.

      Alles in allem nicht trivial, aber es gelingt mir damit, dass ich eine Quelldatei habe, die weitestgehend Markdown entspricht (plus ein bisschen LaTeX mit \linebreak, \newpage etc. plus ein bisschen eigene Syntax, z.B. [strg] für ein ‚Strg‘-Tastensymbol).

Kommentare sind geschlossen.