Automatisiert von HTML zu PDF

Dieser Artikel ist in der Print-Ausgabe des österreichischen 4C-Magazins erschienen

pdfChip

Callas hat etwas entwickelt, das man sich als Betreiber eines Medienhauses genauer anschauen sollte: ein Tool namens pdfChip. Den tieferen Sinn dieser Namensgebung muss man nicht unbedingt ergründen. Was das Tool macht, ist für alle Unternehmen interessant, die Content für eine Website aufbereiten – und den identischen Content möglichst auch auf Papier drucken möchten.

Bei pdfChip handelt es sich nicht um eine Desktop-Anwendung mit einer Bedienoberfläche. Es ist eine Kommandozeilen-Lösung, die von anderen Systemen aus angesprochen werden kann. Das können beispielsweise Workflow-, CRM-, Content-Management-Systeme – oder eine Kombinationen davon – sein.

Ein HTML-PDF-Konvertierer?

Im Umfeld von Online-basierten Systemen zur Informationsaufbereitung gibt es seit langem eine Lösung, die immer dann eingesetzt wird, wenn ein Kunde sagt, dass er PDFs aus dem System ziehen möchte: die pdfLib. Das funktioniert auch leidlich – sofern wenn man gewillt ist, einen Programmierer lange genug unter Zuhilfenahme diverser Folterinstrumente zu bearbeiten. Dann, aber auch nur dann, bekommt man PDFs, von denen man zur Not drucken kann. Zur Sicherheit lässt man besser vorher noch ein Rettungstool wie PitStop oder Asura die Daten zurechthämmern; dann wird es schon gehen. Das unangenehmste Problem dabei ist, dass man stets auf Wohl und Wehe in den Händen dieses Programmierers ist, der die pdfLib mit Informationen füttern soll, deren tieferer Nutzen ihm vollkommen unverständlich und irrational ist – was zu äußerst unangenehmen und langwierigen Qualitätssicherungsprozessen führt. Zudem soll der Programmierer ein Wissen aufbauen, von dem er vermutet, dass er es nie wieder anderswo einsetzen kann. Dementsprechend sperrig läuft die Zusammenarbeit.

An dieser Stelle kann pdfChip eine interessante Alternative darstellen. Denn das Tool wird mit – gut Programmierer-verdaulichen – HTML-Dateien gefüttert. Diese Dateien könnten also von Personen/Mediengestaltern aufbereitet, kontrolliert und optimiert werden, die ein tiefes Interesse an Print haben und wissen, worauf es bei einer vierfarbigen, mit PDF-Boxen versehenen Datei ankommt.

Der Programmierer nimmt diese Templates, oder einen Ablageort dafür, und injiziert an definierten Stellen seinen Code, der das Template – ähnlich eines konventionellen Content Management Systems – mit dem dynamischen Inhalt anreichert. Und, voilà, aus einer Datenbank kommen Informationen nicht nur beim Frontend einer Website an – sondern auch am RIP einer Rollen-Indigo, die davon ein paar tausend personalisierte Exposés mit Objektfotos und Charts eines Immobilienunternehmens rausfeuern soll. Oder ein Endkunde hat einen Print eines eBooks bestellt; sieht aber leider schlecht. Die Typo möge bitte 16 Punkt groß sein – pdfChip kümmert sich um die Erzeugung eines paginierten PDFs vom Datenbestand, das für die anderen Bestellungen des Tages mit den regulären 12 Punkt ausgegeben wird.

Dabei ist man nicht alleine auf die Möglichkeiten von HTML eingeschränkt, sondern nutzt ergänzend die Möglichkeiten von Cascading Stylesheets (CSS), Scalable Vector Graphics (SVG) und JavaScript, um individualisierte, Corporate-Design-konforme, dynamisch erzeugte PDFs ans RIP der Maschine zu bringen.

Wer braucht das?

Der Vorteil, den ein Medienhaus mit pdfChip gegenüber dem bisher „konventionellen“ Weg über den Programmierer, dessen Fähigkeiten und die der pdfLib hinaus gewinnt, ist, dass wieder detailliert über das Design eines Druckproduktes mit dem Kunden gesprochen werden kann. Und dass man nicht alle zwei Halbsätze sagen muss; „ja, das können wir mal versuchen. Aber versprechen können wir nicht, dass es so aussieht, wie sie sich das jetzt vorstellen …“

Gerade die in Agonie liegenden Zeitungsverlage sollten sich pdfChip genau anschauen. Denn sie könnten ihren Kunden auf recht einfache Weise den Druck einer Content-personalisierten Zeitung anbieten. Zu lesen im Netz oder als hochwertiger Print auf dem Frühstückstisch.

Für den ganzen Firmenhorizont der bislang rein Web-orientierten Häuser ist pdfChip sicher ebenfalls interessant – denn auch sie könnten sich nun die Welt der bedruckten Bäume auf einem sehr einfachen Weg erschließen. Wo die pdfLib über Anschaffungskosten und Lernkurve bisher das Drucken verhindert hat, weil sie direkt am datenpumpenden System hängen muss, könnte ein wieselflinker Dienstleister eine externe Schnittstelle anbieten, auf die diese „jungen“ Unternehmen ihre Daten zur Ausgabe schicken – ohne Software erwerben, deren Handling erlernen und sie auch noch teuer warten lassen zu müssen. Hier könnte der Print-Dienstleister passend zur Aufgabenstellung eine HTML/CSS-Hülse zur Verfügung stellen. Die Onliner werten dieses Template mit ihrer ureigenen Expertise auf und schicken personalisiertes HTML zur Ausgabe an die pdfChip-Schnittstelle des Dienstleisters.

Callas verspricht auch, mit pdfChip „getaggtes“ PDF erzeugen zu können. An dieser Stelle werden alle aufhorchen, die jemals versucht haben, auf konventionellem Wege eine barrierefreie PDF mit InDesign und Acrobat zu erzeugen. Dazu muss man wissen, dass es nur wenige Aufgaben im Umgang mit Layouts und PDFs gibt, die einen Operator derartig schmerzhaft und brachial in Lichtsatzzeiten zurückwerfen wie die Generierung eines wirklich barrierefreien PDFs. Über die technische Struktur von HTML sollte es in der Tat gut möglich sein, schnell zu einem qualitativ hochwertigen PDF zu kommen, das für jeden Nutzer eines Screenreaders eine mittlere Offenbarung sein muss, der sich bisher mit der „Unhörbarkeit“ einer konventionellen PDF-Datei herumschlagen musste.

Es dauert einen Augenblick, sich die Möglichkeiten von pdfChip zu erarbeiten. Man sollte es aber nicht versäumen, darüber nachgedacht zu haben. Denn eventuell bietet dieses Werkzeug die Lösung vieler langstehender Probleme.

Schnipsel

Die Beschreibung von pdfChip liefert ein paar interessante Code-Schnipsel, die es erleichtern, sich in das Tool und seine Nutzung hineinzudenken.

Der Aufruf auf der Kommandozeile ist undramatisch:

pdfChip eingabe.html ausgabe.pdf

Die herausragende Steuerungsfähigkeit liegt im HTML-File und seinen Zuspielern:

@page {
       size: 229mm 317mm;
       margin: 20mm;
       -cchip-trimbox: 10mm 10mm 209mm 297mm;
      }

Hier wird über CSS ein Seitenformat mit einem „gestalterischen“ Innenabstand und einer Trimbox definiert – so, dass sowohl ein Programmierer als auch ein Mediengestalter durchblicken, was passiert.

Insbesondere rüstet Callas mit pdfChip nach, was HTML noch immer nicht kann: CMYK und Sonderfarben:

p {
   background-color: -cchip-cmyk(1.0,0.0,0.0,0.0);
   color: -cchip-cmyk( 'Spot Black', 0.0, 0.0, 0.0, 1.0, 0.5 );
  }

Hier wird für den Standard-Textabsatz ein 100% Cyan als Hintergrundfarbe definiert und die Textfarbe als ein Sonderfarb-Schwarz eingerichtet, das mit 50% ausgegeben werden soll. Wann immer nun ein Textabsatz im HTML-Dokument erscheint, wird er vor blauem Grund mit 50% Schwarz erscheinen. In der Praxis wird eine Website auf andere Definitionen für die Definition von p geleitet werden, die RGB-basiert sind – Print-Ausgaben erhalten CMYK-Angaben. Das ist mit Standard-HTML nicht möglich.

Für Mischproduktionen interessant: pdfChip kann bestehendes PDF in das erzeugte PDF einklinken. Bezogen auf eine Katalogproduktion können so statische Inhalte in dynamische Integriert werden:

<img src="/katalog2015/unternehmensdarstellung.pdf#page=2"/>

Wäre pdfChip kein Callas-Produkt, würde sicher die Zertifizierung der erzeugten PDF fehlen:

<meta property="cchip_pdfx" content="PDF/X-1a">
<link rel="cchip-outputintent" href="./templates/outputintent.pdf"/>

Das sind Informationen, die im Kopf der HTML-Datei hinterlegt werden. Content kann also – mit ganz geringem Aufwand – in Richtung Rolle, Bogen oder Digital ausgerollt werden.

Zu guter Letzt sei erwähnt, dass – neben vielen anderen interessanten Details – auch Barcodes in die Dokumente gerendert werden können:

<object class="barcode" type="application/barcode" style="width:30mm; height:30mm;">
   <param name="type" value="QR-Code">
   <param name="data" value="http://www.printpraxis.net/">
</object>

Zahlenwerke

Varianten

Aufgrund der Vielzahl von Workflows, in die pdfChip integriert werden kann, wird das Produkt in verschiedenen Produktvarianten angeboten:

Variante pdfChip S pdfChip M pdfChip L pdfChip XL Enterprise
Gleichzeitige Konvertierungsvorgänge: 1 4 8 unbegrenzt
Seiten pro Stunde: 1000 5000 25000 unbegrenzt
Barcode-Unterstützung: EAN, UPC, Code 39 & 128, ISBN, QR alle alle alle
Anzahl der Seiten pro PDF-Dokument: 25 250 1500 unbegrenzt
Erweiterte Seitennummerierung: nein ja ja ja
Netto-Preis zzgl. Wartung: 5.000,– € 10.000,– € 15.000,– € 25.000,– €

Der Abschluss eines Wartungsvertrags (SMA-Vertrag) ist im ersten Jahr obligatorisch. Die Gebühr beträgt 20 Prozent des Produktpreises (pro Jahr). Ein Upgrade ist zum Differenzbetrag zwischen den jeweiligen beiden Varianten jederzeit möglich.

Share

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.