4.8. ALTO Generierung aus ABBYY-xml mittels intranda AltoConvert

Die Zusammenarbeit mit dem intranda TaskManager erlaubt Goobi, die aufwändige ALTO Generierung mit der Erkennung von Lauftiteln und Seitenzahlen auf externe Maschinen auszulagern.

Aufruf des Plugins

Der Aufruf der ALTO-Generierung mittels intranda AltoConvert muss aus einem Workflowschritt folgendermaßen erfolgen:

/usr/bin/java -jar /opt/digiverso/itm/bin/TaskClient.jar
-itm http://localhost:8080/itm/service
-s {tifpath}
-d {processpath}/ocr/{processtitle}_alto/
-e
-gid {processid}
-i {stepid}
-T {processtitle}
-t ALTOCONVERT
-n altoconvert

Parameter

Die innerhalb dieses Aufrufs zu übergebenen Parameter haben folgende Bedeutungen:

Parameter

Mögliche Goobi Variable

Bedeutung

-itm

http://localhost/itm/service

URL zur Schnittstelle des intranda TaskManagers

-e --returnError

-

Wenn angegeben, beendet sich der TaskClient mit einem Fehlercode, um das automatische Fortschreiten im Workflow zu unterbinden

-p

0 – 10

Priorität zur Verarbeitung dieses Jobs

-gid

{processid}

ID des Goobi-Vorgangs

-i

{stepid}

Die ID des Arbeitsschrittes, der den Aufruf startet

-T, --title

{processtitle}

Der Vorgangstitel in Goobi, für den der Aufruf gestartet wird

-t, --jobtype

ALTOCONVERT

Der Typ des Jobs

-n, --templatename

template

Name der zuvor erzeugten Konfigurationsdatei

-s, --source

{tifpath}

Pfad zum tif-Verzeichnis des Vorgangs

-d, --destination

{processpath}/ocr/{processtitle}\_alto/

Pfad zum zu erzeugenden ALTO-Verzeichnis im Vorgang

Arbeitsweise des Plugins

Nach der Generierung der ALTO-Dateien werden die erzeugten Dateien durch den TaskManager vollautomatisch in das an den TaskClient übergebene Zielverzeichnis verschoben. Darüber hinaus erfolgt neben dem Eintrag über den erfolgreichen Abschluss der Arbeiten in das Vorgangslog auch der Abschluss des automatischen Workflowschritts via WebAPI.