Ground Truth Richtlinienen OCR-D: Koordinierten Förderinitiative zur Weiterentwicklung von Verfahren der Optical
Character Recognition gefördert von der DFG
Wie im Level 1 transkribieren
Wenn der zu transkribierende Text mit Unicodezeichen umgesetzt werden kann, sind diese
ausschließlich zu verwenden.
Außer den vokalischen Ligaturen werden alle Ligaturen aufgespalten.
Kann das Zeichen nur aus der Kombination von zwei Zeichen gebildet werden, ist diese
Kombination
zu verwenden.
Kann das Zeichen nicht aus der Kombination von mehreren Zeichen gebildet werden und
ist eine
MUFI-Entsprechung
vorhanden, ist MUFI zu verwenden
Können die Möglichkeiten 1, 2, 3 nicht gewählt werden, ist in Abstimmung mit dem
OCR-D-Koordinierungsgremium eine Code-Definition in Nachnutzung gemeinsam getroffener
Vereinbarungen
internationaler Großprojekte wie IMPACT, EEBO, ECCO zu verwenden.