Ground Truth Richtlinienen OCR-D: Koordinierten Förderinitiative zur Weiterentwicklung von Verfahren der Optical
Character Recognition gefördert von der DFG
Wie im Level 3 transkribieren
Die Transkription erfolgt ausschließlich vorlagengetreu. Wenn der Graph mit Unicode
umgesetzt
werden kann, ist diese Kodierung ausschließlich zu verwenden. Eine Kombination von
mehreren
Kodierungen zu einem Graphen erfolgt nicht.
Ist der Graph nicht als standardisierte Kodierung (Unicode) vorhanden, sondern über
eine
Community normierte Kodierung wie MUFI ist diese Kodierung zu verwenden.
Können die Möglichkeiten 1 und 2 nicht gewählt werden, ist in Abstimmung mit dem
OCR-D-Koordinierungsgremium eine OCR-D-Code-Definition in Nachnutzung gemeinsam getroffener
Vereinbarungen internationaler Großprojekte wie IMPACT, EEBO, ECCO zu verwenden.