Start der 8 Modulprojekte - OCR-D geht in die zweite Projektphase
Vom 05.-06. März fand in der Herzog August Bibliothek in Wolfenbüttel das große Kick-Off-Treffen der Modulprojekte statt, welches offiziell die zweite Phase von OCR-D einläutet.
Das Koordinierunsggremium von OCR-D traf sich zum ersten Mal mit den zehn Modulprojektnehmern zum gegenseitigen Kennenlernen und zum Vorstellen der geleisteten und geplanten Arbeiten auf beiden Seiten. In kurzen Präsentationen wurden die Projektantragsinhalte dargestellt und nach Anknüpfungspunkten zwischen den Modulprojekten sowie zum Koordinierungsgremium gesucht. Beim persönlichen Austausch im World Café sowie beim gemeinsamen Abendessen konnten zudem erste projektstrategische Diskussionen angestoßen werden, die uns in naher Zukunft noch begleiten werden.
Von den über 20 eingegangenen Projektanträgen auf die DFG-Ausschreibung im März 2017 wurden Ende des Jahres acht Modulprojekte bewilligt:
Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke: Bildoptimierung Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI)
Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke: Layouterkennung DFKI
Weiterentwicklung eines semi-automatischen Open-Source-Tools zur Layout-Analyse und Regionen-Extraktion und -Klassifikation (LAREX) von frühen Buchdrucken, Universität Würzburg
NN/FST – Unsupervised OCR-Postcorrection based on Neural Networks and Finite-state Transducers Universität Leipzig
Optimierter Einsatz von OCR-Verfahren – Tesseract als Komponente im OCR-D-Workflow Universität Mannheim
Automatische und semi-automatische Nachkorrektur OCR-erfasster historischer Drucke Universität München
Entwicklung eines Modellrepositoriums und einer automatischen Schriftarterkennung für OCR-D Universität Leipzig, Universität Erlangen, Universität Mainz
OLA-HD – Ein OCR-D-Langzeitarchiv für historische Drucke SUB Göttingen, GWDG Göttingen
Die Modulprojekte haben in der Regel eine Laufzeit von 18 Monaten, ein öffentlicher Abschlussworkshop ist für Juni 2019 geplant. Bis dahin organisiert das Koordinierungsgremium zwei projektinterne Entwicklertreffen, auf denen die bisherigen Arbeitsversionen besprochen werden. Einen Einblick in die Entwicklung bietet auch die GitHub-Seite von OCR-D: https://github.com//ocr-d Zudem stehen das Koordinierungsgremium und die Modulprojekte in dieser intensiven Arbeitsphase per Videokonferenzen im regelmäßigen Austausch.
Weitere Details zu den einzelnen Modulprojekten und später zu den Entwicklertreffen folgen auf der Seite von OCR-D.
Wir freuen uns auf die gemeinsame Zusammenarbeit!
Für Fragen und Anregungen: Kontakt