Publications
Baierer, Konstantin; Büttner, Andreas; Engl, Elisabeth; Hinrichsen, Lena; Reul, Christian: OCR-D & OCR4all: Two Complementary Approaches for Improved OCR of Historical Sources, in: Proceedings of the 6th International Workshop on Computational History (HistoInformatics 2021) co-located with ACM/IEEE Joint Conference on Digital Libraries 2021 (JCDL 2021), 01.10.2021. Online: <http://ceur-ws.org/Vol-2981/>.
Weichselbaumer, Nikolaus; Seuret, Mathias; Limbach, Saskia; Dong, Rui; Burghardt, Manuel; Christlein, Vincent: New Approaches to OCR for Early Printed Books, in: DigItalia 15 (2), 12.2020, S. 74–87. Online: <https://doi.org/10/ghstmx>.
Engl, Elisabeth: OCR-D kompakt: Ergebnisse und Stand der Forschung in der Förderinitiative, in: Bibliothek Forschung und Praxis 44 (2), 29.07.2020, S. 218–230. Online: <https://doi.org/10.1515/bfp-2020-0024> ; Video: <OCR-D kompakt>.
Engl, Elisabeth; Baierer, Konstantin; Boenig, Matthias; Hartmann, Volker; Neudecker, Clemens: Volltexte – die Zukunft alter Drucke. Bericht zum Abschlussworkshop des OCR-D-Projekts, in: o-bib 7 (2), 05.05.2020, S. 1–4. Online: <https://doi.org/10.5282/o-bib/5600>.
Boenig, Matthias; Engl, Elisabeth; Baierer, Konstantin; Hartmann, Volker; Neudecker, Clemens: Volltexttransformation frühneuzeitlicher Drucke – Ergebnisse und Perspektiven des OCR-D-Projekts, in: DHd 2020: Spielräme - Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts, Paderborn 05.03.2020, S. 244–247. Online: <https://doi.org/10.5281/zenodo.3666690>.
Engl, Elisabeth; Boenig, Matthias; Baierer, Konstantin; Neudecker, Clemens; Hartmann, Volker: Volltexte für die Frühe Neuzeit. Der Beitrag des OCR-D-Projekts zur Volltexterkennung frühneuzeitlicher Drucke, in: Zeitschrift für Historische Forschung 47 (2), 2020, S. 223–250.
Seuret, Mathias; Limbach, Saskia; Weichselbaumer, Nikolaus; Maier, Andreas; Christlein, Vicent: Dataset of Pages from Early Printed Books with Multiple Font Groups, in: Proceedings of the 5th International Workshop on Historical Document Imaging and Processing, Sydney 20.09.2019, S. 1–6. Online: <https://dl.acm.org/doi/10.1145/3352631.3352640>.
Baierer, Konstantin; Dong, Rui; Neudecker, Clemens: okralact – a multi-engine Open Source OCR training system, in: Proceedings of the 5th International Workshop on Historical Document Imaging and Processing, Sydney 20.09.2019, S. 25–30. Online: <https://dl.acm.org/doi/10.1145/3352631.3352638>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open source OCR framework for historical documents, in: EuropeanaTech Insight (13), 31.07.2019. Online: <https://pro.europeana.eu/page/issue-13-ocr#ocr-d-an-end-to-end-open-source-ocr-framework-for-historical-documents>.
Englmeier, Tobias; Fink, Florian; Schulz, Klaus: A-I-PoCoTo – Combining automated and interactive OCR postcorrection, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 19.24. Online: <https://dl.acm.org/doi/10.1145/3322905.3322908>.
Boenig, Matthias; Baierer, Konstantin; Hartmann, Volker; Federbusch, Maria; Neudecker, Clemens: Labelling OCR Ground Truth for Usage in Repositories, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 3–8. Online: <https://dl.acm.org/doi/10.1145/3322905.3322916>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open-source OCR framework for historical documents, in: Proceedings of the 3rd International Conference on Digital Access to Textual Cultural Heritage, Brüssel 09.05.2019, S. 53–58. Online: <https://dl.acm.org/doi/10.1145/3322905.3322917>.
Engl, Elisabeth: Das Projekt OCR-D – Ein Fortschrittsbericht zur Volltextdigitalisierung frühneuzeitlicher Drucke, in: Medium Buch 1, 2019, S. 233–235.
Sachunsky, Robert; Schiffer, Lena K.; Efer, Thomas; Heyer, Gerhard: Towards Context-Aware Language Models for Historical OCR Post-Correction, in: Conference Abstracts, Galway 08.12.2018. Online: <https://eadh2018.exordo.com/files/papers/92/final_draft/EADH_2018_Proposal_Brief_Final.pdf>.
Schulz, Klaus; Fink, Florian: Novel software for cleansing digitised historical texts, in: Scientia, 28.11.2018. Online: <https://doi.org/10.26320/SCIENTIA278>.
Boenig, Matthias; Federbusch, Maria; Herrmann, Elisa; Neudecker, Clemens; Würzner, Kay-Michael: Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?, in: Konferenzabstracts, Köln 28.02.2018, S. 219–223. Online: <http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf#page=221>.
Stäcker, Thomas; Herrmann, Elisa: OCR-D – Koordinierte Förderinitiative zur Weiterentwicklung von OCR-Verfahren, in: Bibliotheksdienst 52 (1), 05.12.2017. Online: <https://doi.org/10.1515/bd-2018-0007>.
Boenig, Matthias; Würzner, Kay-Michael; Binder, Arne; Springmann, Uwe: Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts, in: Konferenzabstracts, Leipzig 11.03.2016, S. 103–108. Online: <http://dhd2016.de/boa.pdf#page=103>.
Presentations
Hinrichsen, Lena: Community Building und Community Management in OCR-D, #vBIB21 01.12.2021. Online: <https://nbn-resolving.org/urn:nbn:de:0290-opus4-178109> ; Video: <https://av.tib.eu/media/55592>.
Vom Bild zum Text – praktische OCR für die DH. Abschlussveranstaltung, vDHd2021 15.09.2021. Online: <https://dhd-ag-ocr.github.io/slides/OCR@vDHd-Abschluss.pdf>.
Hartwig, Uwe: Open Source OCR-Systeme, 06.07.2021. Online: <https://doi.org/10.5281/zenodo.5076012>.
Würzner, Kay-Michael; Sachunsky, Robert: Kollaborative Erstellung von Trainingsmaterialien für OCR – Ein Werkstattbericht, Bibliothekartag 2021 17.06.2021. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/17661>.
Hertling, Anke; Klaes, Sebastian: OCR on demand: Der Ansatz eines User-generated Content, Bibliothekartag 2021 17.06.2021. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/17662> ; Video: <OCR on demand>.
Engl, Elisabeth: OCR-D: Von Prototypen zu Digitalisierungsprojekten, Bibliothekartag 2021 16.06.2021. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/17593>, Stand: 27.10.2021 ; Video: <OCR-D>: Stand: 27.10.2021.
Engl, Elisabeth; Sachunsky, Robert; Fink, Robert; Schäfer, Robin: Vom Bild zum Text – praktische OCR für die DH. Postcorrection, Hackathon, vDHd2021 19.05.2021. Online: <https://dhd-ag-ocr.github.io/slides/OCR@vDHd-Z3.pdf> ; Video: <https://meet.gwdg.de/playback/presentation/2.3/db36b9cd45a79838b121a8b68270a85734c8f026-1621428290680?meetingId=db36b9cd45a79838b121a8b68270a85734c8f026-1621428290680>.
Engl, Elisabeth; Baierer, Konstantin; Büttner, Andreas; Kamlah, Jan: Vom Bild zum Text – praktische OCR für die DH. Evaluation, Transkription, Training, vDHd2021 12.05.2021. Online: <https://dhd-ag-ocr.github.io/slides/OCR@vDHd-Z2.pdf> ; Video: <https://meet.gwdg.de/playback/presentation/2.3/db36b9cd45a79838b121a8b68270a85734c8f026-1620823922694?meetingId=db36b9cd45a79838b121a8b68270a85734c8f026-1620823922694>.
Engl, Elisabeth; Baierer, Konstantin; Reul, Christian; Büttner, Andreas: Vom Bild zum Text – praktische OCR für die DH. OCR-D und OCR4all, TEI-Konvertierung, vDHd2021 05.05.2021. Online: <https://dhd-ag-ocr.github.io/slides/OCR@vDHd-Z1.pdf> ; Video: <https://meet.gwdg.de/playback/presentation/2.3/db36b9cd45a79838b121a8b68270a85734c8f026-1620218746064?meetingId=db36b9cd45a79838b121a8b68270a85734c8f026-1620218746064>.
Vom Bild zum Text – praktische OCR für die DH. Einführungsveranstaltung, vDHd2021 23.03.2021. Online: <https://dhd-ag-ocr.github.io/assets/other/OCR@vDHd.pdf>.
Engl, Elisabeth: Massendigitalisierung alter Drucke – OCR-D in Bibliotheken, Vortrag, 3. Workshop zur Retrodigitalisierung. OCR – Prozesse und Entwicklungen 01.03.2021. Online: <https://wiki.zbw.eu/pages/viewpage.action?pageId=33620559&preview=/33620559/33620562/2021-02-24_Engl_Massendigitalisierung%20alter%20Drucke.pdf>.
Neudecker, Clemens: OCR-D: An open ecosystem for improving OCR on historical documents, Vortrag, Mini-ELAG 20.10.2020. Online: <https://elag.org/mini-elag-october-20-2020/ocr-d-an-open-ecosystem-for-improving-ocr-on-historical-documents/>.
Boenig, Matthias: Digitale Transformation: OCR-D, Angebot und Vision, Vortrag, FAIR & Co.: Sicht- und Verfügbarkeit der digitalen Akademieforschung in einer vernetzten Wissenschaftslandschaft 08.10.2020. Online: <https://docs.google.com/presentation/d/1JCzfGq_Reze7R3TaecYyBocnkD6uNy94eukJTlYUbNI/edit#slide=id.g9d954d5829_0_469>.
Engl, Elisabeth: OCR-D in the wild: Erfahrungen und Erkenntnisse aus der Praxisphase mit Bibliotheken, Vortrag, vbib2020 26.05.2020. Online: <https://doi.org/10.5446/47151>.
Baierer, Konstantin; Neudecker, Clemens: Volltexttransformation frühneuzeitlicher Drucke – Ergebnisse und Perspektiven des OCR-D-Projekts, Paderborn 05.03.2020. Online: <https://doi.org/10.5281/zenodo.3666690>.
Engl, Elisabeth: Die OCR-D-Workflowengine, Vortrag, 2. Workshop Retrodigitalisierung zu Effizienz und Qualitätssicherung in Digitalisierungsworkflows, Hannover 18.02.2020. Online: </slides/Retrodigitalisierung-2020-02-18/TIB_Retrodigitalisierung.pdf>.
Engl, Elisabeth: Bibliothekarische Digitalisierungspraxis und die OCR-D-Software, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: </slides/Abschlussworkshop-2020/OCR-D_in_Bibliotheken.pdf>.
Neudecker, Clemens; Baierer, Konstantin: Funktionen und Möglichkeiten der OCR-D-Software, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: <https://hackmd.io/@cneud/ocrd-bonn#/>.
Engl, Elisabeth: OCR-D in a Nutshell, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: </slides/Abschlussworkshop-2020/Abschlussworkshop_Überblick.pdf>.
Boenig, Matthias: Spezifikationen und Lessons Learned, Vortrag, Volltexte - Die Zukunft alter Drucke, Bonn 12.02.2020. Online: </slides/Abschlussworkshop-2020/OCR-D_Spezifikationen_Lessons_Learned.pdf>.
Würzner, Kay-Michael: Multi-source OCR workflows with OCR-D, Vortrag, The Open Islamicate Texts Initiative Workshop, Berwyn 29.01.2020. Online: <https://wrznr.github.io/OpenITI-2020/#1>.
Baierer, Konstantin; Engl, Elisabeth; Luetgen, Michael: OCR(-D) und Kitodo, Vortrag, Kitodo Anwenderworkshop, Hamburg 19.11.2019. Online: <https://hackmd.io/@kba/S1peIVxhH#/>.
Seuret, Mathias; Limbach, Saskia; Weichselbaumer, Nikolaus; Maier, Andreas; Christlein, Vicent: Dataset of Pages from Early Printed Books with Multiple Font Groups, Vortrag, 5. internationaler Workshop zu Historical Document Imaging and Processing HIP 2019 als Teil der ICDAR 2019, Sydney 20.09.2019.
Baierer, Konstantin; Dong, Rui; Neudecker, Clemens: okralact – a multi-engine Open Source OCR training system, Vortrag, 5. internationaler Workshop zu Historical Document Imaging and Processing HIP 2019 als Teil der ICDAR 2019, Sydney 20.09.2019. Online: <https://hackmd.io/@kba/SyiQKUCUH#/>.
Metzger, Noah: Projektabschlusspräsentation, Vortrag, Mannheim 19.09.2019. Online: <https://madoc.bib.uni-mannheim.de/52213/>.
Sachunsky, Robert; Würzner, Kay-Michael: Flexible workflows with OCR-D, Vortrag, 3rd OCR-D developer workshop, Berlin 26.08.2019. Online: <https://hackmd.io/@FKFH0M1sR2SdJZwK5U8Cfg/S1YQ4NeNr#/>.
Metzger, Noah; Weil, Stefan: Optimierter Einsatz von OCR-Verfahren – Tesseract als Komponente im OCR-D-Workflow, Workshop, MAD HD, Heidelberg 30.07.2019.
Englmeier, Tobias; Fink, Florian; Schulz, Klaus: A-I-PoCoTo – Combining automated and interactive OCR postcorrection, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 09.05.2019.
Boenig, Matthias; Baierer, Konstantin; Hartmann, Volker; Federbusch, Maria; Neudecker, Clemens: Labelling OCR Ground Truth for Usage in Repositories, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 09.05.2019. Online: <https://hackmd.io/@QTT7e4hCTyWxVOvjiS61cA/B1nn7W7jV#/>.
Neudecker, Clemens; Baierer, Konstantin; Federbusch, Maria; Würzner, Kay-Michael; Boenig, Matthias; Herrmann, Elisa; Hartmann, Volker: OCR-D: An end-to-end open-source OCR framework for historical documents, Vortrag, DATeCH 2019. 3. internationale Konferenz zu Digital Access to Textual Cultural Heritage 2019, Brüssel 09.05.2019. Online: <https://www.slideshare.net/cneudecker/ocrd-an-endtoend-open-source-ocr-framework-for-historical-printed-documents>.
Weil, Stefan: Tesseract OCR – News, Vortrag, ELAG 2019, Berlin 09.05.2019. Online: <https://www.elag2019.de/talks/2019-05-09-tesseract-elag.pdf>.
Kamlah, Jan; Weil, Stefan: Forschungsdaten aus Digitalisaten, Vortrag, E-Science-Tage, Heidelberg 28.03.2019. Online: <https://heibox.uni-heidelberg.de/d/31bb269467/files/?p=%2FVortr%C3%A4ge%2FC3_2019-03-28-Kamlah-Weil.pdf>.
Weichselbaumer, Nikolaus; Seuret, Mathias; Limbach, Saskia; Christlein, Vincent; Maier, Andreas: Automatic Font Group Recognition in Early Printed Books, Vortrag, Mainz 25.03.2019.
Baierer, Konstantin; Boenig, Matthias; Hartmann, Volker; Herrmann, Elisa: Vom gedruckten Werk zu elektronischem Volltext, Workshop, DHd 2019, Mainz 25.03.2019. Online: <http://kba.cloud/2019-03-25-dhd/>.
Weil, Stefan: Hands-On Lab digital / Vom Bild zum Text. Automatisierte Texterkennung in historischen Drucken mit der freien Software Tesseract, Workshop, 108. Bibliothekartag, Leipzig 18.03.2019. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/docId/16351>.
Boenig, Matthias: OCR-D in der Praxis: Ein gemeinsamer Ausblick mit Dienstleistern und Anwendern, Öffentliche Arbeitssitzung, 7. Bibliothekskongress, Leipzig 18.03.2019. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/searchtype/collection/id/17097/docId/16357/start/0/rows/20>.
Herrmann, Elisa: Von der Vision zur Umsetzung: Der aktuelle Entwicklungsstand von OCR-D, Vortrag, 7. Bibliothekskongress, Leipzig 18.03.2019. Online: <https://www.researchgate.net/publication/332173701_Von_der_Vision_zur_Umsetzung_Der_aktuelle_Entwicklungsstand_von_OCR-D>.
Sachunsky, Robert; Schiffer, Lena K.; Efer, Thomas; Heyer, Gerhard: Towards Context-Aware Language Models for Historical OCR Post-Correction, Posterpräsentation, EADH 2018, Galway 08.12.2018. Online: <https://git.informatik.uni-leipzig.de/ocr-d/poster-eadh2018/blob/master/main.pdf>.
Baierer, Konstantin; Würzner, Kay-Michael: An open-source framework for integrating multi-source layout and text recognition tools into scalable OCR workflows, Vortrag, Bibliotheca Baltica Symposium, Rostock 05.10.2018. Online: <https://ocr-d.github.io/2018-10-05-baltica/index.html#/>.
Weil, Stefan: 126 Jahre Zeitung online – Fundgrube für historisch Interessierte und Motor für die Bibliotheks-IT, Vortrag, 107. Bibliothekartag, Berlin 15.06.2018. Online: <https://madoc.bib.uni-mannheim.de/46507/>.
Herrmann, Elisa: Wieviel sind 85% wert: Qualität von OCR- und NER-Verfahren für die Forschung, Vortrag, MWW / DARIAH-DE Expertenworkshop Suchtechnologien, Weimar 24.05.2018. Online: </slides/MWW-2018/MWW-Workshop_Wieviel sind 85% wert_2018-05-24.pdf>.
Würzner, Kay-Michael: Neues aus OCR-D, Vortrag, PhilTag 2018, Würzburg 10.04.2018. Online: </slides/PhilTag-2018/content.md>.
Boenig, Matthias; Federbusch, Maria; Herrmann, Elisa; Neudecker, Clemens; Würzner, Kay-Michael: Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?, Vortrag, DHd 2018, Köln 28.02.2018. Online: <http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf#page=221>.
Würzner, Kay-Michael; Boenig, Matthias: Perspektiven der automatischen Texterfassung als Grundlage wissenschaftlicher Editionen am Beispiel der Brief- und Schriftenausgabe der Bernd Alois Zimmermann-Gesamtausgabe, Workshop, Workshop der AG eHumanities Mainz. Geisteswissenschaftliche Forschungsdaten. Methoden zur digitalen Erfassung, Mainz 19.10.2017. Online: </slides/Akademienunion_2017/slides/ocr-perspektiven.pdf>.
Prabhune, Ajinkya; Neudecker, Clemens: OCR-D Technische Systemarchitektur: Workflows, Repository, Schnittstellen, Vortrag, Karlsruhe 26.09.2017. Online: </slides/OCR-Workshop-2017/slides/systemarchitektur/OCR-D-Workshop-Prabhune-Neudecker.pdf>.
Würzner, Kay-Michael: (Open-Source-)OCR-Workflows, Vortrag, Digital Humanities Kolloquium, Berlin 04.08.2017. Online: <https://edoc.bbaw.de/frontdoor/index/index/docId/2786>.
Stäcker, Thomas; Herrmann, Elisa: OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von OCR für historische Dokumente, Vortrag, 106. Bibliothekartag, Frankfurt am Main 30.05.2017. Online: <https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/searchtype/collection/id/16521/rows/10/start/0/facetNumber_author_facet/all/author_facetfq/St%C3%A4cker%2C+Thomas/docId/3004>.
Würzner, Kay-Michael; Boenig, Matthias: Compilation of a Large Ground-Truth Data Set: Using Transkribus, Vortrag, Transkribus User Conference, Wien 11.02.2017. Online: </slides/Transkribus-WS-2017/slides/gt_compilation.pdf>.
Herrmann, Elisa: Aktuelle OCR-Entwicklungen und ihr Einsatz in der Praxis, Vortrag, Berliner Bibliothekswissenschaftliches Kolloquium, Berlin 17.01.2017.
Boenig, Matthias; Würzner, Kay-Michael; Binder, Arne; Springmann, Uwe: Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts, DHd 2016, Leipzig 11.03.2016. Online: <http://dhd2016.de/boa.pdf#page=103>.
Herrmann, Elisa: OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren, Vortrag, Philtag 13, Würzburg 26.02.2016. Online: </slides/PhilTag-2016/OCR-D_Wurzburg-13PhilTag.pdf>.
Stäcker, Thomas; Herrmann, Elisa: Kooperationsprojekt zur Weiterentwicklung von OCR-Verfahren, Vortrag, 12. Workshop zur Texterkennung in historischen Dokumenten, Rostock 09.02.2016. Online: </slides/Rostock-2016-02-09/OCR-D_Rostock_09-02-2016.pdf>.