Level 2
Sowohl die konsonantischen Ligaturen (tz, ct, ts, ff etc.) sowie die Ligatur ij als auch die in deutschsprachigen Texten üblichen Ligaturen wie fi, fl, ft, deren Derivate, sowie fk, fj, fh, fb, fz, ll, mm, nn, st, ch, ck, ct, th, tt, tz, kk, Qu, ſi, ſſ, ſt, ſch sind grundsätzlich aufzuspalten.
Um aufgespaltene Ligaturen im Ground-Truth zu erkennen, werden diese Ligaturen als typographische Besonderheiten betrachtet und als diese gekennzeichnet.
Vokalische Ligaturen werden grundsätzlich als ein Zeichen realisiert:
Vorlage | Zeichen | Beschreibung |
---|---|---|
æhex: æ | LATIN SMALL LETTER AE | |
œhex: œ | LATIN SMALL LIGATURE OE | |
Æhex: Æ | LATIN CAPITAL LETTER AE | |
Œhex: Œ | LATIN CAPITAL LIGATURE OE |