Diakritika
Diakritika werden nach Vorlage transkribiert. Die folgenden Erfassungslevel (1-3) unterscheiden sich in der Kodierung und Interpretation der Zeichen.
Die Grundlage für die Transkription bildet der deutsche bzw. lateinische Zeichensatz. Zeichen anderer Alphabete (Griechisch, Kyrillisch, Hebräisch etc.) werden mittels ihrer entsprechenden Codepoint unter Nutzung von standardisierten Kodierungen (Unicode), communitynormierten Kodierungen (MUFI) und durch das Koordinierungsgremium festgelegten Kodierungen abgebildet.
Die wichtigsten Listen im Überblick:
- Lateinische Buchstaben Standard (Controls and Basic Latin)
- Ergänzungen zum lateinischen Zeichensatz (Controls and Latin-1 Supplement)
- griechischer Zeichensatz (Greek and Coptic)
- erweiterter griechischer Zeichensatz (Greek extended)
- kyrillischer Zeichensatz (Cyrillic)
- Kombinierte diakritische Zeichen (Combining diacritical marks)
- Medieval Unicode Font Initiative (MUFI)
- MUFI character recommendation v. 4.0