Attention: this page is not being maintained any longer, the information given on this page is probably out of date, and links may not work
Russian page Hauptseite Main page E-Mail
Hauptseite[Go to Christoph Singer's Homepage]

Kirchenslavisch im WWW


Auf dieser Seite: Voraussetzungen | Probleme mit Browsern | Technische Informationen
Mit Hilfe der UNICODE-Codierung UTF-8, die seit der Einführung von HTML 4.0 die Standardcodierung im WWW ist, ist es möglich, auch nichtstandardmäßige Zeichen wie z. B. altslavische Zeichen im WWW zu verwenden. Leider unterstützen noch nicht alle Browser und Betriebssysteme diese Codierung. Als Testseite habe ich einen Auszug aus einem kirchenslavischen Bußkanon in drei Varianten ins Web gestellt:
  • Kanon Pokajanen 1
    Diese Seite ist speziell auf den Font "Kirillica Nova Unicode" abgestimmt und verwendet benutzerdefinierte Zeichen.
  • Kanon Pokajanen 2
    Diese Seite verwendet nur Zeichen aus dem UNICODE-Standard 2.0; im HTML-Code ist der Font "Kirillica Nova Unicode" zur Darstellung spezifiziert.
  • Kanon Pokajanen 3
    Diese Seite verwendet nur Zeichen aus dem UNICODE-Standard 2.0; im HTML-Code ist kein Font spezifiziert, weshalb Ihr Browser den Schriftsatz zur Darstellung verwenden wird, der in den Optionen des Browsers als Standardfont für die Kodierung UTF-8 festgelegt ist. Wenn dieser Font keine altslavischen Zeichen enthält, sehen Sie statt dessen Quadrate oder Fragezeichen.
Folgende Voraussetzungen benötigen Sie, um diese Seite betrachten zu können:
  1. Einen UNICODE-Font, der die altslavischen Zeichen aus dem UNICODE-Standard 2.0 enthält. Es empfiehlt sich der Font "Kirillica Nova Unicode" (Windows TrueType) den Sie hier herunterladen können und dann in ihrem System installieren müssen
  2. Ein UNICODE-fähiges Betriebssystem, in dem Sie diesen Font verwenden können (Windows 95, 98, 2000, NT 4, NT5b; evtl. auch Linux- oder sonstiges Unix-System mit UNICODE-Support und TrueType-Fontserver)
  3. Einen Browser, der die Codierung UTF-8 unterstützt (Netscape ab Version 4.0, MS Internet Explorer ab Version 4.0)

Hinweise zu Problemen mit einzelnen Browsern:

Netscape 4.x: Die Windows-Version von Netscape 4.0 liefert die beste Darstellung der Seite (es sieht genauso aus wie in Word 97, mit dem die Seite erstellt wurde). Der Versuch, die Seite mit Netscape 4.5 auf einem Linux-System mit installiertem TrueType-Fontserver anzeigen zu lassen, scheiterte jedoch, da die Linux-Version von Netscape zur Darstellung von Webseiten mit Unicode-Kodierung immer die "NSPseudoFonts" und nicht den im HTML-Code spezifizierten Font zu verwenden scheint.

Internet-Explorer 4.0: Beim IE 4.0 kommt es zu ungleichen Zeichenabstanden und Uberscheidungen von Zeichen, die nicht zum kyrillischen Standard-Set von UNICODE gehoren, sondern im "benutzerdefinierten Bereich" von UNICODE angeordnet sind. Das scheint ein Bug von MS IE 4.0 zu sein, da der Fehler bei Betrachtung in Netscape und in Word 97 nicht auftritt und in der Schriftdatei alle Zeichenabstande korrekt sind.

Internet-Explorer 5.0: IE 5.0 stellt die Seitemit der Schrift "Kirillica Nova Unicode" leider nicht korrekt dar. Besonders davon betroffen sind die Akzentzeichen, die nur als Quadrate dargestellt werden, auch verwendet der IE 5.0 für manche Buchstaben unerklärlicherweise einen anderen Font. Versuche haben ergeben, dass dieses Verhalten wahrscheinlich dadurch verursacht wird, dass "Kirillica Nova Unicode" nicht die Zeichen des lateinischen Standardzeichensatzes enthält. Wieso davon allerdings die kyrillischen Zeichen betroffen werden, muss das Geheimnis der Programmierer von Microsoft bleiben. Eine korrekte Darstellung des Kanon Pokajanen erhält man in IE5 bei Verwendung der 3. Version der Kanon-Seite (ohne Font-Spezifizierung) und der Einstellung der Schrift "Arial Unicode MS" (ist in Office 2000 enthalten) in den Voreinstellungen des Browsers als Standardschrift für "latin-based scripts". (Frage an Microsoft: Was hat altkyrillisch mit "latin-based" zu tun?)

Technische Informationen

Im "benutzerdefinierten Bereich" der Schrift "Kirillica Nova Unicode" sind einige Zeichen enthalten, die nicht im UNICODE-Standard vorhanden sind. Es handelt sich hier insbesondere um kombinierte akzentuierte Zeichen und Zeichen mit mehrfachen Diakritika (z. B. Dasia und Akut). Der UNICODE-Standard sieht eigentlich vor, dass in der Textkodierung diese Zeichen getrennt als Zeichenfolge vorhanden sind, z. B. a' für ein a mit Akut, und dann vom Anwendungsprogramm, das den Text darstellt, durch das entsprechende kombinierte Zeichen ersetzt werden. Wie diese Ersetzung zu geschehen hat, ist in einer "TTO"-Tabelle in der Schriftdatei festgelegt. Soweit die Theorie. In der Praxis habe ich aber noch nie ein Anwendungsprogramm gesehen, das die TTO-Tabellen der Schriftdatei lesen und dann die entsprechende Darstellung richtig vornehmen würde (außer vielleicht neuerdings IE 5.0 oder Word 2000?). Deshalb sind in der Schrift "Kirillica Nova Unicode" diese kombinierten Zeichen in den "benutzerdefinierten Bereich" verlegt. In der 1. Version der HTML-Datei des Kanon Pokajanen sind diese Zeichen nicht entsprechend dem UNICODE-Standard, sondern so wie in der Schriftdatei von "Kirillica Nova Unicode" codiert. Das hat nun den Nachteil, dass dieses HTML-Dokument nur mit diesem speziellen Font und nicht mit jeder UNICODE-Schrift, die altslavische Zeichen enthält, korrekt dargestellt wird. In den Versionen 2 und 3 der Webseite des Kanon Pokajanen sind die Zeichen nach Unicode kodiert, was eine Darstellung mit jedem Font, der altslavische Zeichen enthält, möglich macht, wobei aber meistens die diakritischen Zeichen nicht genau auf dem Grundbuchstaben plaziert werden.

Download:
Kirillica Nova Unicode

Info:
Kirillica Nova Unicode

Testseiten:
Kanon Pokajanen 1 (angepaßt)
Kanon Pokajanen 2 (Unicode 2.0)
Kanon Pokajanen 3 (Unicode 2.0)


© Christoph Singer 1998. Letzte Aktualisierung am 9. April 2000.

Startseite der Slovo Site: www.slovo.info.
URL dieser Seite: http://www.slovo.info/akstest.htm.
E-Mail: webmaster AT slovo.info.
Discussion board: http://www.slovo.info/discussion.html.