ISO-8859 Zeichensatz-Familie



• Die folgenden 96 Zeichen 160‑255 (0xA0-0xFF) sind in jedem der 16 Zeichensätze dieser Familie unterschiedlich festgelegt.
Wenn ein Programm derartige Zeichen darstellen soll, dann muss es vorher die genaue Angabe des Zeichensatzes erhalten = die Information, welche Verweis-Tabelle bei der Übersetzung der Bitmuster in Zeichen anzuwenden ist.

• Ihr Browser zeigt die Zeichen unter realen Bedingungen an:
Wenn ein Zeichen nicht angezeigt werden kann, dann sehen sie ein � Symbol (Replacement Character, Unicode U+FFFD): In diesem Fall enthält die von ihrem Browser verwendete → Schrift-Familie kein Symbol für das fehlende Zeichen.

ISO-8859-1 (Latin-1)

Vorteil: Dateien brauchen etwas weniger Speicherplatz, nur genau 1 Byte pro Zeichen. Das gilt allerdings nur für rohen Text (Text-Editor-Programme), denn die Dateien typischer Textverarbeitungs-Programme (z.B. LibreOfice-Writer, MS-Word) speichern zusätzlich zum Rohtext eine große Menge weiterer Daten (Layout, Formatierung, Schriften, Gliederung, usw.).

Nachteil: Beschränkung auf die 96 druckbaren ASCII-Zeichen + die 96 oben angezeigten nationalen Sonderzeichen. Die zusätzliche Verwendung anderer Zeichen (slawische, griechische, kyrilische, ...) ist je nach Software nicht oder nur umständlich möglich.
Tipp: Verwenden sie nur mehr den global eindeutigen → Unicode.

UTF-8

Die Verwendung mehrerer Bytes pro Zeichen vergrößert den erforderlichen Speicherplatz für Text-Dokumente. Daher wurden (UTF)-Methoden entwickelt, um Unicode in möglichst kompakter Form zu verwenden. Der wichtigste Standard UTF‑8 verwendet für die weltweit meist-verwendeten Zeichen des ASCII‑Code nur je 1 Byte. Für nationale Sonderzeichen (z.B. ÄÖÜäöüß.) werden je 2 Byte verwendet, für noch seltener verwendete Zeichen 3 (z.B. €) oder 4 Byte.

Daher brauchen deutsche Text-Dokumente mit UTF‑8 nur wenig mehr als 1 Byte pro Zeichen, dafür kann man im gleichen Text problemlos auch slawische, griechische, kyrillische oder sogar chinesische Zeichen verwenden (↗ Beispiel: Städte-Namen).


Die Mini-Webseite ist im angegebenen Zeichensatz codiert: Ihr HTML-Quelltext enthält dieses Meta-Element:
<meta http-equiv="Content-Type" content="text/html; charset=iso‑8859‑1" />