ASCII-Zeichensatz



Die Auswahl der Zeichen entspricht dem, was im Jahr 1963 in den USA für notwendig befunden wurde.

Die ersten 32 Zeichen (hexadezimal #00 - #1F) werden für 'nicht druckbare Steuerzeichen' verwendet. Sie sind hellgelb unterlegt.
Manche dieser Zeichen werden noch heute oft verwendet, z.B. das Zeichen #0A mit dem Namen LF und der Bedeutung 'Neue Zeile' (LineFeed).

Der ASCII-Zeichensatz ist als Teilmenge in den meisten anderen Zeichensätzen enthalten. Man verwendet ihn heute noch für Texte, die ohne weitere Maßnahmen global eindeutig sein müssen, z.B. für den Quelltext aller gängigen Programmiersprachen.



Wegen der eindeutigen Zuordnung ist es umgekehrt möglich, die Codenummer eines Zeichens zu erhalten.

Beispiel:
print asc('A');
Diese Anweisung sucht in der letzten Spalte der Verweis-Tabelle nach dem Zeichen A und gibt aus der gleichen Zeile eine ganze Zahl im Bereich 0‑127 zurück - in diesem Fall die Zahl 65

8-Bit Zeichensätze

In verschiedenen Regionen und von unterschiedlichen Unternehmen (IBM, Lotus, Microsoft, Apple, ...) wurde eine große Anzahl verschiedener 8‑Bit Zeichensätze definiert. Die meisten enthalten in den ersten 0‑127 Zeichen den ASCII‑Code als Untermenge, und danach im Bereich 128‑255 weitere nationale Sonderzeichen, z.B. die deutschen ÄÖÜäöüß.

Die wichtigsten 8-Bit Zeichensätze sind im Standard → ISO‑8859 festgelegt, z.B. der im deutschen Sprachraum noch heute oft verwendete Standard ISO-8859‑1 (Latin‑1).

UTF-8

Die Verwendung mehrerer Bytes pro Zeichen vergrößert den erforderlichen Speicherplatz für Text-Dokumente. Daher wurden (UTF)‑Methoden entwickelt, um Unicode in möglichst kompakter Form zu verwenden.

Der wichtigste Standard → UTF-8 verwendet für die weltweit meist-verwendeten Zeichen des ASCII-Code nur je 1 Byte. Für nationale Sonderzeichen (z.B. ÄÖÜäöüß) werden je 2 Byte verwendet, für noch seltener verwendete Zeichen (z.B. €) 3 Byte.
(Spezialseite → Umlaute in der Programmierung)

Daher brauchen deutsche Text-Dokumente mit UTF‑8 nur wenig mehr als 1 Byte pro Zeichen, dafür kann man im gleichen Text problemlos auch slawische, griechische, kyrillische oder sogar chinesische Zeichen verwenden (Beispiel: Städte-Namen).