Zeichensatz

Es gibt viele verschiedene Möglichkeiten, um Zeichen intern als Bit-Muster zu verwalten. Ein Zeichensatz legt die Bit-Muster für ausgewählte Zeichen fest.






Zeichensätze

Die wichtigsten Zeichensätze der modernen Informatik


Zeichen-Informationen für EntwicklerInnen


Live-Decodierung



Dieses Beispiel lässt sich dazu verwenden, um die Code-Nummern beliebiger Sonderzeichen zu ermitteln.


Zur Codierung wird der → Unicode-Zeichensatz verwendet.

Die Unicode-Nummern werden als dezimale und (darunter) als hexadezimale Zahlen angezeigt.
Darunter ist der hexadezimale → UTF‑8 Code angegeben.

Werte >=128 (Non-ASCII-Sonderzeichen) werden hellgelb unterlegt.

 
A
B
C
1
CodeNr
Zeichen
CodeNr
2
32
=ZEICHEN(A2)
=CODE(B2)
3
=A2+1
=ZEICHEN(A3)
=CODE(B3)
 
⇓⇓
⇓⇓
⇓⇓
98
=A97+1
=UNIZEICHEN(A98)
=UNICODE(B98)
 
⇓⇓
⇓⇓
⇓⇓
225
=A224+1
=UNIZEICHEN(A225)
=UNICODE(B225)

• Die Zeilen mit CodeNr 32-127 zeigen immer den → ASCII-Zeichensatz.

• Die Zeilen mit CodeNr 128-159 sind nicht zuverlässig und zeigen meist den firmen-eigenen Zeichensatz MS‑CP‑1252 an.

• Die Zeilen mit CodeNr 160-255 zeigen meistens den Zeichensatz → ISO‑8859‑15 (Latin) an.


• Einzige Voraussetzung ist, dass die verwendete → Schrift-Familie genügend viele Unicode-Zeichen anzeigen kann (das erkennt man am besten aus der Größe der Schrift-Dateien).