Sonderzeichen (und deutsche Umlaute)

ZeichenUnicode-NrHTMLJavascript
ÄU+00C4 ÄÄÄ \u00C4
ÖU+00D6 ÖÖÖ \u00D6
ÜU+00DC ÜÜÜ \u00DC
äU+00E4 äää \u00E4
öU+00F6 ööö \u00F6
üU+00FC üüü \u00FC
ßU+00DF ßßß \u00DF
U+20AC €€€ \u20AC
 
LFU+000A <br/> \n
"U+0022 &#x22;&#34;&quot; \"
&U+0026 &#x26;&#38;&amp; &
<U+003C &#x3C;&#60;&lt; <
>U+003E &#x3E;&#62;&gt; >
\U+005C\\\

• In → HTML hat man meist die Auswahl unter 3 alternativen Versionen der Codierung: Hexadezimal, dezimal oder mit dem Zeichen-Namen. Jede Version beginnt mit & und endet mit einem ; Strichpunkt.

• In → Javascript wird das \ Backslash-Zeichen zur Maskierung des unmittelbar folgenden Zeichens verwendet. Wenn man in einem Javascript-String \u verwendet, dann werden die folgenden 4 Zeichen als hexadezimaler Unicode interpretiert.

Maskierung


Wenn man die jeweiligen Sonderzeichen in einem Text (String) anzeigen will, dann braucht man eine eigene Konstruktion (Maskierung), damit das Zeichen nicht als Steuerzeichen verwendet sondern angezeigt wird.


Maskierung in HTML:
Der Quelltext (Code) für ein Sonderzeichen beginnt mit dem Zeichen &
Danach folgt der Name des Zeichens oder seine Unicode-Nummer.
Zuletzt folgt ein abschließender ; Strichpunkt.

SelfHTML: Zeichenvorrat, W3Schools: HTML-Entities


Der Backslash ist in HTML kein Sonderzeichen und wird daher im Text jeder Webseite direkt angezeigt.
Umgekehrt sind die Zeichen <> in Javascript keine Sonderzeichen, man kann sie daher in jeden Text (String) direkt einsetzen.

HTML-Beispiele


Man kann ausdrücklich den Zeichensatz → ISO‑8859‑1 oder besser → ISO‑8859‑15 zur Interpretation der Zeichen angeben, z.B. mit diesem <meta>-Element:
<meta http-equiv="Content-Type" content="text/html; charset=iso‑8859‑15" />

Nur in diesem Fall kann man die deutschen Umlaute im HTML-Quelltext verwenden:, z.B.
<h1>Eine große grüne Überschrift</h1>
Davon wird jedoch abgeraten: Diese Variante ist nicht zuverlässig, weil manche Browser die Anweisungen von <meta>-Elementen ignorieren.
Das €-Zeichen ist nur in ISO‑8859‑15 definiert.

Bei Webseiten genügt es nicht, dass sie am eigenen PC korrekt angezeigt werden: Sie müssen mit jedem Betriebssystem und Browser funktionieren, insbesondere auch in Regionen, wo deutsche Sonderzeichen sonst nicht verwendet werden.

Ein Programm (App) kann nur jene Zeichen anzeigen, die in der verwendeten → Schrift-Familie definiert wurden. Die meisten als Standard konfigurierten Schriften können mindestens die ersten 65000 Unicode-Zeichen anzeigen. Das gilt jedoch nicht für exotische Sonderschriften, die oft nicht einmal die deutschen Umlaute enthalten.



Jedes moderne Programm (Textverarbeitung, Web-Editor, ...) beherrscht → Unicode und UTF‑-8

Vorteil: Man kann dann ohne weitere Maßnahmen alle (derzeit ∼2 Mio) Unicode-Zeichen im Text verwenden. (Beispiel ↗ Städte-Text)


Mit diesem Javascript-Quelltext wird ein 2zeiliges Meldungs-Fenster angezeigt:
var txt = "Eine gro\u00DFe ";
txt += "gr\u00FCne \u00DCberschrift";
txt += "\nNeue Zeile";
alert(txt);

• Live-Test mit diesem Link


Mit dieser Javascript-Anweisung wird der Text im links angezeigten HTML-Element id="uml" Live geändert. In der Anweisung wird für das Unicode-Zeichen die Javascript-Codierung verwendet, nicht in der HTML-Codierung:
var n = document.getElementById('uml');
n.firstChild.nodeValue = "\u00D6";
Der HTML-Quelltext bleibt dabei unverändert, nur die angezeigte Webseite ändert sich !

Live-Test mit diesem Link