Geschütztes Leerzeichen

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Ein geschütztes Leerzeichen[1] (englisch no-break space, auch non-breaking space, abgekürzt NBSP, manchmal auch als Dauerleerzeichen bezeichnet) verhindert einen automatischen Zeilenumbruch an der Position des Leerzeichens, der die Leserlichkeit verschlechtern und den Lesefluss stören könnte. Das Zeichen entstand aus den Regeln zum Zeilensatz im Schriftsatz, als diese für die digitale Typografie umgesetzt wurden.

Digitale Typografie[Bearbeiten | Quelltext bearbeiten]

Das geschützte Leerzeichen wird in HTML-Quelltexten mit dem Code   erzeugt. Im Unicode-Zeichensatz ist es an Position U+00A0 im Unicodeblock Lateinisch-1, Ergänzung zu finden.

Schmales geschütztes Leerzeichen[Bearbeiten | Quelltext bearbeiten]

Neben dem gewöhnlichen geschützten Leerzeichen gibt es im Unicode-Standard auch noch ein schmales geschütztes Leerzeichen (englisch narrow no-break space, abgekürzt NNBSP, Position U+202F,  ). In der DIN 5008 (Ausgabe 2020)[2] und in der DIN 5009[1] wird dies als Schmal-Leerzeichen bezeichnet. Für das nicht geschützte schmale Leerzeichen wird in der DIN 5008 keine Verwendung angegeben.

Weitere geschützte Leerzeichen [Bearbeiten | Quelltext bearbeiten]

Darüber hinaus gibt es ein geschütztes Leerzeichen ohne eigene Breite (englisch zero width no-break space, Position U+FEFF, ), das Ziffernleerzeichen[3] (englisch figure space, Position U+2007) und den mongolischen Vokalseparator (englisch mongolian vowel separator, abgekürzt MVS, Position U+180E), der weitgehend dem NNBSP entspricht, aber auch noch Einfluss auf die Gestalt der anliegenden Buchstaben haben kann. Das Umbruchverhalten wird im Unicode-Zeilenumbruch-Algorithmus beschrieben.

Kodierung[Bearbeiten | Quelltext bearbeiten]

Die geschützten Leerzeichen werden folgendermaßen definiert und kodiert:

Internationaler Zeichenkodierungsstandard Unicode
und Kodierung im Internet-Dokumentformat HTML sowie in UTF-8
Zeichen
(200 %)
Unicode Bezeichnung HTML UTF-8
Position Bezeichnung hexadezimal dezimal benannt[4] hexadezimal
  U+00A0 no-break space geschütztes Leerzeichen       C2 A0
U+202F narrow no-break space schmales geschütztes Leerzeichen     E2 80 AF
 U+FEFF zero width no-break space geschütztes Leerzeichen ohne eigene Breite1   EF BB BF
U+2007 figure space Ziffernleerzeichen2       E2 80 87
U+180E Mongolian vowel separator Trenner für mongolische Vokale ᠎ ᠎ E1 A0 8E
U+2060 word joiner geschütztes Leerzeichen ohne eigene Breite3 ⁠ ⁠ ⁠ E2 81 A0
1 
Veraltet, ersetzt durch U+2060 word joiner zur Unterscheidung von BOM
2 
Leerraum garantiert gleiche Breite wie eine Tabellenziffer gleicher Schrift
3 
ersetzt U+FEFF BOM in dessen alternativer Verwendung als Wortverbinder, welches seit Unicode 3.2 nicht mehr verwendet werden sollte.

Im ASCII-Zeichensatz aus dem Jahr 1963 sind keine geschützten Leerzeichen enthalten, weshalb viele ältere Computersysteme sie nicht darstellen konnten. Fast alle modernen Computer verwenden mindestens den im Jahr 1987 eingeführten ISO-8859-Standard und können daher zumindest das geschützte Leerzeichen U+00A0 problemlos verarbeiten und darstellen.

Anwendungsbeispiele[Bearbeiten | Quelltext bearbeiten]

  • Zwischen Anrede und Namen einer Person: „Prof. Dr. Beispielhausen“ – Prof. Dr. Beispielhausen (  bzw.  ) Zumindest würde man die Amtsbezeichnung „Prof.“ und den akademischen Grad „Dr.“ zusammenhalten wollen; genauso einen einzelnen akademischen Grad „Dr.“ mit dem Nachnamen. Zwischen der Gruppe von mehreren akademischen Graden einerseits und dem Nachnamen andererseits kann eine Trennung aber sehr sinnvoll sein; zu lange zusammenhängende Konstrukte sind zu vermeiden, und es würde ansonsten mitten im Nachnamen getrennt werden. Andernfalls entsteht eine übermäßige Lücke am rechten Rand oder Blocksatz mit riesigen Wortabständen.
  • Zwischen Zahlenwert und Maßeinheit: „44 mm“ – 44 mm.
  • Bei Schreibweise einer Zahl mit den Zahlwörtern Million und Milliarde: 23 Millionen – 23 Millionen.[5]
  • In Abkürzungen („z. B.“ – z. B.) sowie als Tausendertrennzeichen. In beiden Fällen sollte eigentlich besser ein „schmales geschütztes Leerzeichen“ („z. B.“ – z. B.) stehen. Aus Kompatibilitätsgründen wird jedoch in der Regel darauf verzichtet, da dieses Zeichen nicht von allen Webbrowsern und Schriftarten unterstützt wird. Häufig wird der Zwischenraum stattdessen auch ganz weggelassen, was jedoch gemäß DIN 5008 nicht korrekt ist.
  • Bei Sonderzeichen: „3 + 5“ – 3 + 5 und in bestimmten Konstellationen von Satzzeichen wie „Beispiel –“ – Beispiel –.
  • Weitere Beispiele:
    • „St. Ulrich“ – St. Ulrich
    • „Hl. Afra“ – Hl. Afra
    • „Ludwig II.“ – Ludwig II.
    • „Version 3“ – Version 3
    • „14. Jahrhundert“ – 14. Jahrhundert
    • „30. Juni“ – 30. Juni
    • „B 17“ – B 17
    • „S. 18 ff.“ – S. 18 ff.
    • „A 96“ – A 96.

Darstellung auf Computersystemen[Bearbeiten | Quelltext bearbeiten]

Betriebssystem, Applikation
oder Standard1
Geschütztes Leerzeichen ( ) Schmales geschütztes Leerzeichen ( )
Windows GUI (CP1252, Standard) Alt+01602 Alt+82392
TUI (CP850, Eingabeaufforderung) Alt+2552
macOS +Leertaste
X11 unter z. B. Linux oder BSD Compose, Leertaste, Leertaste
AmigaOS Alt+Leertaste
Deutsche Standard-Tastaturbelegung E1
(Standard für Deutschland und Österreich)
Alt Gr+Leertaste Alt Gr+C
Tastaturbelegung T2
(Älterer Standard für Deutschland und Österreich)
Alt Gr+Leertaste Gruppenumschaltung:

sofern vorhanden: , Leertaste
oder Alt Gr+, Leertaste

AbiWord Strg++Leertaste
Emacs Strg+X,8,Leertaste Strg+X,8,Eingabetaste,2,0,2,F,Eingabetaste
Adobe FrameMaker Strg+Leertaste
LibreOffice-Varianten Strg+Leertaste (vor OOo 3)

Strg++Leertaste (ab OOo 3)

Microsoft Word Tastenkombination Strg++Leertaste
Unicode-Eingabe5 A, 0, Alt+C bzw. A, 0, Alt+X 2, 0, 2, F, Alt+C bzw. 2, 0, 2, F, Alt+X
Neo Mod3++Leertaste oder

Mod3+, Leertaste, Leertaste3

Mod3+Mod4+Leertaste4
LaTeX / plain TeX immer ~ \thinspace6 7
zusätzlich mit LaTeX
außerhalb von Formeln
\,8
zusätzlich in Formeln \mkern\thinmuskip9
Konstruktionen allgemein Inhalt von \hbox{…} oder in LaTeX \mbox{…} wird nicht umbrochen, inklusive Leerzeichen;

noch besser ist \nolbreaks{…} aus dem Paket nolbreaks, damit alle Wortzwischenräume einer Zeile übereinstimmen

Konstruktion in Formeln Inhalt von {…} wird nicht umbrochen,10 inklusive Leerzeichen
Vim Digraph11 Strg+K, +NS
Unicode-Eingabe Strg+V, U, 0, 0, A, 0 Strg+V, U, 2, 0, 2, F
WordPerfect Strg+Leertaste
HTML HTML-Entität  
Konstruktion Leerzeichen in Elementen mit CSS-Eigenschaft

white-space:nowrap

werden nicht umbrochen
XML/XHTML dezimal    
hexadezimal    
ISO 8859-1 (Latin-1) (dezimal) 160
Unicode (hexadezimal) U+00A0 U+202F
1 
Viele Betriebssysteme und Applikationen bieten darüber hinaus auch spezifische Möglichkeiten, ein Unicode-Zeichen direkt einzugeben.
2 
Zahleneingabe über den Ziffernblock. Alt-Taste währenddessen permanent gedrückt halten.
3 
Bei deutscher QWERTZ-Tastaturbelegung entsprechen die Mod3-Tasten der Feststell- bzw. Rautetaste. Die Compose-Unterstützung (Mod3+Tab bzw. ♫) muss bei einigen Systemen nachinstalliert werden.
4 
Bei deutscher QWERTZ-Tastaturbelegung entsprechen die Mod3-Tasten der Feststell- bzw. Rautetaste. Die Mod4-Tasten entsprechen der Größer-/Kleiner- (>/<) bzw. Alt-Gr-Taste.
5 
Eingeben von Unicode-Zeichen über die Tastatur (Memento vom 16. Dezember 2014 im Internet Archive): In Dialogfeldern ist die Tastenkombination ALT+X
; siehe auch: Das Unicode-Zeichen für den angegebenen Unicode-Zeichencode (hexadezimal), Verwenden der Tastatur zum Einfügen eines Unicode-Zeichencodes in ein Dokument und Einfügen von Unicode-Zeichen.
6 
Johannes Braams und andere: The LaTeX 2εいぷしろん Sources. (PDF, 2,3 MB;) 27. Juni 2011, S. 65.
7 
D. E. Knuth: The TeXbook. Addison-Wesley, Reading 1984 und später, S. 352.
8 
\, ist im Wesentlichen als \ifmmode\mskip\thinmuskip\else\thinspace\fi definiert, siehe The LaTeX 2εいぷしろん Sources S. 65. Innerhalb einer Formel wird daraus ein \mskip, was glue erzeugt und daher einen Zeilenumbruch erlaubt – The TeXbook, S. 290 und Kapitel 12. Andernfalls resultiert \thinspace, s. o.
9 
The TeXbook S. 280 und 167 f. – allerdings völlig unüblich.
10 
The TeXbook, S. 173.
11 
Digraph-Unterstützung im Einfügemodus; orientiert an RFC 1345 – Character Mnemonics & Character Sets. 1992 (englisch). Dokumentation. vimdoc.sourceforge.net

Symbol[Bearbeiten | Quelltext bearbeiten]

In Microsoft Word wird für das geschützte Leerzeichen als Formatierungssymbol das Gradzeichen (°) verwendet.[6]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b Benennung laut DIN 5009:2022-06 Beiblatt 1, Tabelle 15 „Allgemein verwendete Leerzeichen“
  2. DIN 5008:2020-03, Anhang F „Typografisch anspruchsvolle Textwerke“, Abschnitt F.3 „Schmal-Leerzeichen“ (Seite 110)
  3. Benennung laut DIN 5009:2022-06 Beiblatt 1, Tabelle 16 „Spezielle Leerzeichen und sonstige nicht sichtbare Zeichen“
  4. Web Hypertext Application Technology Working Group: HTML Standard / 13.5 Named character references. 11. April 2024; (englisch).
  5. Schreibweise von Zahlen in der Wikipedia
  6. Nützliche Tasten-Kombination. Geschützte Leerzeichen in Word-Dokumenten. In: Augsburger Allgemeine, 21. November 2016; abgerufen am 18. Juni 2021.