„Trennzeichen“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
verschoben
Form, Z
 
(8 dazwischenliegende Versionen von 5 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Dieser Artikel|beschreibt die Verwendung von Trennzeichen – speziell in Computern. Eines davon – und das alltäglichste – ist das [[Leerzeichen]].}}
{{Dieser Artikel|beschreibt die Verwendung von Trennzeichen – speziell in Computern. Eines davon – und das alltäglichste – ist das [[Leerzeichen]].}}


'''Trennzeichen''', {{lang|en|'''delimiter'''}} ({{enS}} für ‚Abgrenzer‘), oder '''Separatoren''' werden zur Abgrenzung einzelner Elemente in Daten verwendet.<ref>{{Internetquelle |url=http://www.its.bldrdoc.gov/fs-1037/dir-011/_1544.htm |titel=Definition: delimiter |datum=1996-08-23 |zugriff=2010-09-25}}</ref> Trennzeichen sind spezielle [[Funktionszeichen]]. Neben dem Trennzeichen für ''Elemente'' werden auch Zeichen zum Trennen von ''Segmenten'' oder ''Zeilen'' verwendet.
'''Trennzeichen''', '''Delimiter''' ({{enS}} für ‚Abgrenzer‘) oder '''Separatoren''' werden zur Abgrenzung einzelner Elemente in Daten verwendet.<ref>{{Internetquelle |url=https://www.its.bldrdoc.gov/fs-1037/dir-011/_1544.htm |titel=Definition: delimiter |datum=1996-08-23 |zugriff=2010-09-25}}</ref> Trennzeichen sind spezielle [[Funktionszeichen]]. Neben dem Trennzeichen für ''Elemente'' werden auch Zeichen zum Trennen von ''Segmenten'' oder ''Zeilen'' verwendet.


== Beispiele ==
== Beispiele ==
Zeile 8: Zeile 8:
** mittels speziellem [[Leerzeichen]] wie »&nbsp;« (reguläres Leerzeichen) bzw. »&#8200;« (Zifferngruppierungszeichen), »&thinsp;« (schmales Leerzeichen), »&#8202;« (Haarspalt) etc. oder
** mittels speziellem [[Leerzeichen]] wie »&nbsp;« (reguläres Leerzeichen) bzw. »&#8200;« (Zifferngruppierungszeichen), »&thinsp;« (schmales Leerzeichen), »&#8202;« (Haarspalt) etc. oder
** [[Punkt (Satzzeichen)#Punkte als Gliederungszeichen|Punkt]] ».« bzw. [[Komma]] »,« oder
** [[Punkt (Satzzeichen)#Punkte als Gliederungszeichen|Punkt]] ».« bzw. [[Komma]] »,« oder
** [[Prime (Typografie)|Hochstrich]] »′« bzw. [[Apostroph|Apostroph-Ersatzzeichen]] »'« (einfaches gerades [[Anführungszeichen]]).
** [[Prime (Typografie)|Hochstrich]] »′« bzw. [[Apostroph]]-Ersatzzeichen »'« (einfaches gerades [[Anführungszeichen]]).
* [[Silbentrennungszeichen]]
* [[Silbentrennungszeichen]]
* Zeilen in [[Textdatei]]en werden in [[Unixoides System|unixoiden Betriebssystemen]] durch das Steuerzeichen ''[[line feed]]'' (LF) und unter Windows durch die Steuerzeichen-[[Reihenfolge|Sequenz]] von ''[[carriage return]]'' und ''line feed'' (CRLF) voneinander getrennt; beim alten Mac&nbsp;OS „Classic“ wurde nur ein ''carriage return'' (CR) verwendet. (''siehe&nbsp;auch:&nbsp;[[Zeilenumbruch]]'')
* Zeilen in [[Textdatei]]en werden in [[Unixoides System|unixoiden Betriebssystemen]] durch das [[Steuerzeichen]] ''[[line feed]]'' (LF) und unter Windows durch die Steuerzeichen-[[Reihenfolge|Sequenz]] von ''[[carriage return]]'' und ''line feed'' (CRLF) voneinander getrennt; beim alten Mac&nbsp;OS „Classic“ wurde nur ein ''carriage return'' (CR) verwendet (siehe auch: [[Zeilenumbruch]]).
* Bei [[CSV (Dateiformat)|CSV-Dateien]] werden Elemente meist mit Komma »,« oder [[Semikolon]] »;« aber auch mittels Horizontal-[[Tabulatorzeichen]] (TSV) getrennt; mitunter werden die Elementinhalte in gerade Anführungszeichen gesetzt. Das Segment-Trennzeichen ist hier i.&#x202f;d.&#x202f;R.&thinsp;der Zeilenumbruch.
* Bei [[Extensible Markup Language|XML]] und [[Hypertext Markup Language|HTML]] gibt es keine zusätzlichen Trennzeichen, die Elemente werden durch Tags voneinander getrennt.
* Zur Trennung von Verzeichnissen in [[Pfadname|Pfadangaben]] wird bei unixoiden Betriebssystemen der [[Schrägstrich]] »/« (''slash'') und unter Windows der [[umgekehrter Schrägstrich]] »\« (''backslash'') verwendet (siehe auch: [[₩]]).
* [[Zeichenkette]]n (Strings) werden durch doppelte oder einfache gerade Anführungszeichen begrenzt: »"« bzw. »'«
* Bei [[EDIFACT]]-Nachrichten ist normalerweise das Apostroph-Ersatzzeichen »'« das Segment-Trennzeichen.
* Bei [[CSV (Dateiformat)|CSV-Dateien]] werden Elemente meist mit [[Komma]] »,« oder [[Semikolon]] »;« aber auch mittels Horizontal-[[Tabulatorzeichen]] (TSV) getrennt; mitunter werden die Elementinhalte in gerade Anführungszeichen gesetzt. Das Segment-Trennzeichen ist hier i.&#x202f;d.&#x202f;R.&thinsp;der Zeilenumbruch.
* Um das Problem mit Trennzeichen innerhalb von Textfedern zu umgehen kann mit Text Qualifiern wie z.&nbsp;B. dem doppelten Hochkomma (") gearbeitet werden. Diese werden dann mit dem Textqualifier Zeichen eingeschlossen z.&nbsp;B. "Beispieltext: 123,456-789;0". Mögliche Trennzeichen innerhalb des Textqualifier Zeichens dürfen nicht berücksichtigt werden.
* Zur Trennung von Verzeichnissen in [[Pfadname|Pfadangaben]] wird bei unixoiden Betriebssystemen der [[Schrägstrich]] »/« (''slash'') und unter Windows der [[umgekehrter Schrägstrich]] »\« (''backslash'') verwendet (''siehe auch: [[₩]]'').
* Noch besser dafür eignen sich die ASCII-Zeichen US (Char 31, Unit Separator), RS (Char 30, Record Separator), GS (Char 29, Group Separator), und FS (Char 28, File Separator).
* Bei [[EDIFACT|EDIFACT-Nachrichten]] ist normalerweise das Apostroph-Ersatzzeichen »'« das Segment-Trennzeichen.


== Separatoren in Programmiersprachen ==
== Separatoren in Programmiersprachen ==
In vielen Programmiersprachen werden Separatoren in zwei Aspekten verwendet: Zur Abgrenzung von [[Schlüsselwort (Programmierung)|Schlüsselwörtern]] sind oft [[Leerraum|Leerräume]] und [[Kommentar (Programmierung)|Kommentare]] zugelassen. Aufeinanderfolgende [[Anweisung (Programmierung)|Anweisungen]] werden häufig durch ein Semikolon <code>;</code> voneinander getrennt.
In vielen Programmiersprachen werden Separatoren in zwei Aspekten verwendet: Zur Abgrenzung von [[Schlüsselwort (Programmierung)|Schlüsselwörtern]] sind oft [[Leerraum|Leerräume]] und [[Kommentar (Programmierung)|Kommentare]] zugelassen. Aufeinanderfolgende [[Anweisung (Programmierung)|Anweisungen]] werden häufig durch ein Semikolon <code>;</code> voneinander getrennt (z.&nbsp;B. in [[C (Programmiersprache)|C]], [[Java (Programmiersprache)|Java]], [[Pascal (Programmiersprache)|Pascal]], [[Rust (Programmiersprache)|Rust]]), seltener durch einen Doppelpunkt <code>:</code> (wie in [[BASIC]]). Manche erfordern jedoch einen Zeilenumbruch zur Trennung von Befehlen (üblicherweise [[Assemblersprache]]n).


== Alternative ==
== Alternative ==

Aktuelle Version vom 1. September 2021, 17:29 Uhr

Trennzeichen, Delimiter (englisch für ‚Abgrenzer‘) oder Separatoren werden zur Abgrenzung einzelner Elemente in Daten verwendet.[1] Trennzeichen sind spezielle Funktionszeichen. Neben dem Trennzeichen für Elemente werden auch Zeichen zum Trennen von Segmenten oder Zeilen verwendet.

Beispiele[Bearbeiten | Quelltext bearbeiten]

  • Dezimaltrennzeichen
  • Zifferngruppierung
    • mittels speziellem Leerzeichen wie » « (reguläres Leerzeichen) bzw. » « (Zifferngruppierungszeichen), » « (schmales Leerzeichen), » « (Haarspalt) etc. oder
    • Punkt ».« bzw. Komma »,« oder
    • Hochstrich »′« bzw. Apostroph-Ersatzzeichen »'« (einfaches gerades Anführungszeichen).
  • Silbentrennungszeichen
  • Zeilen in Textdateien werden in unixoiden Betriebssystemen durch das Steuerzeichen line feed (LF) und unter Windows durch die Steuerzeichen-Sequenz von carriage return und line feed (CRLF) voneinander getrennt; beim alten Mac OS „Classic“ wurde nur ein carriage return (CR) verwendet (siehe auch: Zeilenumbruch).
  • Bei CSV-Dateien werden Elemente meist mit Komma »,« oder Semikolon »;« aber auch mittels Horizontal-Tabulatorzeichen (TSV) getrennt; mitunter werden die Elementinhalte in gerade Anführungszeichen gesetzt. Das Segment-Trennzeichen ist hier i. d. R. der Zeilenumbruch.
  • Zur Trennung von Verzeichnissen in Pfadangaben wird bei unixoiden Betriebssystemen der Schrägstrich »/« (slash) und unter Windows der umgekehrter Schrägstrich »\« (backslash) verwendet (siehe auch: ).
  • Bei EDIFACT-Nachrichten ist normalerweise das Apostroph-Ersatzzeichen »'« das Segment-Trennzeichen.
  • Um das Problem mit Trennzeichen innerhalb von Textfedern zu umgehen kann mit Text Qualifiern wie z. B. dem doppelten Hochkomma (") gearbeitet werden. Diese werden dann mit dem Textqualifier Zeichen eingeschlossen z. B. "Beispieltext: 123,456-789;0". Mögliche Trennzeichen innerhalb des Textqualifier Zeichens dürfen nicht berücksichtigt werden.
  • Noch besser dafür eignen sich die ASCII-Zeichen US (Char 31, Unit Separator), RS (Char 30, Record Separator), GS (Char 29, Group Separator), und FS (Char 28, File Separator).

Separatoren in Programmiersprachen[Bearbeiten | Quelltext bearbeiten]

In vielen Programmiersprachen werden Separatoren in zwei Aspekten verwendet: Zur Abgrenzung von Schlüsselwörtern sind oft Leerräume und Kommentare zugelassen. Aufeinanderfolgende Anweisungen werden häufig durch ein Semikolon ; voneinander getrennt (z. B. in C, Java, Pascal, Rust), seltener durch einen Doppelpunkt : (wie in BASIC). Manche erfordern jedoch einen Zeilenumbruch zur Trennung von Befehlen (üblicherweise Assemblersprachen).

Alternative[Bearbeiten | Quelltext bearbeiten]

Alternativ zur Verwendung von Trennzeichen können Elemente auch durch ihre fest vorgeschriebene Position und ihre Länge unterschieden werden. Sollte der eigentliche Inhalt eines Elementes kürzer sein als für das Element vorgeschrieben, so wird das Element durch Füllzeichen – meist Nullen oder Leerzeichen – auf die richtige Länge aufgefüllt. Die Internationale Bankkontonummer (IBAN) ist beispielsweise so aufgebaut.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Definition: delimiter. 23. August 1996, abgerufen am 25. September 2010.