„Trennzeichen“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
LinkFA-Bot (Diskussion | Beiträge)
K Bot: Link GA -en
Form, Z
 
(45 dazwischenliegende Versionen von 26 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Dieser Artikel|beschreibt die Verwendung von Trennzeichen – speziell in Computern. Eines davon – und das alltäglichste – ist das [[Leerzeichen]].}}
Mit einem oder mehreren '''Trennzeichen''' oder '''Delimiter''' ([[Englische Sprache|engl.]] für ''Abgrenzer'') werden in einer [[Datei]], für die Verarbeitung durch ein passendes Programm, einzelne Datenwerte voneinander getrennt. Trennzeichen sind spezielle [[Funktionszeichen]]. Welches [[Zeichen]] die Funktion als Trennzeichen in einer Datei einnimmt, ist frei wählbar. Neben dem Trennzeichen für Elemente werden auch Zeichen zum Trennen von ''Segmenten'' oder ''Zeilen'' verwendet.


'''Trennzeichen''', '''Delimiter''' ({{enS}} für ‚Abgrenzer‘) oder '''Separatoren''' werden zur Abgrenzung einzelner Elemente in Daten verwendet.<ref>{{Internetquelle |url=https://www.its.bldrdoc.gov/fs-1037/dir-011/_1544.htm |titel=Definition: delimiter |datum=1996-08-23 |zugriff=2010-09-25}}</ref> Trennzeichen sind spezielle [[Funktionszeichen]]. Neben dem Trennzeichen für ''Elemente'' werden auch Zeichen zum Trennen von ''Segmenten'' oder ''Zeilen'' verwendet.
Bei [[Extensible Markup Language|XML]] und [[Hypertext Markup Language|HTML]] gibt es keine Trennzeichen, die Elemente werden durch Tags voneinander getrennt.


== Beispiele ==
Alternativ zur Verwendung von Trennzeichen können Elemente in einer Datei auch durch ihre fest vorgeschriebene Position in der Datei und ihre Länge unterschieden werden. Sollte der eigentliche Inhalt eines Elementes kürzer sein als für das Element vorgeschrieben, so wird das Element durch Füllzeichen, meist [[Null]]en oder [[Leerzeichen]], auf die richtige Länge aufgefüllt.
* [[Dezimaltrennzeichen]]
* [[Zifferngruppierung]]
** mittels speziellem [[Leerzeichen]] wie »&nbsp;« (reguläres Leerzeichen) bzw. »&#8200;« (Zifferngruppierungszeichen), »&thinsp;« (schmales Leerzeichen), »&#8202;« (Haarspalt) etc. oder
** [[Punkt (Satzzeichen)#Punkte als Gliederungszeichen|Punkt]] ».« bzw. [[Komma]] »,« oder
** [[Prime (Typografie)|Hochstrich]] »′« bzw. [[Apostroph]]-Ersatzzeichen »'« (einfaches gerades [[Anführungszeichen]]).
* [[Silbentrennungszeichen]]
* Zeilen in [[Textdatei]]en werden in [[Unixoides System|unixoiden Betriebssystemen]] durch das [[Steuerzeichen]] ''[[line feed]]'' (LF) und unter Windows durch die Steuerzeichen-[[Reihenfolge|Sequenz]] von ''[[carriage return]]'' und ''line feed'' (CRLF) voneinander getrennt; beim alten Mac&nbsp;OS „Classic“ wurde nur ein ''carriage return'' (CR) verwendet (siehe auch: [[Zeilenumbruch]]).
* Bei [[CSV (Dateiformat)|CSV-Dateien]] werden Elemente meist mit Komma »,« oder [[Semikolon]] »;« aber auch mittels Horizontal-[[Tabulatorzeichen]] (TSV) getrennt; mitunter werden die Elementinhalte in gerade Anführungszeichen gesetzt. Das Segment-Trennzeichen ist hier i.&#x202f;d.&#x202f;R.&thinsp;der Zeilenumbruch.
* Zur Trennung von Verzeichnissen in [[Pfadname|Pfadangaben]] wird bei unixoiden Betriebssystemen der [[Schrägstrich]] »/« (''slash'') und unter Windows der [[umgekehrter Schrägstrich]] »\« (''backslash'') verwendet (siehe auch: [[₩]]).
* Bei [[EDIFACT]]-Nachrichten ist normalerweise das Apostroph-Ersatzzeichen »'« das Segment-Trennzeichen.
* Um das Problem mit Trennzeichen innerhalb von Textfedern zu umgehen kann mit Text Qualifiern wie z.&nbsp;B. dem doppelten Hochkomma (") gearbeitet werden. Diese werden dann mit dem Textqualifier Zeichen eingeschlossen z.&nbsp;B. "Beispieltext: 123,456-789;0". Mögliche Trennzeichen innerhalb des Textqualifier Zeichens dürfen nicht berücksichtigt werden.
* Noch besser dafür eignen sich die ASCII-Zeichen US (Char 31, Unit Separator), RS (Char 30, Record Separator), GS (Char 29, Group Separator), und FS (Char 28, File Separator).


== Separatoren in Programmiersprachen ==
Im folgenden Text werden [[Semikolon]]s als Delimiter zwischen den Zahlen verwendet:
In vielen Programmiersprachen werden Separatoren in zwei Aspekten verwendet: Zur Abgrenzung von [[Schlüsselwort (Programmierung)|Schlüsselwörtern]] sind oft [[Leerraum|Leerräume]] und [[Kommentar (Programmierung)|Kommentare]] zugelassen. Aufeinanderfolgende [[Anweisung (Programmierung)|Anweisungen]] werden häufig durch ein Semikolon <code>;</code> voneinander getrennt (z.&nbsp;B. in [[C (Programmiersprache)|C]], [[Java (Programmiersprache)|Java]], [[Pascal (Programmiersprache)|Pascal]], [[Rust (Programmiersprache)|Rust]]), seltener durch einen Doppelpunkt <code>:</code> (wie in [[BASIC]]). Manche erfordern jedoch einen Zeilenumbruch zur Trennung von Befehlen (üblicherweise [[Assemblersprache]]n).
123;234;123;3454353;3453;


== Beispiele ==
== Alternative ==
Alternativ zur Verwendung von Trennzeichen können Elemente auch durch ihre fest vorgeschriebene ''Position'' und ihre ''Länge'' unterschieden werden. Sollte der eigentliche Inhalt eines Elementes kürzer sein als für das Element vorgeschrieben, so wird das Element durch Füllzeichen –&nbsp;meist [[Null]]en oder [[Leerzeichen]]&nbsp;– auf die richtige Länge aufgefüllt. Die [[Internationale Bankkontonummer]] (IBAN) ist beispielsweise so aufgebaut.
* Bei [[EDIFACT|EDIFACT-Nachrichten]] ist normalerweise das [[Apostroph|Hochkomma]] (') das Segment-Trennzeichen.
* Bei [[CSV (Dateiformat)|CSV-Dateien]] werden Elemente oft mit [[Semikolon]] (;) getrennt, das Segment-Trennzeichen ist hier meist der [[Zeilenumbruch]].


== Siehe auch ==
== Siehe auch ==
* [[Bindehemmer]]
* [[Umgekehrter Schrägstrich]]
* [[₩]]
* [[ASCII]]


== Einzelnachweise ==
[[Kategorie:Beschreibungssprache]]
<references />
[[Kategorie:Zeichenkodierung]]


[[Kategorie:Zeichenkodierung]]
[[en:Delimiter]]
[[fr:Séparateur (informatique)]]
[[pl:Separator (informatyka)]]
[[uk:Розділювальний символ]]

Aktuelle Version vom 1. September 2021, 17:29 Uhr

Trennzeichen, Delimiter (englisch für ‚Abgrenzer‘) oder Separatoren werden zur Abgrenzung einzelner Elemente in Daten verwendet.[1] Trennzeichen sind spezielle Funktionszeichen. Neben dem Trennzeichen für Elemente werden auch Zeichen zum Trennen von Segmenten oder Zeilen verwendet.

Beispiele[Bearbeiten | Quelltext bearbeiten]

  • Dezimaltrennzeichen
  • Zifferngruppierung
    • mittels speziellem Leerzeichen wie » « (reguläres Leerzeichen) bzw. » « (Zifferngruppierungszeichen), » « (schmales Leerzeichen), » « (Haarspalt) etc. oder
    • Punkt ».« bzw. Komma »,« oder
    • Hochstrich »′« bzw. Apostroph-Ersatzzeichen »'« (einfaches gerades Anführungszeichen).
  • Silbentrennungszeichen
  • Zeilen in Textdateien werden in unixoiden Betriebssystemen durch das Steuerzeichen line feed (LF) und unter Windows durch die Steuerzeichen-Sequenz von carriage return und line feed (CRLF) voneinander getrennt; beim alten Mac OS „Classic“ wurde nur ein carriage return (CR) verwendet (siehe auch: Zeilenumbruch).
  • Bei CSV-Dateien werden Elemente meist mit Komma »,« oder Semikolon »;« aber auch mittels Horizontal-Tabulatorzeichen (TSV) getrennt; mitunter werden die Elementinhalte in gerade Anführungszeichen gesetzt. Das Segment-Trennzeichen ist hier i. d. R. der Zeilenumbruch.
  • Zur Trennung von Verzeichnissen in Pfadangaben wird bei unixoiden Betriebssystemen der Schrägstrich »/« (slash) und unter Windows der umgekehrter Schrägstrich »\« (backslash) verwendet (siehe auch: ).
  • Bei EDIFACT-Nachrichten ist normalerweise das Apostroph-Ersatzzeichen »'« das Segment-Trennzeichen.
  • Um das Problem mit Trennzeichen innerhalb von Textfedern zu umgehen kann mit Text Qualifiern wie z. B. dem doppelten Hochkomma (") gearbeitet werden. Diese werden dann mit dem Textqualifier Zeichen eingeschlossen z. B. "Beispieltext: 123,456-789;0". Mögliche Trennzeichen innerhalb des Textqualifier Zeichens dürfen nicht berücksichtigt werden.
  • Noch besser dafür eignen sich die ASCII-Zeichen US (Char 31, Unit Separator), RS (Char 30, Record Separator), GS (Char 29, Group Separator), und FS (Char 28, File Separator).

Separatoren in Programmiersprachen[Bearbeiten | Quelltext bearbeiten]

In vielen Programmiersprachen werden Separatoren in zwei Aspekten verwendet: Zur Abgrenzung von Schlüsselwörtern sind oft Leerräume und Kommentare zugelassen. Aufeinanderfolgende Anweisungen werden häufig durch ein Semikolon ; voneinander getrennt (z. B. in C, Java, Pascal, Rust), seltener durch einen Doppelpunkt : (wie in BASIC). Manche erfordern jedoch einen Zeilenumbruch zur Trennung von Befehlen (üblicherweise Assemblersprachen).

Alternative[Bearbeiten | Quelltext bearbeiten]

Alternativ zur Verwendung von Trennzeichen können Elemente auch durch ihre fest vorgeschriebene Position und ihre Länge unterschieden werden. Sollte der eigentliche Inhalt eines Elementes kürzer sein als für das Element vorgeschrieben, so wird das Element durch Füllzeichen – meist Nullen oder Leerzeichen – auf die richtige Länge aufgefüllt. Die Internationale Bankkontonummer (IBAN) ist beispielsweise so aufgebaut.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Definition: delimiter. 23. August 1996, abgerufen am 25. September 2010.