Textdatei

Aus Mikiwiki
Zur Navigation springen Zur Suche springen

Als Textdatei / TXT (engl. text file) bezeichnet man in der Informationstechnik eine Datei, deren Inhalt eine lineare Folge von Zeichen darstellt, die durch Zeilenumbrüche und Seitenwechsel untergliedert sein können. Die Menge der verfügbaren Zeichen wird durch die zugrunde liegende Kodierung bestimmt, am gebräuchlichsten sind hierbei ASCII oder Unicode. Häufig wird die Zeichenmenge durch eine natürliche oder formale Sprache eingeschränkt, in der der Textinhalt verfasst ist. Ist zur Auswertung des eigentlichen Inhalts keine Kenntnis einer besonderen Notation erforderlich, bezeichnet man den Inhalt als "plain text" (engl. für einfachen Text oder Klartext).

Das Gegenstück zur Textdatei stellt eine Binärdatei dar, wobei genau genommen natürlich auch Textdateien binär gespeichert werden, oft werden die Begriffe jedoch komplementär verwendet. Eine Textdatei ist im Gegensatz zu einer Binärdatei ohne die Verwendung besonderer Software lesbar und kann mit einem einfachen Texteditor angesehen oder bearbeitet werden. Dies gilt in gewissem Umfang auch dann, wenn der Inhalt sich nicht auf "plain text" beschränkt.

Umgangssprachlich werden gelegentlich alle Dateien als "Textdatei" bezeichnet, die mit dem Ziel erstellt wurden, dem Benutzer einen lesbaren Text zu präsentieren. Bei den von üblicher Software zur Textverarbeitung bei Speicherung erzeugten Dateien handelt es sich jedoch häufig um komplexe Dateiformate, die neben dem Text Metainformation zur Beschreibung des Textlayouts, der Struktur und der verwendeten Schriften enthalten, zudem können Bilder oder Grafiken eingebettet sein. Dabei handelt es sich um keine Textdateien im eigentlichen Sinne, da die Dateiformate häufig binär sind und zur Anzeige eine besondere Software erforderlich ist.

Umwandlung

Textdatei in PS-Datei umwandeln.

$ a2ps file.txt > file.ps

Umwandeln von Textdateien zwischen DOS und Unix

Unter Microsoft DOS wird das Zeilenende in einer Textdatei durch die Sequenz return (Dezimalcode 13) und new line (Dezimalcode 10) dargestellt. Unix verwendet dagegen nur new line .

Wird eine Unix-Textdatei in Microsoft DOS oder Microsoft Windows weiterverarbeitet, so erfolgt die Darstellung des Zeilenumbruchs nicht korrekt. So werden bei einfachen Texteditoren (z. B. notepad.exe) anstelle eines Umbruchs nur sonderbare Zeichen dargestellt. Anspruchsvollere Texteditoren (z. B. die Windows-Version von vi) können auch Unix-Textdateien richtig lesen. Wird eine DOS-Textdatei in den vi-Editor geladen, so erscheint ein ^M -Zeichen an jedem Zeilenende.

Um Probleme zu vermeiden, sollten die Textdateien konvertiert werden. Dafür gibt es unter Unix zwei Programme:

  • unix2dos konvertiert von Unix zu DOS
  • dos2unix konvertiert von DOS zu Unix

Umwandlung der DOS-Textdatei "dosfile" in die Unix-Textdatei "unixfile" (wobei jeweils das Zeichen "new line" bei jedem Zeilenumbruch entfernt wird).

$ dos2unix -n dosfile unixfile
oder
$ cat dosfile | dos2unix > unixfile

Umwandlung der Unix-Textdatei "unixfile" in die DOS-Textdatei "dosfile" (dabei wird jedem Zeilenumbruch das Zeichen "new line" hinzugefügt).

$ unix2dos -n unixfile dosfile
oder
$ cat unixfile | unix2dos > dosfile

Umwandlung einer Kopie Unix-Textdatei "/etc/passwd" in eine DOS-Textdatei und Speicherung als "passwd.txt" auf einer DOS-Diskette.

# cd /floppy
# cat /etc/passwd | unix2dos > passwd.txt

Die DOS-Diskette kann nach dem Aufheben der mount-Zuordnung aus dem Diskettenlaufwerk genommen werden, um sie danach in einem Windows-PC zu bearbeiten.

Weblinks

Vorlage:dewi Vorlage:enwi