Dateisystem

Aus Mikiwiki
Version vom 4. April 2009, 17:39 Uhr von Michi (Diskussion | Beiträge) (Dateisysteme unter Linux)
Wechseln zu: Navigation, Suche

Das Dateisystem (engl. file system) ist in gewisser Hinsicht die Grundlage, auf der das Betriebssystem arbeitet. Es entscheidet

  • ob eine hierarchische (baumartige) Speicherung der Daten möglich ist
  • ob und wieviele Zeitmarken gespeichert werden
  • ob und wenn ja, welche Begrenzungen in der Dateinamenslänge vorgegeben sind
  • ob hardlinks möglich sind
  • wieviele Dateien in einem Unterverzeichnis gespeichert werden dürfen
  • wo die maximale Datei- und Partitionsgrösse liegt
  • welche Zugriffsberechtigungen möglich sind
  • mit welcher Geschwindigkeit zugegriffen werden kann
  • ob eine Defragmentierung notwendig ist

Aufgrund der immer grösser werdenden Festplatten werden die Anforderungen an Dateisysteme immer anspruchsvoller:

  • Fehlertoleranz und Fähigkeit zur "Selbstheilung".
  • Bessere Performance durch intelligente Block-Allozierung und geringere Fragmentierung im Betrieb (z. B. durch Extents).
  • Höhere Kapazitäten und bessere Skalierung der Gesamtgrösse, aber gleichzeitig auch der Maximalzahl möglicher Dateien und Verzeichniseinträge.
  • Mehr Datensicherheit durch Transaktionen, Redundanz und/oder Prüfsummen, damit es erst gar nicht zu einem Fehler kommen kann, der zu beheben wäre.
  • Integration von Volumemanager-Funktionen wie z. B. Snapshot-Mechanismen oder RAID-Konfigurationen in das Dateisystem.

Die Verzeichnisstruktur ist die logische Gestalt von Dateisystemen, die über Verzeichnisse verfügen. Als Faustregel sollten 20% des Dateisystems immer frei sein. Zur sauberen Trennung sollten eigene Partitionen für folgende Bereiche eingerichtet werden.

Bereich Grösse Beschreibung
/ etwa 80 MB nur statische Daten
/tmp etwa 50 MB
/var etwa 100 MB
/usr etwa 200 MB Dazu ein separates Verzeichnis "/usr/local".
/home
/usr/local
swap RAM x 2 Etwa entsprechend der doppelten Grösse des vorhandenen Arbeitsspeichers. Bei zwei vorhandenen Festplatten sollte die swap-Partition immer auf die zweite Platte, ansonsten nach Möglichkeit ans Ende der Platte.

Geschichte

Die Urversionen von Linux benutzten das Dateisystem Minix. Ab 1992 wurde ein eigenes Dateisystem entwickelt, das Extended File System / ExtFS. Wegen vieler Fehler veröffentlichte Rémy Card 1993 jedoch das Second Extended File System / Ext2, das sich zu einem stabilen und erweiterbaren Dateisystem entwickelte. Da es aber kein Journaling verwendet, müssen z. B. bei einem Crash und regelmässig nach einer festgelegten Zeit langwierige Dateisystemchecks durchgeführt werden. Je nach Festplattengrösse dauern diese mehrere Stunden. Ausserdem lässt sich das Dateisystem nur mit proprietären Werkzeugen im Betrieb in der Grösse verändern. Um 2000 herum wurden die Festplatten für Ext2 zu gross und der Dateisystemcheck mit Ext2 zu langsam.

Unabhängig voneinander wurden deshalb das Third Extended File System / Ext3 als Journaling-Erweiterung für Ext2 und ReiserFS v3 als vollkommen neues Dateisystem mit nativem Journaling entwickelt. SUSE Linux 6.4 war im Frühling 2000 die erste Distribution, die mit ReiserFS ein Journaling-Dateisystem als Standard-Dateisystem verwendete. Ext3 war erstmals 2001 für Red Hat 7.2 als offizielles Dateisystem erhältlich und wurde mit Kernel 2.2.15 in den offiziellen Kernel aufgenommen. Bei ReiserFS dauerte dieser Schritt noch bis zum Kernel 2.4.1. Seither benutzen die meisten Linux-Distributionen entweder Ext3 oder ReiserFS als Standard-Dateisystem.

Ebenfalls 2001 wurden zwei nach Linux portierte Journaling-Dateisysteme von IBM und SGI in den offiziellen Kernel aufgenommen. XFS von SGI ist inzwischen eines der besten Dateisysteme für Dateigrössen von 1 MB und mehr. JFS von IBM konnte sich dagegen nie richtig etablieren und wird z. B. von SUSE nicht mehr offiziell unterstützt.

Dateisysteme unter Linux

Linux kann mit sehr vielen Dateisystemen arbeiten, darunter den folgenden.

Dateisystem Jahr Hersteller Beschreibung
afs
BTRFS 2007 Oracle Corporation
Ext
EXT2 Open Source
EXT3 2001 Open Source Journaling-Dateisystem
EXT4 2006 Open Source
FAT
HPFS
ISO9660
JFS 1990 IBM
NFS
proc
Reiserfs 3 2001 Namesys Journaling-Dateisystem
SMBFS
VFAT
XFS 1994 Silicon Graphics

Der überwiegende Teil der Linuxrechner benutzt EXT3 oder Reiserfs als Hauptdateisystem, da dies die Standardvorschläge wichtiger Distributionen sind. Beide sind Journaling-Dateisysteme. Journaling bedeutet dabei, dass das Dateisystem alle Daten zweimal schreibt: zunächst ins Journal und dann an den vorgesehenen Platz. Um die dadurch entstehende Geschwindigkeitseinbusse zu vermindern, schreiben beide Dateisystem in der Grundeinstellung nur die sogenannten Metadaten - also die Informationen über die Bewegungen im Dateisystem - ins Journal, die eigentlichen Daten nicht.

Das Magnetband ist ein Massenspeicher ohne Dateisystem und verfügt nur über einfachste Ein- und Ausgabefunktionen.

Die rotierenden Magnetplatten einer Festplatte lassen sich als übereinander gestapelte Disketten vorstellen, zwischen denen die Lese- und Schreibköpfe (engl. heads) hineinragen. Diese Köpfe lassen sich zwar einzeln ansteuern, aber nur gemeinsam bewegen. Die einzelnen Spuren einer Festplatte durch alle Ebenen hindurch werden als einander umhüllende Zylinder bezeichnet. Diese Parameter Zylinder, Köpfe und Sektoren pro Zylinder (CHS) bilden zusammen die Plattengeometrie.

Die im BIOS für die Anzahl Zylinder reservierten zehn Bits, mit denen Werte bis 1024 darstellbar sind, wurden schon bald zum begrenzenden Faktor. Ausserdem konnte mit der starren CHS-Codierung das zone bit recording (ZBR), das den äusseren Zylindern mehr Sektoren zuordnet als den weiter innen liegenden, nicht mehr abgebildet werden. Da die alte BIOS-Schnittstelle noch Bestand haben muss, werden dem BIOS falsche Werte vorgegaukelt. Entscheidend ist, dass das Produkt der drei Werte und damit die Anzahl der gesamten Sektoren der Festplatte gleich bleiben muss. Die tatsächliche Zugehörigkeit der einzelnen Sektoren zu bestimmten Zylindern ist ohnehin nicht mehr nachzuvollziehen und für die Funktion inzwischen auch unerheblich geworden.

Beispiel: Das BIOS (LBA-Modus) zeigt zu einer 20 GB-Festplatte die folgenden Werte an:
38792 Zylinder, 16 Köpfe und 63 Sektoren je Zylinder
Die Plausibilität der Werte kann leicht nachgeprüft werden, da jeder Sektor 512 bytes gross ist:
(C*H*S) 38792*16*63*512 = 20.020 MB
Das in GNU/Linux enthaltenene Partitionierungsprogramm fdisk zeigt jedoch folgende Werte an:
2434 Zylinder, 255 Köpfe und 63 Sektoren je Zylinder
(C*H*S) 2434*255*63*512 = 20.020 MB

Dieses Umrechnen von Plattengeometrien [engl. mapping] existiert in mehreren Varianten. Es dient dazu, die Grenzen des BIOS zu überwinden, um grössere Massenspeicher ansprechen zu können.

Unter Linux sind Festplattengeometrie und BIOS-Werte der Festplatte jedoch nur für den Bootvorgang und die Partitionierung von Bedeutung. Im laufenden Betrieb bedient sich Linux des logical block addressing (LBA), bei dem jedem 512 bytes grossen Sektor, mit 0 beginnend, eine Blocknummer zugeordnet wird, wodurch die dreidimensionalen CHS-Koordinaten auf lineare Adressen abgebildet werden. Während SCSI-Festplatten schon immer im LBA-Modus betrieben wurden, verfügten die ersten IDE-Festplatten um 1990 noch nicht über diese Technologie. Ist noch eine 486er Hauptplatine im Einsatz, so kann nicht zwangsläufig von einer LBA-Unterstützung des BIOS ausgegangen werden. Für die Repräsentation der Blocknummern im LBA Modus werden 28 bit verwendet, womit immerhin 2e28 Sektoren oder 128 GB grosse Festplatten ansprechbar sind. Für grössere Festplatten ist eine 64 bit-LBA-Variante vonnöten, womit dann Massenspeicher von bis zu 8 PB ansprechbar sind.

Übersicht Dateisysteme

Dateisystemkategorie Verwendung Beispiele
physisches Dateisystem, konventionell Verwaltung der Informationen auf einem Massenspeicher, damit diese in der Verzeichnisstruktur verfügbar sind. Minix, Ext, Ext2, FAT32
physisches Dateisystem, journaling Verwaltung der Informationen auf einem Massenspeicher, damit diese in der Verzeichnisstruktur verfügbar sind. Ext3, ReiserFS, JFS, HPFS, NTFS
Netzwerkdateisysteme Verfügbarmachung von Massenspeicher über das Netzwerk. NFS, AFS, Coda, SMBFS, NCPFS
Pseudodateisysteme Werden nicht zum Verwalten von Massenspeichern eingesetzt, aber dennoch in die Verzeichnisstruktur integriert. procfs, tmpfs, devpts, devfs
EXT3 EXT4 Reiserfs 3 XFS JFS 2
Entwickler Open Source Open Source Hans Reiser / Namesys Silicon Graphics IBM
Lizenz GPL GPL GPL GPL GPL
Erstveröffentlichung 2001.11 2006.10 (Testversion) 2001.01 1994 1990
seit Linux-Kernel 2.4.15 2.6.19 2.4.1 2.4.25
Max. Dateisystemgrösse 16 TB (32 Bit) 1 EB (48 Bit) 16 TB (32 Bit) 16 EB (64 Bit) 4 PB (64 Bit)
Max. Dateigrösse 2 TB 1 EB 1 EB (Version 3.6) 8 EB 1 PB (4 KB-Blöcke)
Journaling ja ja ja ja ja, transaktionsorientiert
Online-Resizing ja ja ja nur Vergrössern, kein Verkleinern nur Vergrössern, kein Verkleinern
Online-Defragmentierung nein ja ja ja nein
Prüfsummensicherung nein ja nein nein nein
Transparente Komprimierung nein optional nein nein nein
Transparente Verschlüsselung nein nein nein nein nein
Integrierte Snapshots nein nein nein nur mit Volumemanager (für Irix) nein
Quotas ja ja ja für Benutzer und Gruppen erst ab Kernel 2.6.9
Unix-Dateirechte ja POSIX ja ja ja
Zugriffskontrolllisten (ACLs) ja ja ja ja ja
Unterstützte Betriebssysteme Linux, BSD, Windows (3rd-Party-Treiber) Linux Linux Irix, Linux, BSD Linux, OS/2, AIX

Maximale Grösse von Dateisystemen.

Dateisystem Ursprüngliches Betriebssystem Maximalgrösse
Reiser 4 Linux 16 Terabyte
Ext3 Linux 32 Terabyte
NTFS Microsoft Windows 256 Terabyte
Ext4 Linux 1 Exabyte
XFS Linux 8 Exabyte
ZFS Solaris 16 Exabyte
Btrfs Linux 16 Exabyte

FAQ

Einbinden einer neuen Festplatte in ein bestehendes Linux-System

Auffinden von Dateiduplikaten

Weblinks

Vorlage:Weblinks1