|
|
Dateiorganisation
1. Begriff: Methoden und Prinzipien zur Strukturierung einer Datei, insbes. zur Anordnung der Datensätze (Datensatz) und zum Wiederauffinden der Datensätze zusammen. - 2. Aspekte: a) Die Zugriffsform gibt an, in welcher Reihenfolge man die Datensätze einer Datei ansprechen (lesen oder schreiben) kann. (1) Sequentieller Zugriff (fortlaufender Zugriff) bedeutet, daß die Datensätze nur in einer bestimmten Reihenfolge angesprochen werden können. Diese ist entweder durch einen auf- bzw. absteigenden Schlüssel definiert oder durch den Datenträger vorgegeben (z. B. ist bei einem Magnetband nur sequentieller Zugriff möglich). (2) Direkter Zugriff (wahlfreier Zugriff, random access) liegt vor, wenn die Sätze einer Datei in beliebiger Reihenfolge über ihre Schlüssel angesprochen werden können. Voraussetzung hierfür ist, daß die Datei auf einem Datenträger mit direkter Adressierung (z. B. Magnetplattenspeicher, Diskette, CD-ROM) residiert. - b) Die Speicherungsform definiert die Anordnung der Datensätze in der Datei. (1) Bei sequentieller Speicherung (fortlaufender Speicherung) sind die Datensätze hintereinander fortlaufend angeordnet und können auch nur in dieser Reihenfolge wieder bereitgestellt werden. (2) Bei index-sequentieller Speicherung werden die Datensätze nach folgendem Prinzip zu Blöcken zusammengefaßt: Innerhalb eines Blocks sind die Sätze nach ihren Schlüsseln sequentiell geordnet. Für jeden Block ist in einer Indextabelle der größte Schlüsselwert festgehalten. Soll nun auf einen bestimmten Satz zugegriffen werden, kann über die Indextabelle der richtige Datenblock identifiziert und dann (sequentiell) durchsucht werden. Auf die Indextabelle selbst wird meist das gleiche Prinzip analog angewendet; dies führt zu mehrstufigen Indextabellen. - Realisierungen der index-sequentiellen Speicherung als Dateiorganisationsform sind in der betrieblichen Datenverarbeitung unter dem Namen ISAM (index sequential access method) bzw. in fortgeschrittener Form als VSAM (virtual sequent access method) bekannt. (3) Der gestreut direkten Speicherung liegt ein sehr einfaches Dateimodell zugrunde: die Sätze einer Datei sind fortlaufend numeriert und können über die Satznummer angesprochen werden. Für jede mögliche Satznummer ist ein Speicherbereich von der Größe eines Datensatzes vorgesehen, unabhängig davon, ob tatsächlich ein Datensatz mit der Nummer existiert oder nicht. (4) Gestreut indirekte Speicherung bedeutet, daß nicht für jede denkbare Satznummer Platz für einen Datensatz reserviert wird, sondern mit Hilfe eines Umrechnungsverfahrens (Hash-Funktion) nur für die tatsächlich vorkommenden Ordnungsbegriffe Positionen in der Datei berechnet und Speicherplatz für die Sätze reserviert werden. - c) Die Verarbeitungsform wird manchmal als zusätzlicher Aspekt herangezogen; i. e. S. ist sie jedoch nicht der D., sondern eher der Verarbeitungstechnik zuzurechnen. - Aus der Sicht des Benutzers wird danach (1) sortierte Verarbeitung der Datensätze in der Reihenfolge ihrer Ordnungsbegriffe und (2) unsortierte Verarbeitung unterschieden. - 3. Zusammenhänge zwischen Speicherungsform und Zugriffsform: Die Speicherungsform setzt Restriktionen für die Zugriffsform. Bei sequentieller Speicherung ist nur sequentieller Zugriff möglich; bei index-sequentieller oder gestreuter Speicherung ist sowohl direkter als auch sequentieller Zugriff möglich. - 4. Einsatzschwerpunkte: a) Sequentielle Speicherung wird v. a. dann eingesetzt, wenn große Datenbestände nach Ordnungsbegriffen sortiert zu verarbeiten sind; dies erfolgt häufig in Form der Dateifortschreibung. - b) Index-sequentielle Speicherung ist in der betrieblichen Datenverarbeitung die häufigste Organisationsform, wenn sowohl sequentieller Zugriff als auch direkter Zugriff zu Datensätzen aufgrund eines Schlüssels (z. B. aufgrund einer klassifizierenden Artikelnummer) erforderlich ist. - c) Gestreut direkte Speicherung ist eine sehr effiziente Organisationsform, wenn direkter Zugriff benötigt wird und das Anwendungsproblem Ordnungsbegriffe vorgibt, die fortlaufende Nummern sind, oder wenn der Programmierer im Anwendungsprogramm selbst die Zuordnung zwischen Ordnungsbegriffen (z. B. Artikelnummern) und Satznummern vornimmt und verwaltet; sonst ist die gestreut direkte Speicherung u. U. sehr ineffizient. - d) Gestreut indirekte Speicherung kommt weniger zum Einsatz, da der in der betrieblichen Datenverarbeitung häufig benötigte sequentielle Zugriff umständlicher als bei den anderen Speicherungsformen realisiert werden muß. - 5. Probleme der D.: a) Dateien werden i. d. R. aus den Anforderungen der sie verarbeitenden Programme heraus organisiert; daher besteht eine enge Kopplung zwischen Dateien und Programmen. Als Folge müssen bei Änderungen der Dateiorganisation auch die Programme geändert werden (Softwarewartung). - b) Aufgrund der engen Datei-Programm-Kopplung können verschiedene Programme, die teilweise die gleichen Daten benötigen, dieselben Dateien nicht unmittelbar verarbeiten; Daten müssen vielmehr erst in eine für das andere Programm geeignete Form umgesetzt werden. Wenn beispielsweise ein Programm zwei Daten, die bereits in einer sequentiell organisierten Datei für Programm 1 existieren, in einer anderen Reihenfolge als Programm 1 benötigt, so muß durch Sortieren eine neue Datei erzeugt werden. - c) Datenredundanz: Die gleichen Daten sind in jeweils für spezifische Programme adäquater Form mehrfach vorhanden. - d) Datenkonsistenz (Datenintegrität): Aufgrund der Redundanz und der jeweils isolierten Betrachtung der einzelnen Dateien ist die Widerspruchsfreiheit und Vollständigkeit der Daten nicht gesichert.
<< vorheriger Begriff |
|
nächster Begriff>> |
|
|
|
Diese Seite bookmarken :
|
|