3 2 Speichertechnologien

Cards (9)

  • Relationale Datenbanken

    – insbesondere für OLTP – häufig genutzte
    Datenbanksysteme und lassen sich prinzipiell auch zur Datenverwaltung in DWH-Lösungen nutzen. Das zugrundeliegende relationale Datenbankmodell geht auf Arbeiten von Codd zurück, basiert auf der Relationentheorie und zeichnet sich durch Einfachheit und Klarheit aus
  • Eine Relation entspricht einer zweidimensionalen Tabelle.
    • Die Spaltenüberschriften der Tabelle sind die Attribute der Relation
    und bilden das Relationenschema.
    • Die Zeilen der Tabelle werden als Tupel bezeichnet.
    • Jede Relation hat einen Namen.
    • Die möglichen Werte einer Spalte bzw. eines Attributs bezeichnet
    man als Domäne.
  • Es gibt keine Zeilen mit identischen Attributwerten, d. h., es gibt ein
    Attribut bzw. eine Attributkombination, welche ein Tupel eindeutig
    identifiziert. Dieses Attribut (Attributkombination) bezeichnet man als
    Primärschlüssel der Tabelle. Oft verwendet man dafür separate Attribute, wie z. B. Matrikelnummer zur eindeutigen Identifikation von
    Studenten in einer Studententabelle.
  • Zwischen Tabellen bestehen keine hierarchischen Beziehungen, sie stehen „nebeneinander“. Eine inhaltliche Verknüpfung zwischen Tabellen erfolgt über Fremdschlüssel. Dabei handelt es sich um ein Attribut in einer Tabelle, welches inhaltlich identisch in der verknüpften Tabelle Primärschlüssel ist
  • Mit Hilfe des Relationenmodells werden die für ein Anwendungssystem erforderlichen Daten weitgehend frei von Redundanzen dargestellt. Dazu muss eine Relation jedoch verschiedenen Anforderungen genügen, welche Codd als sogenannte Normalformen bezeichnet
  • Relation erster Normalform
    , wenn alle Attribute
    atomar sind, d. h. einfache Attributwerte aufweisen. Es treten keine
    zusammengesetzten Attribute oder Wiederholungsgruppen auf. Alle
    Nichtschlüsselattribute sind vom Relationenschlüssel funktional abhängig, was bedeutet, dass man durch die Angabe des Relationenschlüssels den Attributwert ermitteln kann.
  • Relation zweiter Normalform
    falls sie in erster Normalform vorhanden ist und jedes Nichtschlüsselattribut voll
    funktional vom Primärschlüssel abhängig ist. Volle funktionelle Abhängigkeit bedeutet, dass jedes Nichtschlüsselattribut nur durch Angabe aller Attributwerte des Primärschlüssels identifiziert werden
    kann. Ein Teil des Primärschlüssels reicht nicht aus, um ein Nichtschlüsselattribut zu identifizieren.
  • Relation dritter Normalform
    wenn sie in zweiter
    Normalform vorhanden ist und zwischen den Nichtschlüsselattributen keine funktionellen Abhängigkeiten bestehen
  • Die Verwendung relationaler Datenbanksysteme stößt bei der Analyse sehr großer Datenbestände mit Millionen von Datensätzen an seine Grenzen
    Der Grund ist, dass im Konzept der relationalen Datenbanken die Daten auf einem externen Speichermedium liegen, was zu Performanceproblemen führen kann. Hinzu kommt, dass sich relationale Datenbanken für die Analyse unstrukturierter Daten nur bedingt eignen. Speziell für Datenanalysen haben sich deshalb in den letzten Jahren
    verschiedene weitere Speichertechnologien etabliert