Statistik

Subdecks (1)

Cards (47)

  • Quantitative Merkmalsausprägungen lassen sich durch Zahlen oder Größenwerte ausdrücken. z.B. Alter, Gewicht, Temperatur
  • Qualitative Merkmalsausprägungen sind entweder Texte oder Zahlenwerte, mit denen aber keine sinnvollen Rechnungen durchgeführt werden können. z.B. Lieblingsfarbe
  • Diskrete Merkmale gelten dann als diskret, wenn es nur ab zähl bar viele Ausprägungen endlich ist. z.B. Anzahl kinder, unterschiedliche Berufe
  • Stetige Merkmale können unendlich viele Ausprägungen annehmen. z.B. Temperatur, Alter, Menge der rationalen Zahlen
  • Eine Skala ist eine regelmäßig eingeteilte Anzeigefläche die dazu dient, einen Wert anzuzeigen.
  • Nominalskala: sie ist nicht metrisch und ist diskret. Bei der Nominalskala gibt es keine Reihenfolge der Zahlen und es gibt kein größer als besser als. z.B. Haarfarbe, Blutgruppe, Lieblingssportart
  • Ordinalskala: sie ist nicht metrisch und ist diskret. Bei der Ordinalskala gibt es eine Reihenfolge von Zahlen. Jedoch sind die Abstände zwischen Ausprägungen unklar. z.B. Schulnoten, Alter in Kategorien, Einkommensklasse.
  • Intervalskala: sie ist metrisch. Bei der Intervalskala sind die Differenz der Zahlen und die Abstände gleich. Es gibt einen künstlichen Nullpunkt und negative Werte sind ebenfalls möglich. z.B. Körpertemperatur, Jahreszahlen, Datum, IQ
  • Verhältnis-/Ratioskala: sie ist metrisch. Bei der Ratioskala können die Verhältnisse der Zahlen interpretiert werden. Es existiert ein natürlicher Nullpunkt und negative Werte sind nicht möglich. z.B. Preise, Gewicht (Kg), Größe, Einkommen, Quadratmeterzahl einer Wohnung, Prozentzahl, Semesteranzahl, Alter
  • Absolute Häufigkeit gibt an wie oft ein bestimmtes Ereignis bei mehrmaliger Wiederholung eines Zufallsexperiments eintritt.
  • Relative Häufigkeit: setzen die absoluten Häufigkeiten in Beziehung zur Gesamtzahl aller Fälle.AbsoluteHa¨ufigkeit/AnzahlallerHa¨ufigkeitenAbsolute Häufigkeit/Anzahl aller Häufigkeiten
  • Arithmetisches Mittel: Summe der Werte geteilt durch Anzahl der Werte
  • Die Lagemaße einer Verteilung beschreiben, an welcher Stelle einer Verteilung sich die Werte auffällig häufen.
  • Modalwert/Modus: der Wert (oder die Werte) der häufigsten Merkmalsausprägung. Zeichen -> Mo
  • Median/Zentralwert: der Wert der die nach ihrer Größe sortierte Reihe von Messwerten in zwei gleich große Hälften teilt.
    Ungerade Anzahl -> Md=x*n+1/2
    Gerade Anzahl -> Md= (x*n/2) + (x*n/2+1)/2
    Median kann man erst ab einem ordinalen Messniveau nutzen.
  • Mittelwert/arithmetische Mittel ist der durchschnittliche Wert und er setzt intervallskalierte Daten voraus.
    x quer= ⨊ xi/n
    Summe aller Werte durch Gesamtanzahl.
  • Streungsmaße sind Parameter, die die Variation in den Daten ausdrücken.
  • Variationsbreite ist die Differenz zwischen dem größten und dem kleinsten Wert.
    V= max(xi) - min(xi)
    Sie gibt damit den Wertebereich an, in dem tatsächliche Werte vorkommen.
  • Varianz bezeichnet die durchschnittliche quadrierte Abweichung aller Messwerte vom Mittelwert an. Sie gibt die durchschnittliche Variation eines Merkmals wieder.
  • Standardabweichung gibt die durchschnittliche Abweichung der einzelnen Werte von dem Mittelwert an.
    s= die Wurzel aus der Varianz
  • Schiefe gibt Auskunft über die Symmetrie bzw. Schiefe einer Verteilung.
    • rechssteil/ linksschief -> Sch < kleiner Null
    • linkssteil/ rechtsschief -> Sch > größer Null
    • Symmetrisch -> Sch = 0
    • Sch -> (Mittelwert - Modalwert) / Standardabweichung
  • Kreuztabellen werden genutzt bei mehr als einer Variable, die gleichzeitig in einer Tabelle dargestellt werden.
  • Zeilenprozente geben pro Zeile die Prozente an
  • Spaltenprozente geben pro Spalte die Prozente an
  • Gesamtprozente: Zelle / Gesamt
  • Erwartete Häufigkeiten sind Häufigkeiten die sich ergeben würden, wenn die beiden Variablen voneinander unabhängig wären.
    fe= Zeilensumme * Spaltensumme / Gesamthäufigkeit
  • fo sind die beobachteten Häufigkeiten
  • Je stärker fe und fo sich unterscheiden, desto stärker ist der Zusammenhang zwischen beiden Variablen.
    Abweichung fe und fo -> fo - fe
  • Residuen: Abweichung der beobachteten und erwarteten Werten. Je stärker sich erwartete und beobachtete Häufigkeiten in einer Kreuztabelle unterscheiden, desto stärker ist der Zusammenhang zwischen den beiden Variablen.
  • χ² Maß/ Chi Quadrat: der χ²Test wird verwendet um festzustellen ob ein Zusammenhang zwischen zwei Kategorialen Variablen.
    0 bedeutet kein Zusammenhang und die zwei Varianlen sind statistisch voneinander unabhängig.
    Größer Null bedeuten ein zusammenhang und sind statistisch voneinander abhängig.