VO 3 Statistik

Cards (98)

  • Kontingenztafeln werden verwendet, um die Häufigkeiten von Zeilen und Spalten in einer Tabelle zu analysieren.
  • Die Nullhypothese besagt, dass die Zeilen in einer Kontingenztafel proportional zu den Randsummen sind.
  • Bei der Beurteilung von Häufigkeiten wird die Zählstatistik angewendet.
  • Es gibt zwei verbreitete Situationen, in denen Kontingenztafeln verwendet werden: Vergleich beobachteter Häufigkeiten in mehreren Klassen und mehreren Stichproben, und Vergleich: BeobachtungErwartung.
  • Die Prüfgröße für die Güte der Anpassung ist ², und der Wertebereich ist 0 < ² < .
  • Inhomogenität (Signifikanz) wird durch  angegeben.
  • Es gibt zwei Kategorien: B für nicht signifikante Abweichung und E für signifikante Abweichung.
  • Fiedler, Statistik in Biologie, WiSem 2023164: multiple unabhängige Erhebungen von Kontingenztafeln, Prüfung der gleichen H 0,  ²-Verteilung ist additiv, Summe der einzelnen  ² als Prüfgröße.
  • Fiedler, Statistik in Biologie, WiSem 2023161: Blüten rot Blüten weiß Tirol 11 6 Kärnten 2 8
  • Fiedler, Statistik in Biologie, WiSem 2023165:FG = Anzahl der Experimente.
  • Fiedler, Statistik in Biologie, WiSem 2023163: Blüten rot Blüten weiß Tirol 13 4 Kärnten 0 10
  • Fiedler, Statistik in Biologie, WiSem 2023162: Blüten rot Blüten weiß Tirol 12 5 Kärnten 1 9
  • Die Kategorie B wird durch B/E angegeben.
  • Die kritischen Schwellenwerte zum Test von Cramér & von Mises sind C (α) = 0.347, 0.461, 0.743 und 1.168.
  • Der Test von Cramér & von Mises ist eine Weiterentwicklung des Kolmogorov - Smirnov - Tests, der die Summe aller (quadrierten) Differenzen zwischen kumulativen Häufigkeiten zweier Stichproben F bzw. G berücksichtigt.
  • Das Signifikanzniveau  kann Werte von 0.10, 0.05, 0.01 und 0.001 annehmen.
  • Der C - M - Test ist eine empfehlenswerte Alternative bei unklaren bzw. "schwierigen" Verteilungen.
  • Der C - M - Test ist in wenigen Software-Paketen implementiert, ein Beispiel ist https://cran.r-project.org/web/packages/twosamples/twosamples.pdf.
  • Das Prüfgröße des analogen K - S - Tests ist መ 𝐶 = 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 2.
  • Eine Zufallsvariable besitzt zwei (oder mehr) Zustände möglicherweise.
  • Datenmaterial besteht aus Zählhäufigkeiten, die in Reihen (rows) und Spalten (columns) blättern.
  • Die Interpretation, wenn p < 0.05 (= Signifikanzbefund), besagt, dass nicht proportional zu den Randsummen einzelne Zellenbesetzungen sind, überzufällige Abweichungen von Erwartungen sind und Zeilen bzw. Spalten überzufällig inhomogen sind.
  • Bei der Kontingenztafel handelt es sich um eine einfache Tafel mit vier Feldern, in der die beobachteten Zähl-Häufigkeiten eingetragen sind.
  • Dies ist ein Beispiel für einen nicht signifikanten Unterschied zwischen Populationen.
  • Realisierung ist das Beobachten in zwei (oder mehr) Stichproben.
  • Die Vorgegebene in der Kontingenztafel ist die Summe der Randsummen, die nur eine Zelle frei wählbar ist.
  • Überzufällige Präferenz in Habitatnutzung: auf Brachen relativ häufiger gesichtet 49.2% 73.4% 55.6% 60.0%
  • Mehrfelder - Tafeln der Form r × c.
  • Interpretation eines signifikanten Befundes (p < 0.05): mindestens eine Spalte (bzw. Zeile) → abweichende Verteilung, "globale" Signifikanz → Lokalisierung?
  • Voraussetzungen: vgl. 2 × 2 - Tafeln.
  • Erhebungen überragen Tests aus "aggregierter" Tafel.
  • Test aus "aggregierter" Tafel:
  • 2df = 7.867, p = 0.019
  • Keine Sichtungen Sichtungen Summe Seevorgelände Hutweiden Brachen Summe 73 104 187
  • Probleme: Abgrenzung der Kategorien, Ausschöpfen der Daten (nichts weglassen!), kleine Besetzung (E < 1) → Klassen zusammenfassen, Unabhängigkeit der einzelnen Datenpunkte.
  • Test aus "aggregierter" Tafel mit (r - 1) × (c - 1) FG.
  • Hypothese: stochastische Unabhängigkeit der Zeilen/Spalten.
  • Beispiel - Habitatnutzung des Kleinen Kohlweißlings H 0 - in 3 Graslandtypen gleich oft anzutreffen.
  • Die Frequenz der Werte 0 - 5, 5 - 10, 10 - 15, 15 - 20, 20 - 25, 25 - 30, 30 - 35, 35 - 40 ist nicht gleich verteilt.
  • Der Test von Kolmogorov - Smirnov ist eine Prüfung der Passung eines Wahrscheinlichkeitsmodells.