VO 3 Statistik

    Cards (98)

    • Kontingenztafeln werden verwendet, um die Häufigkeiten von Zeilen und Spalten in einer Tabelle zu analysieren.
    • Die Nullhypothese besagt, dass die Zeilen in einer Kontingenztafel proportional zu den Randsummen sind.
    • Bei der Beurteilung von Häufigkeiten wird die Zählstatistik angewendet.
    • Es gibt zwei verbreitete Situationen, in denen Kontingenztafeln verwendet werden: Vergleich beobachteter Häufigkeiten in mehreren Klassen und mehreren Stichproben, und Vergleich: BeobachtungErwartung.
    • Die Prüfgröße für die Güte der Anpassung ist ², und der Wertebereich ist 0 < ² < .
    • Inhomogenität (Signifikanz) wird durch  angegeben.
    • Es gibt zwei Kategorien: B für nicht signifikante Abweichung und E für signifikante Abweichung.
    • Fiedler, Statistik in Biologie, WiSem 2023164: multiple unabhängige Erhebungen von Kontingenztafeln, Prüfung der gleichen H 0,  ²-Verteilung ist additiv, Summe der einzelnen  ² als Prüfgröße.
    • Fiedler, Statistik in Biologie, WiSem 2023161: Blüten rot Blüten weiß Tirol 11 6 Kärnten 2 8
    • Fiedler, Statistik in Biologie, WiSem 2023165:FG = Anzahl der Experimente.
    • Fiedler, Statistik in Biologie, WiSem 2023163: Blüten rot Blüten weiß Tirol 13 4 Kärnten 0 10
    • Fiedler, Statistik in Biologie, WiSem 2023162: Blüten rot Blüten weiß Tirol 12 5 Kärnten 1 9
    • Die Kategorie B wird durch B/E angegeben.
    • Die kritischen Schwellenwerte zum Test von Cramér & von Mises sind C (α) = 0.347, 0.461, 0.743 und 1.168.
    • Der Test von Cramér & von Mises ist eine Weiterentwicklung des Kolmogorov - Smirnov - Tests, der die Summe aller (quadrierten) Differenzen zwischen kumulativen Häufigkeiten zweier Stichproben F bzw. G berücksichtigt.
    • Das Signifikanzniveau  kann Werte von 0.10, 0.05, 0.01 und 0.001 annehmen.
    • Der C - M - Test ist eine empfehlenswerte Alternative bei unklaren bzw. "schwierigen" Verteilungen.
    • Der C - M - Test ist in wenigen Software-Paketen implementiert, ein Beispiel ist https://cran.r-project.org/web/packages/twosamples/twosamples.pdf.
    • Das Prüfgröße des analogen K - S - Tests ist መ 𝐶 = 𝑛 1 𝑛 2 𝑛 1 + 𝑛 2 2.
    • Eine Zufallsvariable besitzt zwei (oder mehr) Zustände möglicherweise.
    • Datenmaterial besteht aus Zählhäufigkeiten, die in Reihen (rows) und Spalten (columns) blättern.
    • Die Interpretation, wenn p < 0.05 (= Signifikanzbefund), besagt, dass nicht proportional zu den Randsummen einzelne Zellenbesetzungen sind, überzufällige Abweichungen von Erwartungen sind und Zeilen bzw. Spalten überzufällig inhomogen sind.
    • Bei der Kontingenztafel handelt es sich um eine einfache Tafel mit vier Feldern, in der die beobachteten Zähl-Häufigkeiten eingetragen sind.
    • Dies ist ein Beispiel für einen nicht signifikanten Unterschied zwischen Populationen.
    • Realisierung ist das Beobachten in zwei (oder mehr) Stichproben.
    • Die Vorgegebene in der Kontingenztafel ist die Summe der Randsummen, die nur eine Zelle frei wählbar ist.
    • Überzufällige Präferenz in Habitatnutzung: auf Brachen relativ häufiger gesichtet 49.2% 73.4% 55.6% 60.0%
    • Mehrfelder - Tafeln der Form r × c.
    • Interpretation eines signifikanten Befundes (p < 0.05): mindestens eine Spalte (bzw. Zeile) → abweichende Verteilung, "globale" Signifikanz → Lokalisierung?
    • Voraussetzungen: vgl. 2 × 2 - Tafeln.
    • Erhebungen überragen Tests aus "aggregierter" Tafel.
    • Test aus "aggregierter" Tafel:
    • 2df = 7.867, p = 0.019
    • Keine Sichtungen Sichtungen Summe Seevorgelände Hutweiden Brachen Summe 73 104 187
    • Probleme: Abgrenzung der Kategorien, Ausschöpfen der Daten (nichts weglassen!), kleine Besetzung (E < 1) → Klassen zusammenfassen, Unabhängigkeit der einzelnen Datenpunkte.
    • Test aus "aggregierter" Tafel mit (r - 1) × (c - 1) FG.
    • Hypothese: stochastische Unabhängigkeit der Zeilen/Spalten.
    • Beispiel - Habitatnutzung des Kleinen Kohlweißlings H 0 - in 3 Graslandtypen gleich oft anzutreffen.
    • Die Frequenz der Werte 0 - 5, 5 - 10, 10 - 15, 15 - 20, 20 - 25, 25 - 30, 30 - 35, 35 - 40 ist nicht gleich verteilt.
    • Der Test von Kolmogorov - Smirnov ist eine Prüfung der Passung eines Wahrscheinlichkeitsmodells.
    See similar decks