VO 2 Statistik

Cards (269)

  • Arbeits hypothese → Planung (Experiment bzw Beobachtung) → Datengewinnung → (statistische) Prüfung → Verwerfen oder Verfeinern oder Beibehalten der Hypothese ist der Erkenntnisprozess in den Naturwissenschaften inhärent.
  • Modell annahmen, zur Datenaufbereitung und -analyse, Rückkopplung, mehr oder "bessere" Daten sind Teil des Erkenntnisprozesses in den Naturwissenschaften.
  • Voraussetzungen für einen t - Test sind repräsentative Zufallsstichproben, stochastisch unabhängige Einzelwerte, eine stetige Zielvariable, Intervallskala und Normalverteilung.
  • Biologie, WiSem 2023108 t - Test (Student-Test) ist der "Prototyp" aller frequentistischen Tests, der Vergleich der zentralen Tendenz von 2 Stichproben ist.
  • William S. Gosset (alias Student) veröffentlichte 1908 in Biometrika 6 (1) einen Artikel mit dem Titel "The Student's Error in Favour of the Fraction".
  • Verhaltensweisen von Raupen in Mutualismus mit Ameisen: unimodal, asymmetrisch, etwas rechts - schief.
  • Bimodale Verteilungen führen zu Heterogenität (Schichtung) der Stichprobe, dann: Auftrennen (falls bekannt) → Geschlecht, Herkunft.
  • Sehr verbreitet bei biologischen Daten.
  • Symmetrische unimodale Verteilungen sind am einfachsten zu handhaben, da sie die Normalverteilung ("Glockenkurve") als zentrales Modell repräsentieren.
  • Wie viele Gipfel: unimodal, bimodal, gleichförmig.
  • Beispiel: bimodale Häufigkeitsverteilung - Wachstumsrate von Schmetterlingsraupen.
  • Biologie, WiSem 202348 - Entscheidung: stetige ↔ diskrete Variable? - falls stetige Variable → Diskretisierung zur Darstellung notwendig.
  • Ursache für Heterogenität in der bimodalen Häufigkeitsverteilung: Temperatur während Zucht 20 ° C, 27 ° C.
  • Beobachtete Verteilung: symmetrisch oder nicht? - rechts - schief = links - steil, links - schief = rechts - steil.
  • Biologie, WiSem 202349 - Häufigkeitsverteilungen - Beispiele mit absoluten Frequenzen: unimodal, abfallend, stark asymmetrisch.
  • Beispiel: rechts-schiefe Verteilung - Anzahl der Tagfalter-Sichtungen pro Standort, NP Neusiedlersee.
  • Normalisierung: durch log- oder Wurzel-Transformation.
  • Hypothesen in den Naturwissenschaften sind in zwei Typen unterteilt: a priori - Hypothesen, die durch Herleitung aus theoretischer Vorstellung (Prozess) und Prüfung der Vorhersagen (statischer Test) erstellt werden, und a posteriori - Hypothesen, die aus Datenexploration (z.B. data mining) und oft bei multivariaten Erhebungen, unklarer Ausgangslage, erstellt werden.
  • α und β – bei gegebenem n nicht beliebig klein.
  • „signifikant“ = biologisch relevant ? H 0 trifft zu H A trifft zu H 0 beibehalten korrekt, „uninteressant“, p = 1 – α.
  • Signifikanzniveau (& ggf Power) – a priori zu wählen.
  • „signifikant“ – betrifft stets H 0.
  • Für alle „klassischen“ Hypothesentests gilt …
  • „signifikant“ – Test entscheidung ≠ „Wirklichkeit“.
  • Biologie, WiSem 2023105: Ein seitig vs zwei seitig: Trennschärfe zweiseitiger Test – größerer Wert der Teststatistik T S für Signifikanzbefund erfordert (bei gleichem α) → geringere Power.
  • Es gibt keine "statistischen Beweise", Hypothesen sind ein integraler Bestandteil des "Wissens" in allen empirischen Naturwissenschaften.
  • Der Zufallsprozess bei der Binomial-Verteilung ist eine Stichprobenziehung mit Zurücklegen, bei der ohne Zurücklegen ist es die Hypergeometrische Verteilung.
  • Beispiele: Geschlechterverteilung in natürlichen Populationen und Allelfrequenzen, Lokus mit 2 Allelvarianten.
  • Schätzung: arithmetisches Mittel λ > 0, x = 0, 1, 2, …
  • Die Erwartungwert der Binomial-Verteilung ist meistens 0,5.
  • Die Poisson-Verteilung ist eine ganzzahlige Zufallsvariable mit kleinen Ereigniswahrscheinlichkeit und nur einem Parameter.
  • Vorgehen: Auszählen: Ereignisse pro Zeit- oder Raum-Einheit und Vergleich: Mittelwert ± Varianz.
  • Die Binomial-Verteilung ist eine diskrete Zufallsvariable mit zwei Merkmalsalternativen mit fester Wahrscheinlichkeit: p; q = 1p.
  • Beispiele: Zufallsverteilung von Organismen in (homogenem) Raum und radioaktiver Zerfall.
  • Prüfgröße der t-Verteilung folgt nicht der z-Verteilung, da die t-Verteilung eine ähnliche Form wie die N (0;1)-Verteilung, aber "flacher" ist.
  • Die t-Verteilung besitzt "mehr Wahrscheinlichkeit" in den "Ausläufen".
  • Bei der Prüfung der Varianzhomogenität wird der F-Test 𝑠1/𝑠2 verwendet.
  • Der Quotient der Varianzen s1 > s2, mit FG1 = ν1 = n1 – 1 & FG2 = ν2 = n2 – 1 ist unzulässig, wenn F > Fα.
  • Freiheitsgrade sind die Zahl der "frei wählbaren" Beobachtungen, um ein vorgegebenes Ergebnis zu erzielen.
  • Mit zunehmender Anzahl der Freiheitsgrade konvergiert die t-Verteilung gegen die N (0;1)-Verteilung.