VO 1 Statistik

Cards (127)

  • Statistik in der Biologie ist ein Modul mit 3 ECTS-Punkten und 2 SWS im Wintersemester 2023/2024, abgehalten von Prof. Dr. Konrad Fiedler, Dept. für Botanik & Biodiversitätsforschung.
  • Die Statistik in der Biologie behandelt Grundkonzepte und -begriffe der Stochastik und Statistik, Deskriptive Statistik, Prüfende Statistik, Vergleiche von 2 Stichproben, Vergleiche multipler Stichproben, Analyse von Häufigkeiten, einfache (bivariate) Korrelationen und Regressionsmodelle.
  • Eine kleine Auswahl an Literatur für die Statistik in der Biologie umfasst Bücher von M. Rudolf, W. Kuhlisch (2020), J. Hedderich, L. Sachs (2020), R. Sokal, F.J. Rohlf (2012), und M. Hollander et al. (2015).
  • Schichtung in Stichproben kann auf Geschlecht, Alter, Polymorphismus, Herkunft usw. zielen.
  • Stochastische Unabhängigkeit der einzelnen Stichproben ist ein Kriterium für die Repräsentativität von Stichproben.
  • Repräsentativität von Stichproben ist ein Fazit, der auf Zufälligkeit, Biasfreiheit und ausreichender Stichprobengröße beruht.
  • Zufälligkeit und Biasfreiheit sind wichtige Aspekte der Repräsentativität von Stichproben.
  • Ausschaltung sonstiger Störeffekte in Stichproben ist ein Aspekt der Repräsentativität.
  • Fehler nachträglich (meist) nicht korrigierbar.
  • Design ist in der Biologie ausreichend dokumentieren.
  • Sorgfältige Versuchsplanung ist bei jeder Studie essenziell.
  • Ausreichende Stichprobengröße ist ein Kriterium für die Repräsentativität von Stichproben.
  • Stichprobe (‚ sample ‘) ist eine endliche Teilmenge (Umfang N) und wird für Schluss auf ganze Population verwendet.
  • Erwartung ist die Annahme, dass Fehler symmetrisch um Null sind und sich herausgeben.
  • Bei der Stichprobenauswahl müssen alle Quellen der Variabilität in der Stichprobe auf die betrachtete Größe zufällig wirken.
  • Wissenschaftliche Daten sind Quellen der Variabilität.
  • Grundgesamtheit (‚ population ‘) ist die Menge aller möglichen Realisierungen einer Zufallsvariablen und ist potentiell (oft) unzugänglich.
  • Variabilität wird durch „Störgrößen“ extern (Randbedingungen der Messung) und intern (Eigenschaften der biologischen Objekte) beeinflusst.
  • Ziele bei einer Stichprobennahme sind nicht die Variabilität „unterdrücken“ sondern die Stichprobe soll die Variabilität der Grundgesamtheit abbilden.
  • Stichprobenziehung ist die Anwendung statistischer Methoden auf die Auswahl von Stichproben.
  • Zufällige Mess- bzw. Beobachtungsfehler können durch Messgenauigkeit, Reproduzierbarkeit und Datenübertragung minimiert werden.
  • Hugo ist 1.89 m, Theodor 1.82 m, Irene 1.81 m und Elisa 1.71 m.
  • Statistisches Modell ist ein wesentlicher Bestandteil der Erhebung.
  • Suche nach Ursachen durch Prozess-Verständnis ist ein wesentlicher Teil der Naturwissenschaften.
  • Prozesse sind oft unvollständig bekannt.
  • Eigenschaften von (biologischen) Objekten werden als Zufallsvariablen aufgefasst.
  • Grundannahme der Naturwissenschaften: Alle Variation ist ursächlich bedingt.
  • Daten für die Erhebung an einer Stichprobe können Körpergröße (= "Zielvariable") und vermutete "Prädiktoren" sein.
  • Statistik ist die Wissenschaft (und Kunst), aus Daten zu lernen.
  • Körperlänge des Menschen ist multifaktoriell.
  • Effekt ist der Basis für objektivierbare Entscheidungen.
  • Trennung erfolgt durch Prädiktorvariablen (von Interesse).
  • Messbare Variation ist die Summe bekannter Ursachen plus unbekannte Ursachen, die als „strukturlose Zufallsvariabilität“ bezeichnet wird.
  • Der Anteil unerklärter Zufallsvariabilität ist das Ignoranzniveau.
  • Eine Zufallsstichprobe ist eine Ziehung mit Zurücklegen.
  • Pseudoreplikation ist die ungewollte mehrfache Datenerhebung am selben Objekt.
  • Räumliche Abhängigkeit ist die Datenerhebung an benachbarten Objekten, gemeinsam: Klima, Geschichte → dann: Test auf räumliche Autokorrelation.
  • Zeitliche Abhängigkeit ist die wiederholte Datenerhebung, Messreihen → dann: geplante Vorher - Nachher - Vergleiche; Zeitreihen - Analyse etc.
  • Überschätzung der „statistischen Signifikanz“ von Befunden führt zu fragwürdigen Testergebnissen (erhöhtes Risiko: Fehler 1 Art).
  • Die Verteilung in Versuch und Kontrolle ist zufällige (oder gleichmäßige), was einen gleichmäßigeren Impakt möglicher (unkontrollierter) Hintergrundvariablen ermöglicht.