Datenanalyse extra Kram, nicht Klausurfragen

Cards (27)

  • Panelstudien
    • Wiederholte Befragungen oder Untersuchungen
    • Langfristige Perspektive für Veränderungen im Zeitverlauf
    • Identische Stichprobe über den gesamten Untersuchungszeitraum
    • Messung von Veränderungen in Einstellungen, Verhaltensweisen usw.
    • Analyse von Kausalität durch wiederholte Messungen
  • Vorteile des Mikrozensus
    • Erlaubt Analyse individueller Entwicklungen, neben der Analyse von between-Varianz
    • Enthält Informationen zur zeitlichen Abfolge von Zuständen/Ereignissen
    • Erlaubt Kontrolle unbeobachteter individueller Heterogenität
    • Ist somit informativer (im vgl. zu Querschnittdatensätzen)
  • Typen von Fälschungen von Daten
    • Hoax - alles fake, Aufmerksamkeit, Forgery - klassische Fälschung, Trimming - Datenbereinigung um Messfehler auszuschließen, Ausreißer, Cooking - Datenselektion um Signifikanz zu erzeugen
  • Faktorenladung
    • Korrelation zwischen Faktor & Variable
    • Anteil der Streuung, die durch den Faktor erklärt wird
  • Eigenwert
    Erklärter Teil der Gesamtvarianz der manifesten Variablen durch latenten Faktor
  • Kommunalität
    Anteil der Varianz einer Variable, die durch alle Faktoren insgesamt erklärt werden kann
  • Hauptkomponentenanalyse
    • Varianz kann komplett durch alle Faktoren erklärt werden
    • Kommunalität = 1
    • Annahme, dass keine Messfehler enthalten sind
  • Hauptachsenanalyse
    • Varianz kann nicht komplett durch alle Faktoren erklärt werden
    • Kommunalität < 1
    • Annahme, dass Messfehler bestehen können
  • Faktorwert
    Ausprägung des Faktors im Individuum
  • Kaiser-Kriterium
    Alle Faktoren, die einen Eigenwert von über eins haben, werden extrahiert
  • Scree-Test oder auch Ellenbogenkriterium
    • Die Eigenwerte der Faktoren werden im Screeplot (Eigenwertdiagramm) abnehmend eingeordnet
    • "Knick" gibt an, wie viele Faktoren extrahiert werden
  • Varianz
    Es wird so lange extrahiert, bis eine festgelegte Prozentzahl der Varianz erklärt ist. Varianz bezeichnet in diesem Fall die Standardabweichung
  • OLS
    • Methode der kleinsten Quadrate (ordinary least squares)
    • Statistische Methode zur Schätzung von Beziehungen zwischen Variablen bzw. Schätzung eines multiplen linearen Modells
    • Ziel: beste Anpassung der linearen Beziehung zwischen den unabhängigen und abhängigen Variablen erreichen durch Minimierung der quadrierten Abweichungen (Residuen) zwischen den beobachteten und geschätzten Werten der AV
    • Annahme einer linearen Beziehung zwischen UVs und AV
  • Paneldaten
    • Wiederholte Untersuchungen
    • Langfristige Perspektive
    • Identische Stichprobe
    • Messung von Veränderungen in Einstellungen, Verhaltensweisen usw.
    • Analyse von Kausalität durch wiederholte Messungen
  • Egozentrierte Netzwerke
    • Betrachten die direkten Beziehungen einer Person zu anderen
    • Untersuchung von direkten Beziehungen oder Verbindungen dieser Person zu anderen Personen
    • Ziel: Verstehen der Struktur und Qualität der direkten Beziehungen einer Person zu anderen & Sammlung von Informationen über die Ressourcen und Unterstützung
    • Qualitativ
  • Ex-ante Bestimmung
    Definition eines Gesamtnetzwerkes durch Bestimmung der Grenzen des Netzwerks und der Gruppenzugehörigkeit im Vorhinein
  • Methoden zur Identifikation von Akteuren in egozentrierten Netzwerken

    • Visualisierung
    • Namensgeneratoren wie Laumann Generator, Burt Generator, Fischer Generator
  • Verfahren für die Erhebung von egozentrierten Netzwerken
    • Visualisierung
    • Namensgeneratoren wie Burt-, Fischer- oder Laumann-Generator
  • Multiplexe Beziehungen
    Eine Beziehungsperson hat mehrere Rollen/Funktionen (z.B. meine Freundin ist gleichzeitig meine Nachbarin)
  • Soziogramme
    • Graphische Darstellung von Beziehungen in einem Netzwerk
    • Visuelle Maße: gerichtete Graphen (reflexiv, symmetrisch, transitiv)
    • Statistische Messgrößen: Zentralität (closeness, degree, betweeness centrality), Dichte, Kohäsion, Erreichbarkeit
  • Namensgeneratoren für egozentrierte Netzwerke
    • Burt-Generator
    • Laumann-Generator
    • Fischer-Generator
  • Knoten/Punkte und Kanten/Linien
    Punkte = Personen, Kanten = Beziehungen zwischen Personen
  • Realistische Erhebungsmethode
    Abhängig von Auffassung und Verhalten der Akteure (Akteure nennen wichtige Personen selbst?)
  • Nominalistische Erhebungsmethode
    Netzwerkzugehörigkeit wird von Forschern definiert (Bestimmung vorab durch bereits bestehende Gruppen/ex-ante Bestimmung und durch Beobachtung?)
  • Unterschied Gesamtnetzwerk und Ego-Netzwerk
    • Gesamtnetzwerke: Versucht alle im Hinblick auf eine bestimmte Fragestellung erforderlichen Beziehungen + Akteure zu erfassen
    • Ego-zentrierte Netzwerke: Versucht alle im Hinblick auf eine bestimmte Person (Ego) herum verankerten sozialen Netzwerke zu erfassen
  • Interoperabilität
    Fähigkeit zum Zusammenspiel verschiedener Systeme, Techniken oder Organisationen
  • Vor- und Nachteile CAT-Interview
    Vorteile: technisch ausgereift, gute Kontrolle, strukturiert, automatische Erfassung der Daten, Reduktion von menschlichen Fehlern, Nachteile: geringe Komplexität der Fragen, Soziale Erwünschtheit