Correlation and regression

Cards (19)

  • The correlation coefficient is the measure of association between two variables.
  • The response variable is on the y-axis, de explanatory variable on the x-axis.
  • De lm() functie wordt gebruikt voor het general linear model.
  • Deze functie kan op meerdere manieren gebruikt worden.
  • Er geldt y = respons variabele, en x = explanatory variabele, en X is categoriale explanatory variabele.
  • In een regressie, is y de respons variabele en x de explanatory variabele.
  • De nulhypotheses in een regressie is dat de intercept/slope is gelijk aan 0.
  • In een multiple regressie, is y de respons variabele en x de explanatory variabele.
  • De nulhypotheses in een multiple regressie is dat de intercept/slope is gelijk aan 0.
  • In een multiple regressie, is de p-waarde van H0 gelijk aan de t-waarde van H0.
  • In een multiple regressie, is de multiple R-squared de variantie uitgelegd door het model.
  • De CI in een multiple regressie kan je met R bereken, maar kan ook met estimates en SE.
  • In een multiple regressie, kan je waardes uit het model voorspellen als er regressie is, dit doe je met predict().
  • In een Anova tabel, is de df bovenste rij de k-1 (met k is aantal parameters: 2intercept en slope), de df onderste rij is n-k, en SSregression is de variantie door regressie, SSerror is de variantie niet door regressie, en MS is de standardized SS van de df, gelijk aan SS/degress of freedom.
  • Er zijn meerdere soorten correlaties: Pearson correlatie, een lineaire associatie tussen twee variabelen, en Spearman correlatie, als aannames van Pearson niet goed zijn.
  • Als je outliers hebt, verwijder je deze nooit meteen, je doet de analyse met en zonder outliers en rapporteert van beide de resultaten.
  • Een regressie lijn gaat alleen de lengte van de punten, nooit door de hele grafiek heen.
  • Correlatie meet hoe X en Y samenwerken (associatie), en regressie voorspelt Y op basis van X, X veroorzaakt Y.
  • A scatterplot shows how the values of one variable are related to those of another variable.