Statistika

Cards (82)

  • Regresiona i korelaciona analiza

    Kada možemo modelirati vezu između dvije ili više varijabli?
  • Varijable
    • Kada su varijable zavisne
    • Moguće je modelirati kvantitativne varijable (kompletirati dijagram rasipanja, izračunavati sintetičke pokazatelje, posmatrati promjene varijabli)
  • Smjer veze između dvije varijable
    • Pozitivan ili direktan (porast vrijednosti jedne varijable uslovljava porast vrijednosti druge varijable i obrnuto)
    • Negativan ili indirektan (porast vrijednosti jedne varijable uslovljava pad vrijednosti druge varijable i obrnuto)
  • Dijagram (oblak) rasipanja

    • Služi za vizuelnu identifikaciju međuzavisnosti između dvije varijable (jedna nezavisna, jedna zavisna)
    • Homogen raspored tačaka ukazuje na jaču vezu, heterogenost na slabiju vezu
  • Dijagram rasipanja pomaže odgovoriti na pitanja: Da li postoji veza između varijabli X i Y? Kojeg smjera je veza između varijabli X i Y? Da li je ta veza pravolinijska (linearna) ili nije? Da li postoje outlieri?
  • Dijagram rasipanja - Da li postoji veza između varijabli X i Y?

    • Veza postoji
    • Veza ne postoji (ili je vrlo slaba)
  • Dijagram rasipanja - Smjer veze između varijabli X i Y
    • Direktna veza
    • Indirektna veza
  • Indeks količina
    Indeks cijena
  • Imamo podatke o danima pohađanja nastave i ocjenama za 14 studenata. Naš zadatak je da analiziramo vezu između ovih varijabli na osnovu dijagrama rasipanja.

    • Dani pohađanja nastave
    • Ocjena
  • Nezavisna varijabla je broj dana pohađanja nastave, zavisna varijabla je ocjena
  • Na bazi dijagrama rasipanja zaključujemo: Postoji međuzavisnost, smjer veze je direktan (više dana pohađanja nastave veća ocjena), veza se može ocijeniti linearnim regresionim modelom
  • Kovarijansa

    Simultano prati varijabilitet dvije varijable, mjeri uzajamni varijabilitet dvije varijable u odnosu na njihove aritmetičke sredine
  • Tumačenje kovarijanse
    Pozitivna ako oblak rasipanja ima rastuću tendenciju, negativna ako ima opadajuću tendenciju, jednaka nuli ako nema ni rastuće ni opadajuće tendencije
  • Varijansa zbira i razlike statističkih varijabli
    • Var(X +Y)=Var X + Var Y + 2 Cov(X,Y), Var(X-Y)=Var X + Var Y - 2 Cov(X,Y)
    • Ako su X i Y nezavisne, Cov(X, Y)=0, tada Var(X+Y)=Var X + Var Y, Var(X-Y)=Var X + Var Y
  • Regresioni model – opšti oblik
    Kvantificira vezu između zavisne i niza nezavisnih varijabli, opšti oblik: Y = f(X1, X2,..., Xj,..., Xk) + ei
  • Model jednostavne regresije

    Sadrži zavisnu i jednu nezavisnu promjenljivu, Y = f(X) + ei
  • Model jednostavne linearne regresije

    Sadrži zavisnu i jednu nezavisnu promjenljivu, y = a + bx + ei
  • Razložimo model jednostavne linearne regresije

    Funkcionalni dio: linearna veza, Stohastički dio: rezidualno odstupanje
  • Metoda najmanjih kvadrata
    Kriterij minimiziranja zbira kvadrata rezidualnih odstupanja, sistem normalnih jednačina za ocjenu parametara a i b
  • faktora koji nisu uključeni u regresioni model
    stohastički dio modela
  • funkcionalni dio modela
    y = a + bx + e
  • Model jednostavne linearne regresije
    1. Rezidualno odstupanje ili stohastički dio regresionog modela
    2. Metoda najmanjih kvadrata
  • Metoda najmanjih kvadrata
    Kriterij metode bazira se na minimiziranju zbira kvadrata rezidualnih odstupanja
  • Parametar a
    Matematski "presjek sa y osom", očekivana vrijednost zavisne varijable kada je nezavisna 0
  • Parametar b
    Matematski "nagib" prave, pokazuje za koliko će se jedinica promijeniti zavisna varijabla ako se nezavisna poveća za 1
  • Regresioni model: y_hat = a + b*x
  • Ocjena će u prosjeku porasti za 0,0166 ako se broj dana pohađanja nastave poveća za 1
  • Student koji ima 0 skor (0 dana) za pohađanje nastave će prema modelu imati ocjenu 0,4097
  • Vrijednost "10" u funkciji y = 10 + 3,1*x
    Fiksni troškovi
  • Ako se broj agenata poveća za 1
    Broj prodanih polisa će se povećati za 8
  • Pokazatelji reprezentativnosti regresionog modela

    • Koeficijent determinacije
    • Koeficijent korelacije
    • Standardna greška
    • Koeficijent varijacije
  • Koeficijent determinacije
    Učešće objašnjenog varijabiliteta u ukupnom varijabilitetu zavisne varijable
  • Koeficijent linearne korelacije (Pearson)

    Mjeri jačinu i smjer povezanosti dvije pojave
  • Vrijednost koeficijenta linearne korelacije se nalazi između -1 i 1
  • Veća vrijednost koeficijenta ukazuje na postojanje veće linearne povezanosti između promjenjljivih X i Y
  • Kovarijansa
    Odnos kovarijanse varijabli X i Y i proizvoda standardnih devijacija varijable X i varijable Y
  • Koeficijent linearne korelacije
    Vrijednost se nalazi između -1 i 1
  • Veća vrijednost koeficijenta
    Ukazuje na postojanje veće linearne povezanosti između promjenjljivih X i Y
  • Manja vrijednost r ne mora uvijek značiti da je slaba korelacija jer se može raditi o pogrešnoj primjeni koeficijenta linearne korelacije za mjerenje jačine veze pojava koje nisu u linearnom odnosu
  • Tumačenje koeficijenta linearne korelacije
    • Za vrijednosti: -1 < r < 0 korelacija je negativna (stohastička)
    • Za vrijednosti: 0 < r < 1 korelacije je pozitivna (stohastička)
    • Za vrijednosti –1 i 1, radi se o perfektnoj negativnoj odnosno pozitivnoj korelaciji, tj. o funkcionalnoj vezi