Statistika vol.1

Cards (37)

  • Typy pravděpodobnostního rozdělení náhodné veličiny
    • Asymetrické
    • Extrémní
    • Normální
    • Nepravidelné
  • Statistické charakteristiky
    • Míra polohy (aritmetický průměr, medián apod...)
    • Míry variability (rozptyl, variační koeficient, apod...)
  • Míra polohy
    • n – značka rozsahu souboru
    • aritmetický průměr = střední hodnota statistického znaku
    • modus = hodnota nejčastěji se v souboru vyskytující
    • medián = prostřední hodnota – je-li liché číslo, medián je prostřední hodnota
  • Míry polohy – kvantily

    • medián (n/2 = 11,5 = 12-tá hodnota uspořádaného výběru = 164)
    • dolní kvartil (n/4 = 5,75 = 6-tá hodnota uspořádaného výběru = 155)
    • horní kvantil (3n/4 = 17,25 = 18-tá hodnota uspořádaného výběru = 173)
  • Míra polohy – významné kvantily

    • kvartily (dolní kvartil x0,25; medián x0,5; horní kvartil x0,75)
    • decily (X0,1; X0,2;.....;X0,9)
    • percentily (X0,01, X0,02;.....;X0,99)
  • Rozptyl
    Nejpoužívanější míra variability, průměrná hodnota ze součtu čtverců odchylek jednotlivých hodnot souboru od aritmetického průměru, charakterizuje střední stupeň kolísání hodnot v souboru kolem aritmetického průměru, je vyjádřen ve druhých mocninách jednotek sledovaného znaku
  • Pro základní statistický soubor se označuje σ2, pro výběrový soubor S2
  • Velmi rozsáhlé soubory či nekonečné soubory dat se označují jako základní statistický soubor
  • Konečné soubory desítek až tisíc se označují jako výběrový statistický soubor
  • Směrodatná odchylka σ (základní soubor) respektive S (výběrový soubor)

    Kladná hodnota druhé odmocniny rozptylu, vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách v jakých je vyjádřen aritmetický průměr
  • Variační koeficient Vk
    Relativní charakteristika variability, vyjadřuje variabilitu ve srovnatelném měřítku, využívá se pro porovnání variabilit většího počtu u znaků, které často nabývají nejen rozdílné úrovně hodnot, ale jsou i v rozdílných jednotkách
  • Variační rozpětí R
    Rozdíl mezi maximální a minimální hodnotou znaku, používá se jako základní informace pro návrh hranic intervalů při statistickém třídění
  • Mezikvartilové rozpětí
    Rozdíl mezi horním a dolním kvartilem, udává délku intervalu, ve kterém leží zhruba polovina pozorovaných hodnot
  • Variační rozpětí a mezikvartilové rozpětí nevypovídá nic o variabilitě uvnitř souboru – upřednostňují se složitější míry
  • Vážený průměr
    Užívá se v případě, že jednotlivé hodnoty mají různou důležitost – váhu p, tu je nutno přiřadit každé hodnotě. V případě, že mají všechny hodnoty stejnou váhu, je vážený průměr totožný s průměrem aritmetickým.
  • Chronologický průměr
    Zvláštní případ aritmetického průměru používaného v souboru tvořeném tzv. okamžitou časovou řadou (například údaje měřené k prvnímu dni v měsíci), předpoklad – okamžik měření leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
  • Geometrický průměr
    Střední hodnota, pro kterou je určující funkcí součin hodnot znaku x1 až xn, nejčastěji používán ke stanovení průměrného indexu změn v časové řadě
  • Harmonický průměr
    Střední hodnota používaná ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
  • Kvadratický průměr
    Statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot, umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
  • Míra variability
    • směrodatná odchylka (základní soubor, respektive výběrový soubor)
    • variační koeficient
  • Okamžik měření
    Leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
  • Geometrický průměr
    • Je střední hodnotou, pro kterou je určující funkcí součin hodnot znaku x1 až xn
    • Je nejčastěji používán ke stanovení průměrného indexu změn v časové řadě, přičemž je aritmetickým průměrem nezastupitelný
    • Výchozími údaji jsou nejčastěji indexy změn naměřené v jednotlivých letech i, nebo hodnoty sledovaného znaku Y, naměřené v posledním n-tém roce (yn) a v nultém roce (y0)
  • Harmonický průměr
    Je střední hodnotou používanou ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
  • Kvadratický průměr
    • Je statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot
    • Umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
  • Směrodatná odchylka
    • Je kladná hodnota druhé odmocniny rozptylu
    • Vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách, v jakých je vyjádřen aritmetický průměr
  • Spojitá proměnná
    • Vždy obsahuje nekonečný počet variant
    • Hodnotami jsou typicky reálná čísla
    • Nedokážeme určit předchozí ani následující variantu
    • Příklady: váha osoby, výška osoby, pH, koncentrace toxických látek ve vodě nebo v ovzduší apod...
  • Spojité rozdělení
    • Rovnoměrné rozdělení – nejjednodušší typ, <a,b>; doba, která uplyne od náhodně zvoleného okamžiku do nastoupení jevu, který se pravidelně opakuje; dráha, kterou je třeba urazit z náhodně zvoleného bodu do cíle
    • Normální rozdělení (Gaussovo) – určuje pravděpodobnost, že náhodná veličina X z normálního rozdělení bude nabývat hodnot z nějakého intervalu (a,b)
    • Logaritmicko-normální rozdělení – popis pravděpodobnostního chování (př. u placeba nebo reakce organismu na léky)
  • Diskrétní (nespojitá) proměnná
    • Obsahuje konečný počet variant nebo obsahuje spočetný počet variant
    • Často se jedná o celá čísla
    • Vyznačuje se tím, že jsme vždy schopni říci, jaké jsou další a předchozí varianty
    • Může být nekonečná, ale musí být spočetná – to znamená, že stále musíme být schopni určit předchozí a následující variantu
    • Příklady: počet opakovaných hospitalizací, počet zvířecích druhů na jednotku plochy nebo objemu
  • Diskrétní rozdělení
    • Binomické rozdělení (n pokusů se stejnou pravděpodobností) – počet úspěšných (neúspěšných) zásahů při n výstřelech do terče, počet chlapců (dívek) v rodině s n dětmi
    • Poissonovo rozdělení – popisuje chování vzácných jevů s malou pravděpodobností výskytu (př. počet výskytu nemocí)
    • Geometrické rozdělení (speciální případ Pascalova rozdělení) – veličina X (počet pokusů) – doba čekání na první úspěch
  • Statistický soubor
    • Vymezení: Věcné (druhové), Prostorové, Časové
    • Rozsah: Základní soubor (populace), Výběrový soubor (vzorek)
    • Obsah: Je určen znaky statistických jednotek
  • Statistický znak
    Proměnná – vnější, pozorovatelný, měřitelný projev vlastností statistické jednotky
  • Variabilní statistický znak
    Vlastnosti, v nichž se jednotky souboru mohou lišit
  • Statistické zjišťování
    Šetření (zjišťování) – pořízení údajů o jednotlivých proměnných u jednotek daného základního souboru
  • Třídění
    • Třídění jednotek podle jednoho znaku v rámci statistického souboru umožňuje popis jeho charakteristických skupin
    • Třídění jednoduché = jednostupňové
    • Třídění vícestupňové
  • Třídící znaky (kritéria)

    Znaky umožňující roztřídění souboru do skupin
  • Statistické charakteristiky
    Charakteristika vlastnosti množiny hodnot = charakteristika vlastnosti souboru daných jednotek, například aritmetický průměr
  • Techniky pořizování dat
    • Český statistický úřad, agenturní údaje, evidence, dotazy k zákazníkům = výběrový soubor
    • Typy výběru: Ankety – orientační data, Caravana testy – přesnější, Kvóty výběru – podle kvótních znaků