Statistika vol.1

    Cards (37)

    • Typy pravděpodobnostního rozdělení náhodné veličiny
      • Asymetrické
      • Extrémní
      • Normální
      • Nepravidelné
    • Statistické charakteristiky
      • Míra polohy (aritmetický průměr, medián apod...)
      • Míry variability (rozptyl, variační koeficient, apod...)
    • Míra polohy
      • n – značka rozsahu souboru
      • aritmetický průměr = střední hodnota statistického znaku
      • modus = hodnota nejčastěji se v souboru vyskytující
      • medián = prostřední hodnota – je-li liché číslo, medián je prostřední hodnota
    • Míry polohy – kvantily

      • medián (n/2 = 11,5 = 12-tá hodnota uspořádaného výběru = 164)
      • dolní kvartil (n/4 = 5,75 = 6-tá hodnota uspořádaného výběru = 155)
      • horní kvantil (3n/4 = 17,25 = 18-tá hodnota uspořádaného výběru = 173)
    • Míra polohy – významné kvantily

      • kvartily (dolní kvartil x0,25; medián x0,5; horní kvartil x0,75)
      • decily (X0,1; X0,2;.....;X0,9)
      • percentily (X0,01, X0,02;.....;X0,99)
    • Rozptyl
      Nejpoužívanější míra variability, průměrná hodnota ze součtu čtverců odchylek jednotlivých hodnot souboru od aritmetického průměru, charakterizuje střední stupeň kolísání hodnot v souboru kolem aritmetického průměru, je vyjádřen ve druhých mocninách jednotek sledovaného znaku
    • Pro základní statistický soubor se označuje σ2, pro výběrový soubor S2
    • Velmi rozsáhlé soubory či nekonečné soubory dat se označují jako základní statistický soubor
    • Konečné soubory desítek až tisíc se označují jako výběrový statistický soubor
    • Směrodatná odchylka σ (základní soubor) respektive S (výběrový soubor)

      Kladná hodnota druhé odmocniny rozptylu, vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách v jakých je vyjádřen aritmetický průměr
    • Variační koeficient Vk
      Relativní charakteristika variability, vyjadřuje variabilitu ve srovnatelném měřítku, využívá se pro porovnání variabilit většího počtu u znaků, které často nabývají nejen rozdílné úrovně hodnot, ale jsou i v rozdílných jednotkách
    • Variační rozpětí R
      Rozdíl mezi maximální a minimální hodnotou znaku, používá se jako základní informace pro návrh hranic intervalů při statistickém třídění
    • Mezikvartilové rozpětí
      Rozdíl mezi horním a dolním kvartilem, udává délku intervalu, ve kterém leží zhruba polovina pozorovaných hodnot
    • Variační rozpětí a mezikvartilové rozpětí nevypovídá nic o variabilitě uvnitř souboru – upřednostňují se složitější míry
    • Vážený průměr
      Užívá se v případě, že jednotlivé hodnoty mají různou důležitost – váhu p, tu je nutno přiřadit každé hodnotě. V případě, že mají všechny hodnoty stejnou váhu, je vážený průměr totožný s průměrem aritmetickým.
    • Chronologický průměr
      Zvláštní případ aritmetického průměru používaného v souboru tvořeném tzv. okamžitou časovou řadou (například údaje měřené k prvnímu dni v měsíci), předpoklad – okamžik měření leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
    • Geometrický průměr
      Střední hodnota, pro kterou je určující funkcí součin hodnot znaku x1 až xn, nejčastěji používán ke stanovení průměrného indexu změn v časové řadě
    • Harmonický průměr
      Střední hodnota používaná ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
    • Kvadratický průměr
      Statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot, umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
    • Míra variability
      • směrodatná odchylka (základní soubor, respektive výběrový soubor)
      • variační koeficient
    • Okamžik měření
      Leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
    • Geometrický průměr
      • Je střední hodnotou, pro kterou je určující funkcí součin hodnot znaku x1 až xn
      • Je nejčastěji používán ke stanovení průměrného indexu změn v časové řadě, přičemž je aritmetickým průměrem nezastupitelný
      • Výchozími údaji jsou nejčastěji indexy změn naměřené v jednotlivých letech i, nebo hodnoty sledovaného znaku Y, naměřené v posledním n-tém roce (yn) a v nultém roce (y0)
    • Harmonický průměr
      Je střední hodnotou používanou ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
    • Kvadratický průměr
      • Je statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot
      • Umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
    • Směrodatná odchylka
      • Je kladná hodnota druhé odmocniny rozptylu
      • Vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách, v jakých je vyjádřen aritmetický průměr
    • Spojitá proměnná
      • Vždy obsahuje nekonečný počet variant
      • Hodnotami jsou typicky reálná čísla
      • Nedokážeme určit předchozí ani následující variantu
      • Příklady: váha osoby, výška osoby, pH, koncentrace toxických látek ve vodě nebo v ovzduší apod...
    • Spojité rozdělení
      • Rovnoměrné rozdělení – nejjednodušší typ, <a,b>; doba, která uplyne od náhodně zvoleného okamžiku do nastoupení jevu, který se pravidelně opakuje; dráha, kterou je třeba urazit z náhodně zvoleného bodu do cíle
      • Normální rozdělení (Gaussovo) – určuje pravděpodobnost, že náhodná veličina X z normálního rozdělení bude nabývat hodnot z nějakého intervalu (a,b)
      • Logaritmicko-normální rozdělení – popis pravděpodobnostního chování (př. u placeba nebo reakce organismu na léky)
    • Diskrétní (nespojitá) proměnná
      • Obsahuje konečný počet variant nebo obsahuje spočetný počet variant
      • Často se jedná o celá čísla
      • Vyznačuje se tím, že jsme vždy schopni říci, jaké jsou další a předchozí varianty
      • Může být nekonečná, ale musí být spočetná – to znamená, že stále musíme být schopni určit předchozí a následující variantu
      • Příklady: počet opakovaných hospitalizací, počet zvířecích druhů na jednotku plochy nebo objemu
    • Diskrétní rozdělení
      • Binomické rozdělení (n pokusů se stejnou pravděpodobností) – počet úspěšných (neúspěšných) zásahů při n výstřelech do terče, počet chlapců (dívek) v rodině s n dětmi
      • Poissonovo rozdělení – popisuje chování vzácných jevů s malou pravděpodobností výskytu (př. počet výskytu nemocí)
      • Geometrické rozdělení (speciální případ Pascalova rozdělení) – veličina X (počet pokusů) – doba čekání na první úspěch
    • Statistický soubor
      • Vymezení: Věcné (druhové), Prostorové, Časové
      • Rozsah: Základní soubor (populace), Výběrový soubor (vzorek)
      • Obsah: Je určen znaky statistických jednotek
    • Statistický znak
      Proměnná – vnější, pozorovatelný, měřitelný projev vlastností statistické jednotky
    • Variabilní statistický znak
      Vlastnosti, v nichž se jednotky souboru mohou lišit
    • Statistické zjišťování
      Šetření (zjišťování) – pořízení údajů o jednotlivých proměnných u jednotek daného základního souboru
    • Třídění
      • Třídění jednotek podle jednoho znaku v rámci statistického souboru umožňuje popis jeho charakteristických skupin
      • Třídění jednoduché = jednostupňové
      • Třídění vícestupňové
    • Třídící znaky (kritéria)

      Znaky umožňující roztřídění souboru do skupin
    • Statistické charakteristiky
      Charakteristika vlastnosti množiny hodnot = charakteristika vlastnosti souboru daných jednotek, například aritmetický průměr
    • Techniky pořizování dat
      • Český statistický úřad, agenturní údaje, evidence, dotazy k zákazníkům = výběrový soubor
      • Typy výběru: Ankety – orientační data, Caravana testy – přesnější, Kvóty výběru – podle kvótních znaků
    See similar decks