dolní kvartil (n/4 = 5,75 = 6-tá hodnota uspořádaného výběru = 155)
horní kvantil (3n/4 = 17,25 = 18-tá hodnota uspořádaného výběru = 173)
Míra polohy – významné kvantily
kvartily (dolní kvartil x0,25; medián x0,5; horní kvartil x0,75)
decily (X0,1; X0,2;.....;X0,9)
percentily (X0,01, X0,02;.....;X0,99)
Rozptyl
Nejpoužívanější míra variability, průměrná hodnota ze součtu čtverců odchylek jednotlivých hodnot souboru od aritmetického průměru, charakterizuje střední stupeň kolísání hodnot v souboru kolem aritmetického průměru, je vyjádřen ve druhých mocninách jednotek sledovaného znaku
Pro základní statistický soubor se označuje σ2, pro výběrový soubor S2
Velmi rozsáhlé soubory či nekonečné soubory dat se označují jako základní statistický soubor
Konečné soubory desítek až tisíc se označují jako výběrový statistický soubor
Směrodatná odchylka σ (základní soubor) respektive S (výběrový soubor)
Kladná hodnota druhé odmocniny rozptylu, vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách v jakých je vyjádřen aritmetický průměr
Variační koeficient Vk
Relativní charakteristika variability, vyjadřuje variabilitu ve srovnatelném měřítku, využívá se pro porovnání variabilit většího počtu u znaků, které často nabývají nejen rozdílné úrovně hodnot, ale jsou i v rozdílných jednotkách
Variační rozpětí R
Rozdíl mezi maximální a minimální hodnotou znaku, používá se jako základní informace pro návrh hranic intervalů při statistickém třídění
Mezikvartilové rozpětí
Rozdíl mezi horním a dolním kvartilem, udává délku intervalu, ve kterém leží zhruba polovina pozorovaných hodnot
Variační rozpětí a mezikvartilové rozpětí nevypovídá nic o variabilitě uvnitř souboru – upřednostňují se složitější míry
Vážený průměr
Užívá se v případě, že jednotlivé hodnoty mají různou důležitost – váhu p, tu je nutno přiřadit každé hodnotě. V případě, že mají všechny hodnoty stejnou váhu, je vážený průměr totožný s průměrem aritmetickým.
Chronologický průměr
Zvláštní případ aritmetického průměru používaného v souboru tvořeném tzv. okamžitou časovou řadou (například údaje měřené k prvnímu dni v měsíci), předpoklad – okamžik měření leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
Geometrický průměr
Střední hodnota, pro kterou je určující funkcí součin hodnot znaku x1 až xn, nejčastěji používán ke stanovení průměrného indexu změn v časové řadě
Harmonický průměr
Střední hodnota používaná ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
Kvadratický průměr
Statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot, umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
Míra variability
směrodatná odchylka (základní soubor, respektive výběrový soubor)
variační koeficient
Okamžik měření
Leží uprostřed časového úseku, který naměřená hodnota xi prezentuje
Geometrický průměr
Je střední hodnotou, pro kterou je určující funkcí součin hodnot znaku x1 až xn
Je nejčastěji používán ke stanovení průměrného indexu změn v časové řadě, přičemž je aritmetickým průměrem nezastupitelný
Výchozími údaji jsou nejčastěji indexy změn naměřené v jednotlivých letech i, nebo hodnoty sledovaného znaku Y, naměřené v posledním n-tém roce (yn) a v nultém roce (y0)
Harmonický průměr
Je střední hodnotou používanou ke stanovení průměrné normy spotřeby času na jednotku výkonu z údajů o spotřebách času dosažených v souboru pracovníku nebo v souboru strojů stejného typu
Kvadratický průměr
Je statistická veličina představující druhou odmocninu aritmetického průměru druhých mocnin daných hodnot
Umocnění hodnot před výpočtem aritmetického průměru má za následek větší váhu hodnot
Směrodatná odchylka
Je kladná hodnota druhé odmocniny rozptylu
Vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách, v jakých je vyjádřen aritmetický průměr
Spojitá proměnná
Vždy obsahuje nekonečný počet variant
Hodnotami jsou typicky reálná čísla
Nedokážeme určit předchozí ani následující variantu
Příklady: váha osoby, výška osoby, pH, koncentrace toxických látek ve vodě nebo v ovzduší apod...
Spojité rozdělení
Rovnoměrné rozdělení – nejjednodušší typ, <a,b>; doba, která uplyne od náhodně zvoleného okamžiku do nastoupení jevu, který se pravidelně opakuje; dráha, kterou je třeba urazit z náhodně zvoleného bodu do cíle
Normální rozdělení (Gaussovo) – určuje pravděpodobnost, že náhodná veličina X z normálního rozdělení bude nabývat hodnot z nějakého intervalu (a,b)
Logaritmicko-normální rozdělení – popis pravděpodobnostního chování (př. u placeba nebo reakce organismu na léky)
Diskrétní (nespojitá) proměnná
Obsahuje konečný počet variant nebo obsahuje spočetný počet variant
Často se jedná o celá čísla
Vyznačuje se tím, že jsme vždy schopni říci, jaké jsou další a předchozí varianty
Může být nekonečná, ale musí být spočetná – to znamená, že stále musíme být schopni určit předchozí a následující variantu
Příklady: počet opakovaných hospitalizací, počet zvířecích druhů na jednotku plochy nebo objemu
Diskrétní rozdělení
Binomické rozdělení (n pokusů se stejnou pravděpodobností) – počet úspěšných (neúspěšných) zásahů při n výstřelech do terče, počet chlapců (dívek) v rodině s n dětmi
Poissonovo rozdělení – popisuje chování vzácných jevů s malou pravděpodobností výskytu (př. počet výskytu nemocí)
Geometrické rozdělení (speciální případ Pascalova rozdělení) – veličina X (počet pokusů) – doba čekání na první úspěch
Statistický soubor
Vymezení: Věcné (druhové), Prostorové, Časové
Rozsah: Základní soubor (populace), Výběrový soubor (vzorek)
Obsah: Je určen znaky statistických jednotek
Statistický znak
Proměnná – vnější, pozorovatelný, měřitelný projev vlastností statistické jednotky
Variabilní statistický znak
Vlastnosti, v nichž se jednotky souboru mohou lišit
Statistické zjišťování
Šetření (zjišťování) – pořízení údajů o jednotlivých proměnných u jednotek daného základního souboru
Třídění
Třídění jednotek podle jednoho znaku v rámci statistického souboru umožňuje popis jeho charakteristických skupin
Třídění jednoduché = jednostupňové
Třídění vícestupňové
Třídící znaky (kritéria)
Znaky umožňující roztřídění souboru do skupin
Statistické charakteristiky
Charakteristika vlastnosti množiny hodnot = charakteristika vlastnosti souboru daných jednotek, například aritmetický průměr
Techniky pořizování dat
Český statistický úřad, agenturní údaje, evidence, dotazy k zákazníkům = výběrový soubor
Typy výběru: Ankety – orientační data, Caravana testy – přesnější, Kvóty výběru – podle kvótních znaků