Tabulky rozdělení četností

Základní přehled o hodnotách proměnné ve statistickém souboru poskytuje tabulka rozdělení četností. V následujícím textu se omezíme pouze na případ kategoriální proměnné (VAR00001), kdy sledujeme četnosti výskytu jednotlivých obměn znaku.

Níže uvedená tabulka obsahuje pět sloupců. V prvním jsou uvedeny jednotlivé obměny znaku (xi), ve druhém jejich absolutní četnosti (ni). Hodnoty ve třetím sloupci vyjadřují podíly počtu výskytů dané kategorie na celkovém rozsahu souboru (relativní četnosti), a to v procentech (100 pi). Čtvrtý sloupec je určen pro relativní četnosti počítané pouze z tzv. platných hodnot (nejsou zahrnuty chybějící údaje); zobrazuje se bez ohledu na to, zda v souboru jsou či nejsou (náš případ) chybějící údaje. V pátém sloupci jsou uvedeny kumulativní relativní četnosti (vyjádřené v procentech).

 

Výpočet kumulativních relativních četností (Pi) je prováděn dle následujícího postupu

P1 = p1,

P2 = p1 + p2,

 (K je počet obměn znaku, v našem případě K = 5).

Z výše uvedené tabulky rozdělení četností můžeme určit nebo spočítat některé základní statistické charakteristiky (statistiky). Záleží však většinou na tom, o jaký typ proměnné se jedná. Pro všechny typy kategoriální proměnné lze určit modus, tj. nejčetnější (modální) kategorii. Pro proměnnou VAR00001 je modální kategorie označena kódem 2.

Pro ordinální a kvantitativní proměnné můžeme dále určit minimální (xmin) a maximální (xmax) hodnotu – v našem případě xmin = 1 a xmax = 5. K dalším charakteristikám pak patří medián, což je prostřední hodnota uspořádaného souboru. Jestliže si označíme pořadí mediánové kategorie zkratkou Me, pak platí, že PMe-1 < 0,5 a PMe ł 0,5. Pro naši sledovanou proměnnou je výsledkem Me = 2 (PMe = 64,3). Medián patří do skupiny charakteristik, které se nazývají kvantily (percentily). Konkrétně jde o padesátiprocentní kvantil. Obdobně můžeme stanovit 25 % kvantil, tj. dolní kvartil (rovněž kategorie s kódem 2), a 75 % kvantil, tj. horní kvartil (kategorie s kódem 3). Medián je tedy označován též jako prostřední kvartil.

Jestliže kódy proměnné vyjadřují číselné údaje (např. počet členů domácnosti), pak můžeme na základě tabulky rozdělení četností spočítat též například aritmetický průměr.

I když uvedené statistické charakteristiky s výjimkou aritmetického průměru můžeme vyčíst přímo z tabulky, programové systémy poskytují jejich speciální výpis, například ve formě uvedené níže.

Vysvětlivky: 

Valid

počet platných hodnot

Missing

počet chybějících údajů

Mean

aritmetický průměr

Median

medián

Mode

modus

Minimum

minimální hodnota

Maximum

maximální hodnota

Percentiles

percentily

 

Statistických charakteristik existuje samozřejmě mnohem více, předkládaný text je velmi stručným naznačením dané problematiky.