Základní statistické pojmy

Při statistické analýze jsou předmětem zkoumání statistické znaky, jako například příjem domácnosti v ČR v lednu 2000, tržba podniku v ČR za třetí čtvrtletí roku 1999 či stupeň spokojenosti obyvatele ČR s životní úrovní v roce 1998. Statistický znak je tedy věcně, prostorově a časově vymezený pojem. Zkoumáme ho u statistických jednotek, kterými jsou například domácnosti, podniky či osoby. Sledované statistické jednotky tvoří statistický soubor. Všechny jednotky určitého druhu (např. všechny čtyřčlenné domácnosti se dvěma dětmi v ČR) tvoří soubor základní (populaci). Ten je v praxi většinou charakterizován na základě údajů zjištěných pouze u vybraných jednotek, které tvoří výběrový statistický soubor.

Proces získávání potřebných údajů se nazývá statistické zjišťování (šetření). Jestliže zkoumáme celý základní soubor, pak jde o zjišťování vyčerpávající. Šetření výběrového souboru označujeme odpovídajícím názvem, tj. jako výběrové.

Kromě výše uvedeného základního přístupu můžeme zjišťovat údaje týkající se jediné statistické jednotky, ale v různých časových obdobích (hodinách, dnech, měsících, čtvrtletích, letech apod.). V tomto případě dostaneme časovou řadu (kurzu koruny, nákladů či tržeb ekonomického subjektu).

V makroekonomickém měřítku jde často o spojení obou zmíněných přístupů. Sledujeme například nejprve statistický znak „tržba“ u statistických jednotek, kterými jsou průmyslové podniky v ČR v lednu 1998. Agregací všech získaných hodnot (v našem případě součtem), získáme jediný údaj. Pokud postup opakujeme v dalších měsících, získáme měsíční časovou řadu tržeb v průmyslu např. za léta 1998 a 1999.

Obdobně můžeme sledovat průměrné roční příjmy určitého typu domácností, kdy agregační funkcí v určitém roce bude aritmetický průměr. Uvedené agregované údaje jsou již vlastně výsledkem statistických výpočtů (součet, průměr).

V ekonomické statistice je používán pojem statistický ukazatel. Tento pojem je používán jednak pro statistické znaky sledované u domácností či podniků (vstupní ukazatele), tak pro agregované údaje (výstupní ukazatele).

Základní klasifikace statistických dat spočívá v jejich členění na

 

Obrázek 1 - Data v tabulce

Obrázek 1 - Data v tabulce

Obrázek 2 - Data ve formuláři

Tabulka 1 - Průměrné příjmy a výdaje na 1 člena domácnosti v roce 1998

Typ domácnosti

Roční peněžní příjmy (Kč)

Roční peněžní výdaje (Kč)

Průměrný počet členů

Počet domácností

zaměstnanců

100 544

96 067

2,81

1 370

zaměstnanců s dětmi

85 791

82 282

3,58

799

samostatně činných

87 077

88 807

3,17

342

zemědělců

80 363

78 879

3,11

327

důchodců

70 152

71 076

1,49

522

 Ze zmíněného stručného úvodu do problematiky je zřejmé, že ve statistice musíme brát v úvahu různé datové struktury. Základní z nich je datová matice, v níž každý řádek (případ) obsahuje veškerá pozorování (měření) týkající se jedné statistické jednotky a sloupce odpovídají jednotlivým statistickým znakům. Sloupec představuje veličinu, která nabývá různých hodnot, proto se nejčastěji označuje jako proměnná, viz následující schéma.

 

1. proměnná

2. proměnná

1. případ

 

 

 

2. případ

 

 

 

 

 

 

V současných programových systémech mohou být data vkládána buď do tabulky (obrázek 1), která odpovídá zmíněné datové matici, nebo do formuláře (obrázek 2), v němž jsou vyplňovány údaje odpovídající jedné statistické jednotce. Do sloupců tabulky (resp. tomu odpovídajících políček ve formuláři) můžeme kromě hodnot sledovaných znaků vkládat i doplňující informace, jako je název statistické jednotky či její jednoznačná identifikace (např. IČO nebo rodné číslo), což je důležité pro následnou kontrolu údajů.