Bodové a intervalové odhady pro četnosti

Předpokládejme, že máme k dispozici výběrový soubor o rozsahu n. V základním souboru jsou jednotlivé kategorie charakterizovány relativní četností pi (i=1, 2, …, K). Na základě výběrového souboru lze pro každou kategorii zjistit bodový odhad pi její relativní četnosti, kterým je relativní četnost vypočítaná na základě hodnot z výběrového souboru:

, kde ni je absolutní četnost zjištěná pro i-tou kategorii výběrového souboru.

Při výpočtu mezí intervalového odhadu záleží na velikosti výběrového souboru a na absolutní četnosti výskytu sledované kategorie. Pro tzv. velký výběr, tj. n ł 30, v němž ni ł 5 a n - ni ł 5, vypočítáme dolní (pD) a horní (pH) mez intervalu podle vzorce

, kde sp je směrodatná chyba odhadu, která je daná vzorcem

 

Pro malý výběr, kdy n Ł 30 nebo 30 < n Ł 50 a ni < 5, se využívají následující vzorce:

, kde F1-a/2(q1,q2) je 1-a/2 procentní kvantil z F rozdělení s parametry q1 a q2, přičemž q1 = 2(n-ni+1) a q2=2ni,

, kde F1-a/2(r1,r2) je 1-a/2 procentní kvantil z F rozdělení s parametry r1 a r2, přičemž r1 = 2(ni+1) a q2=2(n-ni).

 

Pro výběry, kdy n ł 50 a ni < 5, lze pro výpočet dolní a horní meze využít kvantily z chí-kvadrát rozdělení:

, kde je a/2 procentní kvantil z C 2 rozdělení s parametrem 2ni,

.

Obdobně pro n ł 50 a n - ni ł 5:

                a               .

 

Dalším speciálním případem jsou výběry o rozsahu n ł 50 s absolutní četností ni = 0. Tehdy pD = 0 a , tj. 95 procentní interval spolehlivosti pro relativní četnost je stanoven jako (0;3/n) a 99 procentní jako (0;4,6/n).

Pro n ł 50 a n - ni = 0 platí, že a pH = 1, tj.jako 95 procentní interval dostáváme (1-3/n;1) a jako 99 procentní pak (1-4,6/n;1).

 

Jestliže sledujeme četnosti pro S kategorií, pak počítáme simultánní intervaly spolehlivosti, kdy postupujeme stejným způsobem s jedinou výjimkou, že místo 1-a/2 používáme 1-a/2 S procentní kvantily.