Kontingenční tabulky

Tato část obsahuje přehled vzorců pro výpočty testových kritérií a měr intenzit závislostí na základě zjištěných četností uspořádaných v kontingenční tabulce. Názvy statistik a koeficientů jsou uváděny též anglicky.

Používaná značení

Symbol Význam (vzorec)
n počet pozorování (respondentů)
r počet řádků (kategorií proměnné X)
s počet sloupců (kategorií proměnné Y)


Hodnoty počítané pro jednotlivá políčka v kontingenční tabulce

Česky / Anglicky Značení a/nebo vzorec
Zjištěná četnost

Observed frequency

nij
Očekávaná četnost

Excepted frequency

, kde 
Reziduum

Residual (Deviation)

nij - mij
Standardizované reziduum

Standardized residual

… Poissonovo rozdělení 
…mutlinom. rozdělení
Normalizované reziduum

Adjusted residual

 
Odchylkové reziduum

Deviance residual

(nij ln(nij / mij) - (nij - mij))-1/2 … Poiss. r.
(2 nij ln(nij / mij))-1/2 … multinom. rozd.

 
Přehled pojmů (testy a koeficienty)

Typ tabulky

Typ testu a míra intenzity závislosti

2 x 2

chí-kvadrát test, poměr maximální věrohodnosti, Fisherův exaktní test, chí-kvadrát test s Yatesovou korekcí, relativní riziko, poměr šancí

r x s

chí-kvadrát test, poměr maximální věrohodnosti, fí, Cramérovo V, symetrická a nesymetrická lambda, Goodmanovo - Kruskalovo tau, koeficient nejistoty

r x s (ordinální)

gama, Spearmanův koeficient pořadové korelace (ró), Kendallovo tau-b a tau-c, Somersovo d

r x r

Cohenova kappa (míra souhlasu) 

 

TABULKY 2 x 2 (čtyřpolní)

Testové kritérium (statistika) chí-kvadrát (test o nezávislosti)
Pearson chi-square statistic
(též QP)

(chí-kvadrát rozdělení s 1 stupněm volnosti)

 

Statistika chí-kvadrát s opravou na spojitost (Yatesova korekce)
Continuity-adjusted chi-square statistic (continuity correction)

,

nebo

Poměr maximální věrohodnosti (pro loglineární modely)
Likelihood-ratio chi-square statistic

- v případě multinomického rozdělení

- v případě Poissonova rozdělení

Fisherův exaktní test (test o nezávislosti) – pro mij < 5

Fisher’s exact test

(marginální četnosti jsou považovány za neměnné, tudíž se předpokládá, že data jsou výběrem z hypergeometrického rozdělení - počítají se pravděpodobnosti výskytu všech možných obměn četností v kontingenční tabulce, které dávají stejné marginální četnosti jako tabulka zjištěných četností)

, kde p je pravděpodobnost výskytu určité obměny četností

a A je
pro oboustranný test: množina tabulek s p menší než nebo rovno pravděpodobnosti zjištěných četností,
pro levostranný test: množina tabulek s p menší než nebo rovno pravděpodobnosti zjištěných četností, kde n11 je menší než nebo rovno zjištěné četnosti,
pro pravostranný test: množina tabulek s p menší než nebo rovno pravděpodobnosti zjištěných četností, kde n11 je větší než nebo rovno zjištěné četnosti.

 

Korelační koeficient (koeficient asociace)
Pearson correlation coefficient (Pearson's R)

, tzn., že

Mantel-Haenszelova statistika chí-kvadrát (pro kvantitativní proměnné)
Mantel-Haenszel chi-square statistic (linear-by-linear association)

, kde rXY je korelační koeficient

Relativní riziko
Relative risk

a

Poměr šancí
Odds ratio

Koeficient fí
Phi-coefficient

McNemarovo testové kritérium (H0:)
McNemar's test statistic (McNemar test)

(chí-kvadrát rozdělení s 1 stupněm volnosti)

 

TABULKY r x s

Míry a testy pro nominální proměnné

Testové kritérium (statistika) chí-kvadrát (test o nezávislosti)
Pearson chi-square statistic
(QP)

(chí-kvadrát rozdělení s (r-1)(s-1) stupni volnosti)

Koeficient fí
Phi-coefficient

Cramérovo V (Cramérův koeficient kontingence)
Cramér's V

, kde q = min {r, s}

Kontingenční koeficient (Pearsonův koeficient průměrné čtvercové kontingence)
Contingency coefficient (coefficient of contingency)

Asymetrická lambda (Goodmanova-Kruskalova lambda)
Asymetric lambda (Goodman and Kruskal's lambda)

, kde niq=maxj(nij) a n+q=maxj(n+j)

obdobně druhá asymetrická míra lXY.

se spočítá tak, že se z obou asymetrických měr sečtou hodnoty v čitateli a dále hodnoty ve jmenovateli a získaný čitatel dělíme získaným jmenovatelem.

Goodmanovo-Kruskalovo tau
Goodman and Kruskal’s Tau

obdobně druhá asymetrická míra tXY.
 

Test na nulovost tau
A test that tau is 0

(n-1)(s-1)t   má chí-kvadrát rozdělení s (s-1)(r-1) stupni volnosti

Koeficient nejistoty
Uncertainty coefficient


Tabulka r x r

Cohenova kappa
Cohen's kappa (kappa coefficient)

, kde

Míry pro ordinální proměnné

Česky / Anglicky Vzorec
Gama

Gama

, kde
a
 
Kendallův koeficient tau-b

Kendall's tau-b

,
kde  
Kendallův koeficient tau-c

Kendall's tau-c

, kde q je min{r, s}
Somersovo d

Somers' d

,
Spearmanův koeficient pořadové korelace

Spearman's rho (correaltion coefficient)

 

 

Spearmanův koeficient pořadové korelace můžeme vyjádřit také pomocí marginálních četností:

  1. kategoriím proměnné X přiřadíme postupně pomocné skóry ai

    kategoriím proměnné Y přiřadíme pomocné skóry bj

  2. vypočítáme hodnoty



  3. dosadíme do vzorce


Míra pro kvantitativní vysvětlovanou proměnnou

Eta
Hodnoty proměnné Y jsou rozděleny do r skupin podle hodnot proměnné X.


Míra pro dvě kvantitativní proměnné

Pearsonův korelační koeficient (lineární korelace)
Pearson's r (correaltion coefficient)

, tj.
, kde a