Dvouvýběrové testy na střední hodnotu a párový t-test

Zatím jsme se zabývali jednovýběrovými testy. V těchto testech jsme porovnávali jeden statistický soubor s jednou konkrétní hodnotou. Často se ale porovnává několik statistických souborů vůči sobě. To znamená, že například u dvou souborů zjišťujeme, jestli některý z nich nemá větší střední hodnotu nebo rozptyl než ten druhý. Pro takový typ úloh budeme používat testy, které jsou navržené na práci s více soubory.

Začneme s dvouvýběrovými testy, tj. testy, které porovnávají právě dva soubory. Na porovnání dvou souborů s normálním rozdělením máme k dispozici hned tři testy: párový t-test, Welschův t-test a Studentův t-test. Nyní uvedu tři jednoduché otázky, pomocí kterých dokážeme vybrat správný test:

  • Jsou pozorování spárovaná, tj. dokážu jednomu konkrétnímu pozorování z prvního souboru přiřadit právě jedno konkrétní pozorování z druhého souboru? Pokud ano, volím párový t-test. Ten si popíšeme v tomto článku. Pokud ne, pokračuji dále.
  • Mají oba soubory shodný rozptyl? Pokud ano, použiji Studentův t-test.
  • Máme-li v souborech nespárovaná pozorování a mají-li oba soubory různý rozptyl, volím Welschův t-test.

Levostranný párový t-test

Uveďme si nyní typické zadání párového testu: Máme data o průměrném počtu vyrobených výrobků 20 pracovníky za jednu směnu. Vedení společnosti následně provedlo změnu výrobních procesů a pro stejných 20 pracovníků provedlo nová měření. Ověřte na hladině významnosti \alpha = 5 %, že došlo ke zvýšení průměrné produkce pracovníků.

Klíčové v zadání je, že jsme provedli 2 sady měření pro 20 stejných pracovníků. Můžeme tedy vždy spárovat dvě měření jednoho konkrétního pracovníka. Z toho důvodu můžeme zvolit párový t-test. Pokud bychom měli měření od různých pracovníků nebo pokud by měření byla anonymní, museli bychom zvolit jeden ze zbývajících dvou testů.

Označme si soubory jako X_1X_2 a jejich střední hodnoty jako \mu_{X_1}\mu_{X_2}. Nyní můžeme formulovat nulovou a alternativní hypotézu:

  • H_0: \mu_{X_1} = \mu_{X_2} \, . (Střední hodnota obou souborů je stejná.)
  • H_1: \mu_{X_1} < \mu_{X_2} \, . (Střední hodnota prvního souboru je nižší.)

Alternativní hypotézu volíme takto, protože máme dle zadání prokázat zvýšení průměrné produkce pracovníka (a předpokládáme, že snížení produktivity je nepravděpodobné). Provedeme tedy levostranný test.

Uvažujme nyní náhodnou veličinu Z, kterou si definujeme jako rozdíl náhodných veličin X_1X_2, tj. Z = X_1 - X_2. Pro každou dvojici pozorování můžeme určit z_i , které je dáno jako rozdíl pozorování, tj.

z_i = x_{1,i} - x_{2,i} \, .

Mají-li oba soubory stejnou střední hodnotu, pak by měla mít náhodná veličina Z nulovou střední hodnotu, tj. \mu_Z = 0 | H_0. Jestliže má druhý soubor větší střední hodnotu, pak má i veličina Z ostře zápornou střední hodnotu, tj. \mu_Z < 0 | H_1. Náš případ dvouvýběrového testu tedy můžeme jednoduše převést na jednovýběrový t-test provedený nad veličinou Z.

Definujme si průměr pozorování veličiny Z jako \bar{z} a výběrovou směrodatnou odchylku jako  s_{Z}. Nyní můžeme definovat statistiku testu T jako

T = \frac{\bar{z}}{s_{Z}} \sqrt{n}

a tato veličina má n - 1 stupňů volnosti. Analogicky určíme i kritický obor pro statistiku:

W = ( - \infty,  t_{\alpha} (n - 1) \rangle \, ,

kde t_{\alpha} (n - 1) je kvantil Studentova rozdělení s (n - 1) stupni volnosti.

Párový t-test můžeme v Excelu provést několika způsoby:

  • použitím doplňku Analýza dat,
  • použitím funkce T.TEST (nebo TTEST),
  • použitím funkcí pro kvantilovou a distribuční funkci Studentova rozdělení.

Soubor s ukázkovými daty i všemi výpočty si můžete stáhnout zde.

Výpočet s využitím doplňku Analýza dat

Tento doplněk jsme již používali ke generování náhodných souborů dat. Spustíte ho kliknutím na tlačítko Analýza dat na panelu Data. Pokud tam tlačítko nevidíte, musíte si doplněk nainstalovat. Po kliknutí na tlačítko se vám zobrazí seznam analytických nástrojů. Vyberte možnost Dvouvýběrový párový t-test na střední hodnotu. Analýza dat zvládá oboustranný i jednostranný párový t-test.

parovy t-test analyza dat 1

V dialogovém okně označíme oblast se dvěma soubory, a to včetně záhlaví. Pak ale nesmíme zapomenout zaškrtnout pole Popisky, čímž dáváme Excelu najevo, že v prvním řádku najde názvy datových souborů. Dále vyplníme výstupní oblast, pole Hypotetický rozdíl středních hodnot můžeme nechat prázdné.

parovy t-test analyza dat 2

Níže vidíme výsledky. Excel určil statistiku T = -2{,}4038 a p-hodnotu jako 0{,}0133. Na hodnotu na třetím řádku si ale musíme dát pozor. Obsahuje hranici kritické hodnoty, ta je ale vždy kladná. Protože my provádíme levostranný test, bude se kritický obor nacházet nalevo od nuly. K hodnotě stačí dopsat minus, protože hustota Studentova rozdělení je sudá funkce. Kritický obor vyjádřený intervalem je tedy:

W = ( - \infty,  - 1{,}7291 \rangle \,  .

parovy t-test analyza dat 3

Doplňku Analýza dat jsme nespecifikovali alternativní hypotézu. Excel u jednostranného testu vždy vrací p-hodnotu, která je menší než 0{,}5, tj. v našem případě vrací správně hodnotu pro levostranný test. Pokud by však průměr dat druhého souboru byl menší než průměr dat prvního, byla by statistika kladná a v tom případě by p-hodnota odpovídající této hodnotě musela být větší než 0{,}5. V takovém případě by bylo třeba správnou p-hodnotu dopočítat.

Využití funkce T.TEST (TTEST)

Excel obsahuje funkci T.TEST (v případě verze 2007 a starších funkci TTEST), která je další rychlou cestou k provedení párového t-testu. Její nevýhodou je, že vrací pouze p-hodnotu, nikoli však hodnotu statistiky a kritický obor.

V novějších verzích Excelu zadáme vzorec:

=T.TEST(A2:A21;B2:B21;1;1)

První dva parametry jsou odkazy na datové soubory, tentokrát již bez záhlaví. Třetí parametr zadáváme 1, protože požadujeme jednostranný test, pro oboustranný test bychom zvolili 2. Třetím parametrem volíme typ testu. Typy testů jsou specifikované na začátku článku. Pro párový test volíme 1, pro nepárový test se shodnými rozptyly 2 a pro nepárový test s různými rozptyly 3.

Tato funkce funguje podobně jako Analýza dat, tj. nezadáváme mu typ jednostranného testu a funkce vybírá tu variantu, pro kterou je p-hodnota menší než 0{,}5. Chceme-li si pojistit, že výsledek bude vždy správný, můžeme provést následující úpravu:

=KDYŽ(F12<0;T.TEST(A2:A21;B2:B21;1;1);1-T.TEST(A2:A21;B2:B21;1;1))

Pokud by tedy hodnota statistiky byla kladná, použije se jednotkový doplněk k výsledku funkce T.TEST, což je správný výsledek.

Ve starších verzích Excelu použijeme funkce TTEST, parametry volíme stejné jako u novější varianty funkce:

=TTEST(A2:A21;B2:B21;1;1)

Opět můžeme provést úpravu zaručující správný výsledek i při kladné hodnotě statistiky:

=KDYŽ(G12<0;TTEST(A2:A21;B2:B21;1;1);1-TTEST(A2:A21;B2:B21;1;1))

Manuální výpočet

Poslední variantou je manuální výpočet. Nejprve vytvoříme sloupec s rozdíly hodnot, tj. sloupec s pozorovanými hodnotami veličiny Z. Dále dopočítáme průměrný rozdíl, směrodatnou odchylku, hodnoty statistiky a určíme počet dat.

parovy t-test data a vysledky

Výpočet v MS Excel 2010 a novějším

Hranice kritického oboru určíme pomocí funkce kvantilové funkce Studentova rozdělení T.INV. Protože kritický obor určujeme zleva, zadáváme rovnou kvantil a počet stupňů volnosti:

=T.INV(F7;F2-1)

p-hodnotu testu určíme pomocí funkce distribuční funkce Studentova rozdělení T.DIST, které jako parametry zadáme hodnotu statistiky, počet stupňů volnosti a parametr PRAVDA, který říká, že chceme hodnotu distribuční funkce a nikoli funkce hustoty.

=T.DIST(F12;F2-1;PRAVDA)

V literatuře se uvádí, že pro větší objemy dat (zpravidla n \geq 30) je možné nahradit Studentovo rozdělení normálním rozdělení. Není však chybou, pokud i pro vyšší objemy dat použijeme Studentovo rozdělení.

Výpočet ve starších verzích Excelu

Ve starších verzích Excelu je manuální výpočet komplikovanější. Starší verze má funkci TINV, která nepracuje se standardním Studentovým rozdělením, ale s tzv. oboustranným Studentovým rozdělením. Toto rozdělení má má nenulovou hustotu pouze pro x > 0, přičemž hodnota hustoty je dvojnásobná oproti standardní hustotě. (Tím je splněna podmínka, že plocha pod hustotou má obsah 1.) Při určování hranice kritického oboru u oboustranného testu pak zadáváme přímo hladinu významnosti, u jednostranného testu ale musíme hodnotu hladiny významnosti násobit dvěma. Dále musíme doplnit znaménko minus, protože funkce TINV vrací vždy kladná čísla.

=-TINV(2*F7;F2-1)

Při určování p-hodnoty použijeme funkci TDIST. Tato funkce má důležitý třetí parametr, kterým určujeme, zda je použita distribuční funkce pro standardní nebo jednostranné Studentovo rozdělení. V případě jednostranného testu zadáváme 1. Komplikace je v tom, že funkce TDIST umí pracovat jen s kladnými čísly. To můžeme opět vyřešit pomocí funkce KDYŽ:

=KDYŽ(G12<0;TDIST(-G12;F2-1;1);1-TDIST(G12;F2-1;1))

Pravostranný párový t-test

Nyní si na novém datovém souboru stručně popíšeme postup pro pravostranný párový t-test. Opět se budeme pohybovat na hladině významnosti \alpha = 5 %.

Hypotézy pravostranného testu jsou:

  • H_0: \mu_{X_1} = \mu_{X_2} \, ,
  • H_1: \mu_{X_1} > \mu_{X_2} \, .

Statistika testu zůstává samozřejmě stejná, kritický obor vyjádřený intervalem pak je:

W = \langle t_{1 - \alpha} (n - 1) , \infty )  \, .

Výpočet s využitím doplňku Analýza dat

Výpočet pomocí Analýzy dat provádíme stejně jako v předchozím případě. Na obrázku níže vidíme výsledek. Hodnota statistiky testu je T = -1{,}9739. V případě pravostranného testu je kritický obor skutečně napravo od nuly a přesný zápis kritického oboru intervalem by byl

W = \langle 1{,}7291 , \infty )  \, .

parovy pravostranny t-test analyza dat

V našem případě je však špatně zobrazená p-hodnota. Protože statistika pravostranného testu je záporná, p-hodnota musí být větší než 0{,}5. Analýza dat nám zobrazuje p-hodnotu 0{,}0316, to by však byla p-hodnota pro případ levostranného testu. P-hodnota pravostranného testu je 1 - 0{,}0316= 0{,}9684.

Využití funkce T.TEST (TTEST)

Podobná záludnost jako výše nás čeká i u funkcí T.TEST a TTEST. Výše už jsme si popsali úpravu, která nám zajistí, že p-hodnota testu bude vždy správná. V případě pravostranného testu stačí malá úprava: změna znaménka nerovnosti u podmínky.

=KDYŽ(F12>0;T.TEST(A2:A21;B2:B21;1;1);1-T.TEST(A2:A21;B2:B21;1;1))

To samé platí pro funkci TTEST.

=KDYŽ(G12>0; TTEST(A2:A21;B2:B21;1;1);1- TTEST(A2:A21;B2:B21;1;1))

Manuální výpočet

Paradoxně jednoduše nyní může vypadat manuální výpočet v novějších verzích Excelu. Hranici kritického oboru určíme opět pomocí funkce T.INV, nyní však “odsekáváme” rozdělení statistiky zprava, protože jako kvantil zadáváme 1 - \alpha:

=T.INV(1-F7;F2-1)

Pro určení p-hodnoty můžeme použít funkci T.DIST.RT, což je pravostranná distribuční funkce Studentova rozdělení:

=T.DIST.RT(F12;F2-1)

Použijeme-li nám již známou funkci T.INV, musíme samozřejmě provést odečtení hodnoty od jedničky, abychom získali p-hodnotu:

=1-T.DIST(F12;F2-1;PRAVDA)

Ve starších verzích Excelu opět použijeme funkci TINV. Odebereme ale znaménko minus, protože hranice kritického oboru je nyní kladné číslo:

=TINV(2*F7;F2-1)

Pro správné určení p-hodnoty testu opět použijeme funkci KDYŽ, oproti levostrannému testu měníme znaménko nerovnosti v podmínce:

=KDYŽ(H12>0;TDIST(H12;F2-1;1);1-TDIST(-H12;F2-1;1))

parovy pravostranny t-test data a vysledky

Oboustranný párový t-test

Zbývá nám poslední varianta testu a tím je oboustranný párový t-test. V případě oboustranného testu řešíme pouze to, jestli se střední hodnoty liší nebo ne. Nerozhodujeme, který ze souborů má menší a který větší střední hodnotu. Vygenerujeme si nový datový soubor, test si ukážeme na \alpha = 5 %.

Hypotézy oboustranného testu jsou:

  • H_0: \mu_{X_1} = \mu_{X_2} \, ,
  • H_1: \mu_{X_1} \neq \mu_{X_2} \, .

Statistika testu zůstává stále stejná, kritický obor vyjádřený intervalem je:

W = ( - \infty, t_{\frac{\alpha}{2}} (n - 1) \rangle \cup \langle t_{1 - \frac{\alpha}{2}} (n - 1) , \infty )  \, .

Výpočet s využitím doplňku Analýza dat

Výpočet pomocí Analýzy dat se spouští stejně jako v předchozích případech. Ve výsledcích nás stále zajímá hodnota statistiky, která je nyní T = -2{,}3527. Dále se podíváme na poslední dva řádky, kde vidíme p-hodnotu testu a hranici kritického oboru. Studentovo rozdělení je symetrické a tak víme, že kritický obor je

W = ( - \infty, -2{,}0930 \rangle \cup \langle 2{,}0930, \infty )  \, .

Na základě p-hodnoty i na základě faktu, že hodnota statistiky se nachází v kritickém oboru, zamítáme nulovou hypotézu.

parovy oboustranny t-test analyza dat

Využití funkce T.TEST (TTEST)

Použití funkce T.TEST je v tomto případě jednoduché. Jako třetí parametr zadáváme číslo 2, které značí oboustranný test. V tomto případě není výpočet komplikovaný 2 variantami testu jako u jednostranných testů a výsledek je vždy správný.

=T.TEST(A2:A21;B2:B21;2;1)

U starší funkce TTEST platí to samé, tj. jako třetí parametr zadáváme dvojku.

=TTEST(A2:A21;B2:B21;2;1)

Manuální výpočet

Poslední možností je manuální výpočet. Pro určení hranic kritického oboru v novějších verzích Excelu použijeme opět funkce T.INV. Dolní hranici kritického oboru určíme vzorcem

=T.INV(F7/2;F2-1)

a horní hranici

=T.INV(1-F7/2;F2-1)

Všimněte si, že použití této funkce je velmi přímočaré, protože použité kvantily odpovídají těm z vzorce pro kritický obor.

P-hodnotu nejsnadněji určíme pomocí funkce T.DIST.2T, což je distribuční funkce oboustranného Studentova rozdělení. Pouze si musíme uvědomit, že tato funkce je vhodná pouze pro oboustranné testy. Funkce zadáme hodnotu statistiky (obecně v absolutní hodnotě, protože funkce pracuje jen s kladnými čísly) a získáme p-hodnotu.

=T.DIST.2T(ABS(F13);F2-1)

Pokud bychom chtěli použít klasickou distribuční funkci Studentova rozdělení, pak musíme použít následující vzorec:

=2*MIN(T.DIST(F13;F2-1;PRAVDA);1-T.DIST(F13;F2-1;PRAVDA))

Máme-li starší verzi Excelu, použijeme pro určení kritického oboru funkci TINV. Protože tato funkce pracuje s oboustranným rozdělením, zadáváme jako kvantily přímo hladinu významnosti. K dolní hranici si sami musíme doplnit znaménko minus, tj:

=-TINV(F7;F2-1)

Horní hranice je pak stejný vzorec, pouze bez znaménka minus:

=TINV(F7;F2-1)

Zbývá nám určit p-hodnotu. K tomu použijeme funkci TDIST, kde jako poslední parametr zadáváme 2. Tato funkce se pak chová stejně jako T.DIST.2T, tím pádem její výsledek už nijak neupravujeme a rovnou získáváme p-hodnotu testu.

=TDIST(ABS(H13);F2-1;2)

parovy oboustranny t-test data a vysledky

Trackbacks and Pingbacks

Dvouvýběrový t-test | Jiří PešíkApril 28, 2018 at 5:50 pm

[…] minulém článku jsme otevřeli problematiku dvouvýběrových testů, tj. testů, které mezi sebou porovnávají […]

Like

Leave a Reply

Name and email address are required. Your email address will not be published.

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s

You may use these HTML tags and attributes:

<a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <pre> <q cite=""> <s> <strike> <strong> 

%d bloggers like this: