K čemu slouží z-test a jak ho provést v Excelu

V tomto článku jsem vám ukázal rozhodovací strom, pomocí kterého vyberete vhodný test pro ověření vaší hypotézy. V případě jednovýběrového z-testu uvažujeme, že máme jeden statistický soubor dat a chceme ověřit hypotézu o jeho střední hodnotě. Předpokládáme, že data pocházejí z normální rozdělení a navíc známe jejich rozptyl. Pokud rozptyl neznáme (a musíme ho odhadovat), využijeme t-test. Protože z-test je jedním z nejjednodušších statistických testů, vysvětlíme si na něm detailně, jak se statistické testování provádí, jaké má testování výstupy a jak je interpretujeme. Snažil jsem se sepsat vysvětlení co možná nejjednodušší, znalejší čtenáři jistě prominou určitá zjednodušení, kterých jsem se v textu dopustil.

Uvažujme následující příklad: Máme zařízení, které vyrábí součástku určité délky a víme, jaká je chybovost tohoto zařízení. Chybovost je nezávislá na délce součástky a odchylky od nastavené délky mají normální rozdělení. Nařízení bylo nastaveno pracovníkem a my chceme ověřit, že tento pracovník nastavil správnou délku součástky. Změříme tedy několik součástek a na základě měření rozhodneme o správnosti nastavení zařízení. Abychom mohli příklad provést na konkrétních číslech, uvažujme, že požadovaná délka je 190 mm a směrodatná odchylka délky součástek je 0,9 mm.

Při testování nejprve musíme formulovat hypotézu, která odpovídá tomu, co potřebujeme ověřit. Formulujeme vždy tzv. nulovou a alternativní hypotézu. V našem případě je máme hypotézy:

  • Nulová hypotéza: Střední hodnota statistického souboru je 190 mm.
  • Alternativní hypotéza: Střední hodnota statistického souboru není 190 mm

Je zřejmé, že jedna z těchto hypotéz musí platit. Testování hypotézy vždy provádíme na určité hladině významnosti. Než si tento pojem vysvětlíme, uvědomme si, že v závěru našeho testu můžeme udělat dvě chybná rozhodnutí:

  • Zamítneme nulovou hypotézu, i když platí. V našem případě bychom prohlásili, že pracovník nastavil zařízení špatně, i když ve skutečnosti bylo nastavené dobře. Tuto chybu nazýváme chyba 1. druhu.
  • Nezamítneme nulovou hypotézu, i když neplatí. V našem případě bychom prohlásili, že pracovník nenastavil zařízení chybně, i když nastavení ve skutečnosti chybné bylo. Takovou chybu nazýváme chyba 2. druhu.

Pravděpodobnost chyby prvního druhu si zvolíme sami a právě velikost této pravděpodobnosti nazýváme hladina významnosti. Standardně se hladina významnosti volí jako 5 % nebo 1 %. Platí, že čím nižší hladinu významnosti zvolíme, s tím větší pravděpodobností se vyslovíme pro nezamítnutí nulové hypotézy.

Každý test má svoji testovou statistiku, většinou známe její rozdělení. Na základě rozdělení a námi zvolené hladině významnosti určíme, které hodnoty statistiky znamenají nezamítnutí testové hypotézy a které již vedou k její zamítnutí. U každé statistiky víme, jakých hodnot může nabývat. Rozdělme si tyto hodnoty na dvě části: obor přijetí a kritický obor. Platí, že tyto části se nijak nepřekrývají a pokrývají veškeré hodnoty, kterých může statistika nabýt.

V případě z-testu má statistika normované normální rozdělení. Hodnota veličiny normovaného normálního rozdělení může být libovolné reálné číslo, proto na obor hodnot a kritický obor rozdělujeme celou množinu reálných čísel.

Vysvětleme si, jak se tyto hodnoty určí, na příkladu hladiny významnosti 5 %. Protože známe rozdělení statistiky, můžeme určit, jakou hodnotu bude mít tato statistika s pravděpodobností 95 %, jestliže naše nulová hypotéza platí. “Odsekněme” tedy zbývající hodnoty, které celkově nastanou s pravděpodobností 5 %. Protože normální rozdělení je symetrické, odsekáváme stejný rozsah hodnot z obou stran. Obě krajní hodnoty jsou si v absolutní hodnotě rovny. Jedna z nich je kladná a druhá záporná.

Na obrázcích níže vidíte, jak se mění rozsah oboru přijetí a kritického oboru v závislosti na hladině významnosti.

Nyní už zbývá vypočítat skutečnou hodnotu této statistiky a poté rozhodnout o zamítnutí či nezamítnutí nulové hypotézy.

Z-test v Excelu

Vraťme se k zadání našeho příkladu. Uvažujme, že máme k dispozici 20 měření a testování budeme provádět na hladině významnosti \alpha = 5 %. Soubor s daty a výsledky testu naleznete zde: z-test-příklad

Formulace hypotéz

Nejprve formulujeme hypotézy, které chceme testovat

  • Nulová hypotéza (H_0): Střední hodnota délky součástek je 190 mm.
  • Alternativní hypotéza (H_A): Střední hodnota délky součástek není 190 mm.

Statistika testu

Statistika testu je vzorec, který se dá snadno najít v literatuře nebo na internetu. Pro z-test má následující tvar:

Z = \frac{\bar{x} - \mu_0}{\sigma} \sqrt{n} \, ,

kde \bar{x} je průměr našeho výběru, \mu_0 je testovaná střední hodnota (v našem případě 190),  \sigma je směrodatná odchylka základního souboru (v našem případě 0,9) a n je počet pozorování (v našem případě 20).

 

Na obrázku níže vidíte data, která jsme naměřili. Modrou čarou se znázorněná teoretická střední hodnota a zelenou skutečně zjištěný průměr. Je zřejmé, že výběrový průměr se bude od teoretického vždy lišit. Je totiž zjištěný na základě náhodného výběru ze základního souboru. Smysl testování hypotézy je v rozhodnutí, zda je rozdíl dostatečně malý, aby mohl být způsoben náhodou, nebo jestli je už příliš vzdálen od naší teoretické hodnoty a tím pádem musí být naše nulová hypotéza o střední hodnotě základního souboru mylná. Platí, že pokud se zjištěný průměr bude nacházet mezi oběma červenými čarami, uvažujeme, že může být způsoben náhodou. Naopak průměr pod dolní nebo nad horní čarou už je považován za příliš velký na to, aby šlo jen o náhodnou odchylku. Samozřejmě platí, že se pohybujeme na hladině významnosti 5 % (a  pro 1 % by byl červený pruh širší, pro 10 % naopak užší.

z-test-pohled-na-data-alpha-0.05

Už tento obrázek naznačuje výsledek našeho testu, ale nepředbíhejme.

 Určení kritického oboru

Statistika Z  má normované normální rozdělení. Kritické hodnoty nemůžeme zjistit z hodnot distribuční funkce, ale potřebujeme inverzní funkci k distribuční funkci, která se označuje jako kvantilová funkce. Proč? Vysvětleme si to pomocí obrázku níže. Na ni máme distribuční funkci normovaného normálního rozdělení. Distribuční funkce nám pro nějakou hodnotu x říká, s jakou pravděpodobností bude náhodně vybraná hodnota menší než toto x. Např. víme, že pro číslo 0 je hodnota distribuční funkce 0,5. Máme tedy padesátiprocentní pravděpodobnost, že náhodně vybrané číslo bude záporné. Pomocí doplňku k jedničce bychom snadno zjistili, že je stejně tak pravděpodobnost 0,5, že náhodně vybrané číslo bude kladné.

My však potřebujeme opačnou informaci. Potřebujeme vědět, které číslo x_1 je hraniční a náhodně vybraná hodnota bude menší než toto x_1 s pravděpodobností 0,025 (případně pro jaké x_2 platí, že náhodně zvolená hodnota bude větší než toto x_2). My tedy pro nějaké číslo z osy x nezjišťujeme hodnotu funkce na ose y, ale naopak pro nějakou hodnotu funkce y hledáme x k ní příslušné.

z-test-krit-val-alpha-0.05

Inverzní funkce právě toto “obrácené čtení” umožňuje. Proto tedy tuto funkci využijeme. Pro dolní hranici kritického oboru zadáme do buňky v Excelu vzorec

=NORM.INV(0,05/2;0;1)

a pro horní hranici

=NORM.INV(1-0,05/2;0;1)

Normované normální rozdělení je symetrické kolem nuly, proto se hodnoty v absolutní hodnotě rovnají.

Kritický obor zapsaný intervalem

Matematicky bychom kritický obor zapsali intervalem

W = ( - \infty; u_{0.025} \rangle \cup \left(u_{0.975}; \infty \right)  =  \left( - \infty; -1,960 \right) \cup \left(1,960; \infty \right) \, ,

kde funkce u_p je kvantilová funkce normovaného normálního rozdělení.

Výpočet statistiky v Excelu

Ukažme si nyní, jak provést výpočet v Excelu. Na ukázkovém listu máme data v buňkách A1 až A20. Do buňky D2 si umístíme počet pozorování. Můžeme tam přímo zadat hodnotu 20, případně použít funkci POČET. Průměr pozorování zjistíme vzorcem

=PRŮMĚR(A1:A20)

a uložíme ho v buňce D3. Směrodatnou odchylku zapíšeme do D4, teoretickou střední hodnotu do D5 a hladinu významnosti do D6. Hranice kritického oboru, které jsme si určili výše, uložíme do D8 a D9.

Nyní můžeme určit hodnotu statistiky pomocí vzorce:

=(PRŮMĚR(A1:A20)-D5)/D4*ODMOCNINA(D2)

Protože ještě budeme zadávat vzorec pro p-hodnotu, uložte hodnotu statistiky do buňky D10.

z-test data a výsledky

Hodnota statistiky Z = -1,2125. Tato hodnota je mimo kritický obor, proto nulovou hypotézu nezamítáme.

Určení p-hodnoty

V současné době se při testování hypotéz často využívá p-hodnota. p-hodnota je mezní hladina významnosti, pro kterou ještě nulovou hypotézu nezamítáme. Jinak řečeno, platí, že pokud je p-hodnota větší nebo rovna než hladina významnosti, nulovou hypotézu nezamítáme.

Podívejme-se na následující obrázek. Na něm vidíme p-hodnotu jako modrou šrafovanou plochu, což je plocha od hodnoty statistiky směrem vlevo. V případě našeho oboustranného testu musíme uvažovat i stejně velkou plochu napravo.

z-test-pvalue-alpha-0.05

p-hodnotu určíme pomocí distribuční funkce normálního rozdělení. Hodnotu statistiky máme v buňce D10. Pro hodnoty distribuční funkce v Excelu použijeme funkci NORM.DIST, přičemž jako čtvrtý parametr zadáváme hodnotu PRAVDA. Pokud bychom zadali hodnota NEPRAVDA, získáme hodnotu funkce hustoty. Hodnotu distribuční funkce potřebujeme pro hodnotu statistiky. Protože uvažujeme i stejně velkou plochu v pravé části, násobíme výsledek funkce dvěma:

=NORM.DIST(D10;0;1;PRAVDA)*2

Použití funkce Z.TEST

Microsoft Excel obsahuje funkci Z.TEST pro provedení z-testu, která vrací p-hodnotu testované hypotézy. Bohužel je standardně tato funkce napsána pro provedení jednostranného testu pro nulovou hypotézu, že střední hodnota souboru větší než zadaná střední hodnota. Pro náš případ tedy musíme vzorec trochu upravit.

Proveďme následující úvahu.

  • Pokud je průměr náhodného výběru větší než teoretická střední hodnota, vrací nám funkce Z.TEST p-hodnotu menší než 0,5. Takovou p-hodnotu můžeme použít. Protože však provádíme oboustranný test, pro náš výsledek násobíme ještě tuto hodnotu dvěma.
  • Pokud je průměr náhodného výběr menší než teoretická střední hodnota, vrací nám funkce Z.TEST p-hodnotu větší než 0,5. V takovém případě odečteme tuto p-hodnotu od jedničky a výsledek násobíme dvěma.

Pro výpočet můžeme použít funkci MIN, která nám vrátí menší hodnotu z obou variant. Výsledek násobíme dvěma. Výsledný vzorec vypadá takto:

=2*MIN(Z.TEST(A1:A20;D5;D4);1-Z.TEST(A1:A20;D5;D4))

Pro snazší pochopení se podívejte na obrázky níže. Na prvním jsou zeleně a modře obě varianty výsledků získaných z funkce Z.TEST. Z nich vybíráme tu menší, tj. modrou plochu. To provádí funkce MIN. Modrou plochu pak násobíme dvěma a získáme výslednou p-hodnotu.

Trackbacks and Pingbacks

[…] Pro někoho mohou být matoucí pojmy chyba 1. druhu a chyba 2. druhu. Protože tyto pojmy mohou být pro někoho obtížně pochopitelné nebo matoucí, ukážeme si nyní podrobně, jak tyto chyby mohou vzniknout a jak se projevují. Obě chyby si ukážeme na příkladu z-testu. […]

Like

[…] Minule jsme se zabývali provedením z-testu v Excelu. Provedli jsme takzvaný oboustranný test. U oboustranného testu byla alternativní hypotéza zadaná nerovností, tj. alternativní hypotéza tvrdila, že střední hodnota náhodného výběru je odlišná od teoretické (testované) střední hodnoty. V našem konkrétním případě jsme testovali, zda se střední hodnota délky součástky rovná či nerovná 190 mm. […]

Like

Leave a Reply

Name and email address are required. Your email address will not be published.

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

You may use these HTML tags and attributes:

<a href="" title="" rel=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <pre> <q cite=""> <s> <strike> <strong> 

%d bloggers like this: