Posts By Jiří Pešík

The Beginning of Spring on Chlum Mountain

We had very sunny (but a little cold) weather last weekend. Here you can see some photos from Chlum Mountain (651 meters) that I took. Maybe you will like it.

Here you can see Manětín Brook. You can also check my photos from The Valley of the Manětín Brook from last year.

DSC04308

This used to be a nice log cabin. Unfortunately, it has been damaged. I do not know when or by whom.

DSC04313

DSC04318

Proč se ti nejhorší dostávají nahoru

Pokud bychom měli z tohoto desetiletí vybrat data, která se zapíší do učebnic historie, jedním z nich by nepochybně byl 8. listopad 2016. Ten den byl celý svět v šoku z výsledků prezidentských voleb v USA, ve kterých, oproti očekávání většiny lidí, zvítězil Donald Trump. Komentátoři a nejrůznější analytici začali pátrat po těch, co za to můžou. Mediální mainstream si pak bryskně adaptoval vysvětlení, že za zvolení Trumpa můžou chudí, nevzdělaní a frustrovaní lidé z převážně venkovských oblastí. Tento teorém se již “osvědčil” jako vysvětlení výsledku referenda o Brexitu z června toho samého roku. Ani ne o měsíc později městští liberálové s vypětím všech sil těsně přehlasovali nevzdělané rakouské důchodce a dosadili do prezidentského úřadu Alexandera Van der Bellena namísto Norberta Hofera. Obdobné “analýzy” pak byly předkládány i při parlamentních volbách v Nizozemí a v Německu či prezidentských volbách ve Francii. Naposledy jsme měli možnost sledovat obdobné rozbory v přímém přenosu při prezidentských volbách v České republice.

Nejde samozřejmě o to, že by vysvětlení tohoto typu byla fakticky nesprávná. Mezi jednotlivými socioekonomickými či demografickými skupinami existují statisticky významné rozdíly v jejich volbě.1 Problémem těchto analýz je jejich neúplnost a neschopnost (či neochota) ponořit se do problému hlouběji a dopracovat se tak k hypotéze, že namísto systematického selhávání určitých omezených skupin voličů dochází k selhávání demokratického systému jako celku. Dávají naději, že je možné tyto skupiny nějakým způsobem řádně “dovzdělat” nebo “napravit”, aby hlasovaly správně. Tato naděje je jednak marná a navíc i v případě nějakého zázračného úspěchu není zdaleka jisté, že by politici zvolení těmito převychovanými voliči dosahovali vyšších morálních kvalit nebo dokonce že by se jejich zvolením zvýšila kvalita života většiny společnosti.

Hypotézu systematického selhávání demokratického mechanismu bychom měli připustit k analýze už jen na základě několika protipříkladů z komunální politiky. Nebyli to nevzdělaní vesničtí důchodci, kteří zvolili Pavla Béma či Adrianu Krnáčovou pražskými primátory. Nebyli to chudí sedláci, kteří zvolili vedení Plzně, které stálo za předraženým Novým divadlem, depem pro dopravní podnik a dalšími problematickými projekty.

F. A. Hayek, ve své nejznámější knize Cesta do otroctví v kapitole Proč se ti nejhorší dostávají nahoru, hledá fundamentální příčiny tohoto jevu.

… čím jsou jednotliví lidé vzdělanější a inteligentnější, tím více se jejich názory a záliby liší, a tím hůře se dokážou shodnout na jedné konkrétní stupnici hodnoty. Následkem toho, chceme-li dosáhnout vyššího stupně uniformity a podobnosti postojů, musíme sestoupit do sféry nižších mravních a intelektuálních měřítek, kde převažují primitivní a “obyčejné” pudy a záliby. To neznamená, že většina lidí má nízká morální měřítka; chce se tím říci pouze to, že největší skupina lidí vyznávajících velmi podobné hodnoty obsahuje lidi s nízkými měřítky. […] Je-li zapotřebí početná skupina, dost silná, aby dokázala ostatním vnutit své názory a životní hodnoty, nebudou to nikdy lidé s vysoce různorodými a rozvinutými zálibami – ale spíše ti, kteří tvoří “masy” v pejorativním slova smyslu, ti nejméně originální a nezávislí, kteří vahou svého množství dokážou prosadit konkrétní ideály.2

Samozřejmě důsledky vlády vygenerované touto “masou”, jí vnucované hodnoty a metody tohoto vnucování jsou proměnnou, která se mění v místě i čase. Dnešní evropská civilizace je poučená krutostí světových válek i řady komunistických i nacionalistických diktatur. To ale nic nemění na faktu, že taková tendence ve společnosti stále existuje.

Hayek jde ve svých úvahách dále a překládá další, ještě zásadnější argument.

K lidské povaze zřejmě neodmyslitelně patří, že se lidé dokážou shodnout spíše na negativním programu – na nenávisti k nepříteli, závisti vůči těm, kdo jsou na tom lépe než oni – než na jakémkoli pozitivním úkolu. Kontrast mezi “my” a “oni”, společný boj proti těm, kdo se nacházejí vně skupiny, se zdá být základní složkou každého vyznání, které pevně spojuje skupinu lidí ke společnému jednání. Využívají ho proto vždycky ti, kterým jde nejen o podporu určité politiky, ale o bezvýhradnou loajalitu početných mas. Z jejich hlediska je totiž tento postoj nesmírně výhodný v tom, že jim dává větší svobodu jednání než jakýkoli pozitivní program.3

Polovina voličů Jiřího Drahoše ve skutečnosti nevolila Jiřího Drahoše, ale hlasovala proti Miloši Zemanovi.4 Jiří Drahoš se obratně stylizoval do role antiZemana ve snaze právě tyto voliče přitáhnout. Tuto strategii dělily od úspěchu jen necelé dva procentní body.

Pro další příklady negativní kampaně nemusíme chodit daleko, stačí se podívat na chování politických stran v poslední době. Vrcholní představitelé sociální demokracie označili živnostníky za parazity, protože mají nižší daně (resp. pojisné) ve srovnání se zaměstnanci.5 Jasná snaha o vyvolání závisti či pocitu nespravedlnosti v těch, kteří musejí platit více. Jako by bylo nespravedlivé, že stát bere někomu méně a někomu více a nikoli to, že stát bere všem hodně. Andreji Babišovi se podařilo tuto vzájemnou nevraživost implementovat přímo do konkrétní vládní politiky – zavedení Elektronické evidence tržeb. Ta se stala populární díky silně přestřelenému slibu zvýšení daňových výnosů.6

TOP 09 naopak neustále útočila na Andreje Babiše a ty, kteří mají na současnou podobu evropské integrace odlišný názor, jsou pod vlivem dezinformací generovaných ruskými hackery. SPD vytěžila na maximum obavy voličů z nelegální migrace. A vůči komu všemu hýřila negativními konotacemi KSČM, není v mých silách sledovat.7 Negativní kampaň, zaměřená proti sousedovi nebo proti nějaké skupině obyvatel, prostě funguje.

Podobně jako Hayek smýšlí i další ekonom Rakouské školy Hans-Hermann Hoppe. Ve svém článku Why Bad Men Rule přináší nové argumenty, které stojí na zmínku. Je objektivně platnou skutečností, že demokracie umožňuje volný vstup do politické soutěže prakticky komukoli. Ačkoli je to všeobecně vnímáno jako jedna z jejích větších výhod, Hoppe v tom vidí nebezpečí.

Free entry and competition in the production of goods is good, but free competition in the production of bads is not. Free entry into the business of torturing and killing innocents, or free competition in counterfeiting or swindling, for instance, is not good; it is worse than bad. So what sort of “business” is government? Answer: it is not a customary producer of goods sold to voluntary consumers. […] Since man is as man is, in every society people who covet others’ property exist. Some people are more afflicted by this sentiment than others, but individuals usually learn not to act on such feelings or even feel ashamed for entertaining them. Generally only a few individuals are unable to successfully suppress their desire for others’ property, and they are treated as criminals by their fellow men and repressed by the threat of physical punishment.8

Hoppe coby monarchista upozorňuje na fakt, že zatímco v monarchii může přerozdělovat cizí majetek ve svůj prospěch pouze panovník, demokracie otevírá tuto možnost pro každého. Ač zůstává platná Friedmanova teze o neexistenci oběda zdarma, demokracie může donutit za něčí oběd zaplatit někoho jiného. Umožňuje jedněm legalizovat a realizovat jejich touhy k ovládání života ostatních. V případě úspěchu v demokratických volbách jim dává zdání legitimity jejich činů a morální nadřazenosti jejich názorů. A konečně umožňuje celý systém financovat prostřednictvím daní. A tyto možnosti jsou právě důvodem, proč politické funkce přitahují všemožné kolektivisty, socialisty a jedince, kteří mají na mysli vše možné, jen ne svobodu ostatních.

… subject to mass elections, those members of society with little or no inhibitions against taking another man’s property, that is, habitual a-moralists who are most talented in assembling majorities from a multitude of morally uninhibited and mutually incompatible popular demands (efficient demagogues) will tend to gain entrance in and rise to the top of government. Hence, a bad situation becomes even worse.9

Lidé, kteří si chtějí žít svůj vlastní život, nestarat se o zájmy ostatních a svobodně obchodovat pouze s plody jejich vlastní práce, mají mnohem menší motivaci do politiky (minimálně ve vyšší než komunální úrovni) vstupovat. K tomu totiž politiku vůbec nepotřebují. Jejich jedinou motivací může být to, že jim úroveň zdanění a regulací společnosti připadá až příliš vysoká a chtějí tento negativní trend zvrátit, případně alespoň omezit.

Nečekejme na politiky, kteří budou řídit společnost dle svého nejlepšího svědomí a ve prospěch všech. Nedivme se, že kroky politiků nejsou zdaleka prospěšné pro všechny, že jsou veřejné zakázky předražené a že jejich zákony nás příliš omezují a šikanují. Namísto toho hledejme způsoby, jak omezit možnosti politiků zasahovat do našich životů. Může se sice nakrásně stát, že nějaká regulace bude ve váš prospěch a daňové výnosy půjdou přesně na ty účely, které jsou pro vás užitečné. Tak to může být dnes, ale zítra může nastat opak. A pak už může být pozdě s tím něco dělat.

Dvouvýběrové testy na střední hodnotu a párový t-test

Zatím jsme se zabývali jednovýběrovými testy. V těchto testech jsme porovnávali jeden statistický soubor s jednou konkrétní hodnotou. Často se ale porovnává několik statistických souborů vůči sobě. To znamená, že například u dvou souborů zjišťujeme, jestli některý z nich nemá větší střední hodnotu nebo rozptyl než ten druhý. Pro takový typ úloh budeme používat testy, které jsou navržené na práci s více soubory.

Začneme s dvouvýběrovými testy, tj. testy, které porovnávají právě dva soubory. Na porovnání dvou souborů s normálním rozdělením máme k dispozici hned tři testy: párový t-test, Welschův t-test a Studentův t-test. Nyní uvedu tři jednoduché otázky, pomocí kterých dokážeme vybrat správný test:

  • Jsou pozorování spárovaná, tj. dokážu jednomu konkrétnímu pozorování z prvního souboru přiřadit právě jedno konkrétní pozorování z druhého souboru? Pokud ano, volím párový t-test. Ten si popíšeme v tomto článku. Pokud ne, pokračuji dále.
  • Mají oba soubory shodný rozptyl? Pokud ano, použiji Studentův t-test.
  • Máme-li v souborech nespárovaná pozorování a mají-li oba soubory různý rozptyl, volím Welschův t-test.

Levostranný párový t-test

Uveďme si nyní typické zadání párového testu: Máme data o průměrném počtu vyrobených výrobků 20 pracovníky za jednu směnu. Vedení společnosti následně provedlo změnu výrobních procesů a pro stejných 20 pracovníků provedlo nová měření. Ověřte na hladině významnosti \alpha = 5 %, že došlo ke zvýšení průměrné produkce pracovníků.

Klíčové v zadání je, že jsme provedli 2 sady měření pro 20 stejných pracovníků. Můžeme tedy vždy spárovat dvě měření jednoho konkrétního pracovníka. Z toho důvodu můžeme zvolit párový t-test. Pokud bychom měli měření od různých pracovníků nebo pokud by měření byla anonymní, museli bychom zvolit jeden ze zbývajících dvou testů.

Označme si soubory jako X_1X_2 a jejich střední hodnoty jako \mu_{X_1}\mu_{X_2}. Nyní můžeme formulovat nulovou a alternativní hypotézu:

  • H_0: \mu_{X_1} = \mu_{X_2} \, . (Střední hodnota obou souborů je stejná.)
  • H_1: \mu_{X_1} < \mu_{X_2} \, . (Střední hodnota prvního souboru je nižší.)

Alternativní hypotézu volíme takto, protože máme dle zadání prokázat zvýšení průměrné produkce pracovníka (a předpokládáme, že snížení produktivity je nepravděpodobné). Provedeme tedy levostranný test.

Uvažujme nyní náhodnou veličinu Z, kterou si definujeme jako rozdíl náhodných veličin X_1X_2, tj. Z = X_1 - X_2. Pro každou dvojici pozorování můžeme určit z_i , které je dáno jako rozdíl pozorování, tj.

z_i = x_{1,i} - x_{2,i} \, .

Mají-li oba soubory stejnou střední hodnotu, pak by měla mít náhodná veličina Z nulovou střední hodnotu, tj. \mu_Z = 0 | H_0. Jestliže má druhý soubor větší střední hodnotu, pak má i veličina Z ostře zápornou střední hodnotu, tj. \mu_Z < 0 | H_1. Náš případ dvouvýběrového testu tedy můžeme jednoduše převést na jednovýběrový t-test provedený nad veličinou Z.

Definujme si průměr pozorování veličiny Z jako \bar{z} a výběrovou směrodatnou odchylku jako  s_{Z}. Nyní můžeme definovat statistiku testu T jako

T = \frac{\bar{z}}{s_{Z}} \sqrt{n}

a tato veličina má n - 1 stupňů volnosti. Analogicky určíme i kritický obor pro statistiku:

W = ( - \infty,  t_{\alpha} (n - 1) \rangle \, ,

kde t_{\alpha} (n - 1) je kvantil Studentova rozdělení s (n - 1) stupni volnosti.

Párový t-test můžeme v Excelu provést několika způsoby:

  • použitím doplňku Analýza dat,
  • použitím funkce T.TEST (nebo TTEST),
  • použitím funkcí pro kvantilovou a distribuční funkci Studentova rozdělení.

Soubor s ukázkovými daty i všemi výpočty si můžete stáhnout zde.

Výpočet s využitím doplňku Analýza dat

Tento doplněk jsme již používali ke generování náhodných souborů dat. Spustíte ho kliknutím na tlačítko Analýza dat na panelu Data. Pokud tam tlačítko nevidíte, musíte si doplněk nainstalovat. Po kliknutí na tlačítko se vám zobrazí seznam analytických nástrojů. Vyberte možnost Dvouvýběrový párový t-test na střední hodnotu. Analýza dat zvládá oboustranný i jednostranný párový t-test.

parovy t-test analyza dat 1

V dialogovém okně označíme oblast se dvěma soubory, a to včetně záhlaví. Pak ale nesmíme zapomenout zaškrtnout pole Popisky, čímž dáváme Excelu najevo, že v prvním řádku najde názvy datových souborů. Dále vyplníme výstupní oblast, pole Hypotetický rozdíl středních hodnot můžeme nechat prázdné.

parovy t-test analyza dat 2

Níže vidíme výsledky. Excel určil statistiku T = -2{,}4038 a p-hodnotu jako 0{,}0133. Na hodnotu na třetím řádku si ale musíme dát pozor. Obsahuje hranici kritické hodnoty, ta je ale vždy kladná. Protože my provádíme levostranný test, bude se kritický obor nacházet nalevo od nuly. K hodnotě stačí dopsat minus, protože hustota Studentova rozdělení je sudá funkce. Kritický obor vyjádřený intervalem je tedy:

W = ( - \infty,  - 1{,}7291 \rangle \,  .

parovy t-test analyza dat 3

Doplňku Analýza dat jsme nespecifikovali alternativní hypotézu. Excel u jednostranného testu vždy vrací p-hodnotu, která je menší než 0{,}5, tj. v našem případě vrací správně hodnotu pro levostranný test. Pokud by však průměr dat druhého souboru byl menší než průměr dat prvního, byla by statistika kladná a v tom případě by p-hodnota odpovídající této hodnotě musela být větší než 0{,}5. V takovém případě by bylo třeba správnou p-hodnotu dopočítat.

Využití funkce T.TEST (TTEST)

Excel obsahuje funkci T.TEST (v případě verze 2007 a starších funkci TTEST), která je další rychlou cestou k provedení párového t-testu. Její nevýhodou je, že vrací pouze p-hodnotu, nikoli však hodnotu statistiky a kritický obor.

V novějších verzích Excelu zadáme vzorec:

=T.TEST(A2:A21;B2:B21;1;1)

První dva parametry jsou odkazy na datové soubory, tentokrát již bez záhlaví. Třetí parametr zadáváme 1, protože požadujeme jednostranný test, pro oboustranný test bychom zvolili 2. Třetím parametrem volíme typ testu. Typy testů jsou specifikované na začátku článku. Pro párový test volíme 1, pro nepárový test se shodnými rozptyly 2 a pro nepárový test s různými rozptyly 3.

Tato funkce funguje podobně jako Analýza dat, tj. nezadáváme mu typ jednostranného testu a funkce vybírá tu variantu, pro kterou je p-hodnota menší než 0{,}5. Chceme-li si pojistit, že výsledek bude vždy správný, můžeme provést následující úpravu:

=KDYŽ(F12<0;T.TEST(A2:A21;B2:B21;1;1);1-T.TEST(A2:A21;B2:B21;1;1))

Pokud by tedy hodnota statistiky byla kladná, použije se jednotkový doplněk k výsledku funkce T.TEST, což je správný výsledek.

Ve starších verzích Excelu použijeme funkce TTEST, parametry volíme stejné jako u novější varianty funkce:

=TTEST(A2:A21;B2:B21;1;1)

Opět můžeme provést úpravu zaručující správný výsledek i při kladné hodnotě statistiky:

=KDYŽ(G12<0;TTEST(A2:A21;B2:B21;1;1);1-TTEST(A2:A21;B2:B21;1;1))

Manuální výpočet

Poslední variantou je manuální výpočet. Nejprve vytvoříme sloupec s rozdíly hodnot, tj. sloupec s pozorovanými hodnotami veličiny Z. Dále dopočítáme průměrný rozdíl, směrodatnou odchylku, hodnoty statistiky a určíme počet dat.

parovy t-test data a vysledky

Výpočet v MS Excel 2010 a novějším

Hranice kritického oboru určíme pomocí funkce kvantilové funkce Studentova rozdělení T.INV. Protože kritický obor určujeme zleva, zadáváme rovnou kvantil a počet stupňů volnosti:

=T.INV(F7;F2-1)

p-hodnotu testu určíme pomocí funkce distribuční funkce Studentova rozdělení T.DIST, které jako parametry zadáme hodnotu statistiky, počet stupňů volnosti a parametr PRAVDA, který říká, že chceme hodnotu distribuční funkce a nikoli funkce hustoty.

=T.DIST(F12;F2-1;PRAVDA)

V literatuře se uvádí, že pro větší objemy dat (zpravidla n \geq 30) je možné nahradit Studentovo rozdělení normálním rozdělení. Není však chybou, pokud i pro vyšší objemy dat použijeme Studentovo rozdělení.

Výpočet ve starších verzích Excelu

Ve starších verzích Excelu je manuální výpočet komplikovanější. Starší verze má funkci TINV, která nepracuje se standardním Studentovým rozdělením, ale s tzv. oboustranným Studentovým rozdělením. Toto rozdělení má má nenulovou hustotu pouze pro x > 0, přičemž hodnota hustoty je dvojnásobná oproti standardní hustotě. (Tím je splněna podmínka, že plocha pod hustotou má obsah 1.) Při určování hranice kritického oboru u oboustranného testu pak zadáváme přímo hladinu významnosti, u jednostranného testu ale musíme hodnotu hladiny významnosti násobit dvěma. Dále musíme doplnit znaménko minus, protože funkce TINV vrací vždy kladná čísla.

=-TINV(2*F7;F2-1)

Při určování p-hodnoty použijeme funkci TDIST. Tato funkce má důležitý třetí parametr, kterým určujeme, zda je použita distribuční funkce pro standardní nebo jednostranné Studentovo rozdělení. V případě jednostranného testu zadáváme 1. Komplikace je v tom, že funkce TDIST umí pracovat jen s kladnými čísly. To můžeme opět vyřešit pomocí funkce KDYŽ:

=KDYŽ(G12<0;TDIST(-G12;F2-1;1);1-TDIST(G12;F2-1;1))

Pravostranný párový t-test

Nyní si na novém datovém souboru stručně popíšeme postup pro pravostranný párový t-test. Opět se budeme pohybovat na hladině významnosti \alpha = 5 %.

Hypotézy pravostranného testu jsou:

  • H_0: \mu_{X_1} = \mu_{X_2} \, ,
  • H_1: \mu_{X_1} > \mu_{X_2} \, .

Statistika testu zůstává samozřejmě stejná, kritický obor vyjádřený intervalem pak je:

W = \langle t_{1 - \alpha} (n - 1) , \infty )  \, .

Výpočet s využitím doplňku Analýza dat

Výpočet pomocí Analýzy dat provádíme stejně jako v předchozím případě. Na obrázku níže vidíme výsledek. Hodnota statistiky testu je T = -1{,}9739. V případě pravostranného testu je kritický obor skutečně napravo od nuly a přesný zápis kritického oboru intervalem by byl

W = \langle 1{,}7291 , \infty )  \, .

parovy pravostranny t-test analyza dat

V našem případě je však špatně zobrazená p-hodnota. Protože statistika pravostranného testu je záporná, p-hodnota musí být větší než 0{,}5. Analýza dat nám zobrazuje p-hodnotu 0{,}0316, to by však byla p-hodnota pro případ levostranného testu. P-hodnota pravostranného testu je 1 - 0{,}0316= 0{,}9684.

Využití funkce T.TEST (TTEST)

Podobná záludnost jako výše nás čeká i u funkcí T.TEST a TTEST. Výše už jsme si popsali úpravu, která nám zajistí, že p-hodnota testu bude vždy správná. V případě pravostranného testu stačí malá úprava: změna znaménka nerovnosti u podmínky.

=KDYŽ(F12>0;T.TEST(A2:A21;B2:B21;1;1);1-T.TEST(A2:A21;B2:B21;1;1))

To samé platí pro funkci TTEST.

=KDYŽ(G12>0; TTEST(A2:A21;B2:B21;1;1);1- TTEST(A2:A21;B2:B21;1;1))

Manuální výpočet

Paradoxně jednoduše nyní může vypadat manuální výpočet v novějších verzích Excelu. Hranici kritického oboru určíme opět pomocí funkce T.INV, nyní však “odsekáváme” rozdělení statistiky zprava, protože jako kvantil zadáváme 1 - \alpha:

=T.INV(1-F7;F2-1)

Pro určení p-hodnoty můžeme použít funkci T.DIST.RT, což je pravostranná distribuční funkce Studentova rozdělení:

=T.DIST.RT(F12;F2-1)

Použijeme-li nám již známou funkci T.INV, musíme samozřejmě provést odečtení hodnoty od jedničky, abychom získali p-hodnotu:

=1-T.DIST(F12;F2-1;PRAVDA)

Ve starších verzích Excelu opět použijeme funkci TINV. Odebereme ale znaménko minus, protože hranice kritického oboru je nyní kladné číslo:

=TINV(2*F7;F2-1)

Pro správné určení p-hodnoty testu opět použijeme funkci KDYŽ, oproti levostrannému testu měníme znaménko nerovnosti v podmínce:

=KDYŽ(H12>0;TDIST(H12;F2-1;1);1-TDIST(-H12;F2-1;1))

parovy pravostranny t-test data a vysledky

Oboustranný párový t-test

Zbývá nám poslední varianta testu a tím je oboustranný párový t-test. V případě oboustranného testu řešíme pouze to, jestli se střední hodnoty liší nebo ne. Nerozhodujeme, který ze souborů má menší a který větší střední hodnotu. Vygenerujeme si nový datový soubor, test si ukážeme na \alpha = 5 %.

Hypotézy oboustranného testu jsou:

  • H_0: \mu_{X_1} = \mu_{X_2} \, ,
  • H_1: \mu_{X_1} \neq \mu_{X_2} \, .

Statistika testu zůstává stále stejná, kritický obor vyjádřený intervalem je:

W = ( - \infty, t_{\frac{\alpha}{2}} (n - 1) \rangle \cup \langle t_{1 - \frac{\alpha}{2}} (n - 1) , \infty )  \, .

Výpočet s využitím doplňku Analýza dat

Výpočet pomocí Analýzy dat se spouští stejně jako v předchozích případech. Ve výsledcích nás stále zajímá hodnota statistiky, která je nyní T = -2{,}3527. Dále se podíváme na poslední dva řádky, kde vidíme p-hodnotu testu a hranici kritického oboru. Studentovo rozdělení je symetrické a tak víme, že kritický obor je

W = ( - \infty, -2{,}0930 \rangle \cup \langle 2{,}0930, \infty )  \, .

Na základě p-hodnoty i na základě faktu, že hodnota statistiky se nachází v kritickém oboru, zamítáme nulovou hypotézu.

parovy oboustranny t-test analyza dat

Využití funkce T.TEST (TTEST)

Použití funkce T.TEST je v tomto případě jednoduché. Jako třetí parametr zadáváme číslo 2, které značí oboustranný test. V tomto případě není výpočet komplikovaný 2 variantami testu jako u jednostranných testů a výsledek je vždy správný.

=T.TEST(A2:A21;B2:B21;2;1)

U starší funkce TTEST platí to samé, tj. jako třetí parametr zadáváme dvojku.

=TTEST(A2:A21;B2:B21;2;1)

Manuální výpočet

Poslední možností je manuální výpočet. Pro určení hranic kritického oboru v novějších verzích Excelu použijeme opět funkce T.INV. Dolní hranici kritického oboru určíme vzorcem

=T.INV(F7/2;F2-1)

a horní hranici

=T.INV(1-F7/2;F2-1)

Všimněte si, že použití této funkce je velmi přímočaré, protože použité kvantily odpovídají těm z vzorce pro kritický obor.

P-hodnotu nejsnadněji určíme pomocí funkce T.DIST.2T, což je distribuční funkce oboustranného Studentova rozdělení. Pouze si musíme uvědomit, že tato funkce je vhodná pouze pro oboustranné testy. Funkce zadáme hodnotu statistiky (obecně v absolutní hodnotě, protože funkce pracuje jen s kladnými čísly) a získáme p-hodnotu.

=T.DIST.2T(ABS(F13);F2-1)

Pokud bychom chtěli použít klasickou distribuční funkci Studentova rozdělení, pak musíme použít následující vzorec:

=2*MIN(T.DIST(F13;F2-1;PRAVDA);1-T.DIST(F13;F2-1;PRAVDA))

Máme-li starší verzi Excelu, použijeme pro určení kritického oboru funkci TINV. Protože tato funkce pracuje s oboustranným rozdělením, zadáváme jako kvantily přímo hladinu významnosti. K dolní hranici si sami musíme doplnit znaménko minus, tj:

=-TINV(F7;F2-1)

Horní hranice je pak stejný vzorec, pouze bez znaménka minus:

=TINV(F7;F2-1)

Zbývá nám určit p-hodnotu. K tomu použijeme funkci TDIST, kde jako poslední parametr zadáváme 2. Tato funkce se pak chová stejně jako T.DIST.2T, tím pádem její výsledek už nijak neupravujeme a rovnou získáváme p-hodnotu testu.

=TDIST(ABS(H13);F2-1;2)

parovy oboustranny t-test data a vysledky

Trip to the USA – part II

As I promised to you, I am presenting the rest of my photos from my USA trip. I hope you will like it.

The Statue of Liberty is maybe the most famous symbol of New York. Maybe not so many people know that it was built in France. It was a gift for Americans from Frenchmen. The statue is on Liberty Island and you can go there easily by a ferry. You can buy tickets to a pedestal of the statue and it is also possible to go on a top of the statue but it is necessary to buy a ticket in a several months advance.

DSC03693

This is a view from the pedestal. If you think that a wind is cold and strong on the ferry, it is nothing comparing to the wind on the pedestal. But of course, it is 40 meters high. Then you can go the Ellis Island to Museum of Immigration. You can there, for example, check if some of your ancestors immigrated to America.

DSC03711

Manhattan is connected with Long Island by two beautiful bridges – Brooklyn Bridge (the closer one on the photo) and Manhattan Bridge. You can walk across both of them.

DSC03723

First time I walked over Brooklyn Bridge. There is a nice walk path over it. This is a view of Manhattan from the beginning of the path.

DSC03732

This is little further. You can see iron ropes which are parts of the construction of the bridge.

DSC03736

This photo is really from New York, despite it looks like a photo of Arc de Triomphe in Paris. It is Washington Square Arch.

DSC03741

The next day I went from Brooklyn to Manhattan over the Manhattan Bridge. The view of Manhattan from this bridge is really amazing.

DSC03755

That was the last photo from New York because I went to Washington in the afternoon. It is a shame that I didn’t have time to see many interesting places – National Museum of Mathematics for example. But I take it as a reason to visit New York once more.

Washington also has an amazing park close to the centre. It is called Rock Creek Park. It is far less famous than Central Park. I must admit that I hadn’t heard about it before my trip. But it’s also really beautiful.

DSC03770

DSC03771

This is a monument in front of Union Station – the main railway and bus station of Washington.

DSC03778

The United States Capitol is (with White House) symbol of Washington. An almost every time we see a reporter in news speaking from Washington, he has The Caption in the background. The building is really extremely large and impressive.

DSC03788

DSC03790

If you want to see the Supreme Court of the United States, just cross a road in front of the Capitol. Just make sure you are crossing over a zebra crossing. Otherwise, you will be admonished by a policeman as I was.

DSC03792

This is how a typical Washington street look likes – I really liked lines of trees between houses and roads.

DSC03830

Quotations of Martin Luther King on black notices are very common in Washington – plenty people have them in gardens in front of their houses.

DSC03836

The Washington Monument had been wor’s tallest structure till 1889. It is 169 meters high and also very impressive.

DSC03866

Another building with large and tall grey columns National Gallery of Art. There are a lot of beautiful painting in the gallery and entrance is for free.

DSC03871

I would recommend you to visit the National World War II Memorial at night. Lights, a fountain and columns in the background create a very unique experience.

DSC03900

This place reminds another important American presient – it is the Lincoln Memorial.

DSC03906

And, of course, this is the White House.

DSC03920

And finally, few photos from Philadelphia. This is the City Hall.

DSC03936

And here is rest of my photos. I’ve planned extremely little time to spend in Philadelphia. I am definitely planning to visit this amazing city once more because this time I missed a lot of interesting and important places.

DSC03946

DSC03948

DSC03951

DSC03956