Čo je T-test?
T-test je metóda používaná na odvodenie záveru v štatistike, ktorá je zameraná na zistenie, či existuje nejaký zásadný rozdiel medzi dvoma prostriedkami, pričom tieto dve uvažované skupiny môžu byť vo vzájomnom vzťahu.
Vysvetlenie
- Je zameraná na testovanie hypotéz, ktoré sa v zásade používa na testovanie hypotéz týkajúcich sa danej populácie. T-test berie do úvahy štatistiku T, hodnoty distribúcie T a stupne voľnosti, ktoré sa používajú na určenie pravdepodobnosti rozdielu medzi dvoma súbormi údajov.
- Základné fungovanie T-testu spočíva v tom, že berie do úvahy vzorku z každej z dvoch množín a zostavuje vyhlásenie o probléme zvážením nulovej hypotézy, pri ktorej sú obidva prostriedky uvedené rovnaké.
- Na základe rovnakých vzorcov sa hodnoty nakreslia a porovnajú so štandardnými hodnotami, čo ďalej vedie k prijatiu alebo odmietnutiu nulovej hypotézy. Odmietnutie nulovej hypotézy naznačuje, že súbor údajov je dosť presný a nie náhodou.

Typy T-testu
Existujú predovšetkým štyri typy t-testu, ktoré sú nasledujúce:
# 1 - 1-ukážkový T-test
Je zameraný na testovanie, ak sa stredná hodnota, na ktorú sa zameral, rovná priemeru jednej populácie, napr. Testovanie, či je priemerná hmotnosť študentov triedy 5 vyššia ako 45 kg
# 2 - 2-ukážkový T-test
Je zameraný na testovanie, či sa stredná hodnota, na ktorú sa zameral, rovná priemeru dvoch nezávislých populácií, napr. Testovanie, či sa priemerná hmotnosť študentov triedy 5 pre chlapcov líši od priemeru študentov triedy 5 pre dievčatá.
# 3 - Spárovaný T-test
Je zameraný na testovanie, či sa priemer hodnoty, na ktorú sa človek zameral, rovná priemeru rozdielov medzi pozorovaniami, ktoré sú závislé. napr. porovnanie známok študentov pred a po ukončení školného pre každý predmet nám pomáha zistiť, či je školné dostatočne významné na zlepšenie známok študentov.
# 4 - T-test v regresnom výstupe
Berie do úvahy koeficient v regresnej rovnici a testy, do akej miery sa líši od nulovej hodnoty. napr. Ak je skóre prijímacej skúšky významným faktorom pri určovaní, či študent získa dobré konečné skóre.
Predpoklady T-testu
- Prvý predpoklad t-testu súvisí s mierkou merania. Súvisí to s tým, či stupnica sleduje súvislú alebo radovú stupnicu
- Druhý predpoklad sa môže týkať náhodnej povahy vzorky. To znamená, že zhromaždené údaje by mali mať čisto náhodný charakter.
- Tretím predpokladom môže byť, že keď vykreslíme údaje týkajúce sa rozdelenia t-testu, malo by sa riadiť normálnym rozdelením a priniesť zvončekovo zakrivený graf.
- Štvrtým predpokladom môže byť, že pre t-distribúciu a konkrétne pre získanie tvaru zvonovej krivky potrebujeme mať väčšiu veľkosť vzorky.
- Konečným predpokladom môže byť predpoklad pre t-test. Odchýlka by mala mať homogénnu povahu. e. štandardné odchýlky sú takmer rovnaké.
Ako vypočítať?
Funguje v dvoch rôznych scenároch, tj. Jeden pre nezávislú vzorku a druhý pre závislú vzorku.
# 1 - Nezávislý vzorový scenár
- Musíme vypočítať súčet, veľkosť vzorky, ktorá je určená znakom „N“, a hodnotu skóre pre priemer pre každú z nezávislých vzoriek. Potom je potrebné vypočítať stupeň voľnosti pre každú nezávislú vzorku.
- To predstavuje odpočítanie vzorky od jednej, ktorú označujeme ako „n-1“. Potom je potrebné vypočítať odchýlku a štandardnú odchýlku.
- Sčítajú sa stupne voľnosti vzoriek, ktoré sa označujú ako „df-total“. Ďalej musíme vynásobiť stupeň voľnosti každej vzorky s odchýlkou každej z nich. Musíme pridať výslednice a potom vydeliť súčet „df-total“. Získaný výsledok sa nazýva združená variancia.
- Súhrnná variancia sa potom vydelí n vzoriek. Výsledok získaný pre všetky vzorky sa potom pripočíta. Zoberie sa druhá odmocnina a nazýva sa to štandardná chyba rozdielu.
- Nakoniec musíme odčítať spodný priemer vzorky od väčšieho priemeru vzorky. Získaný rozdiel sa potom vydelí štandardnou chybou rozdielu a získané výsledky sa nazývajú T-hodnota.
# 2 - Závislý vzorový scenár
- Skóre získané z každej z dvojíc množiny údajov sa zaznamenajú a musíme ich odpočítať. Získané rozdiely sa sčítajú a označujú ako „D.“ Rozdiely každej vzorky sa štvorčekujú a pripočítajú k výsledku, ktorý sa nazýva „D-štvorček“. Potom musíme vynásobiť „N“ alebo počet skóre spárovaných s „štvorcom“.
- Získaný výsledok sa odpočíta od štvorca celkového „D.“ Tento výsledok je ďalej rozdelený na „N-1“. Získa sa druhá odmocnina výslednice, ktorá sa nazýva deliteľ. Nakoniec musíme vydeliť celkové „D“ deliteľom, čím získate konečnú hodnotu t.
Príklady T-testu
Zoberme do úvahy, že máme skóre každého predmetu pri skúške konanej na dva semestre.

Krok 1: Odčítajte 1. fázu od 2. fázy

Krok 2: Sčítajte všetky rozdiely, tj -55
Krok 3: Zarovnajte rozdiely

Krok 4: Sčítajte všetky štvorce rozdielu, tj. 983
Krok 5: Použitie vzorca na výpočet hodnoty T.
T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N- = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
- = -9,16 / √15,96
- = -9,16 / 3,99
- Hodnota T = -2,29
Získaná hodnota T sa potom porovná s hodnotou T získanou z tabuľky s použitím hodnoty p a stupňa voľnosti. Ak je vypočítaná hodnota t väčšia ako hodnota tabuľky pri konkrétnej preddefinovanej hladine alfa, môžeme nulovú hypotézu odmietnuť a povedať, že existuje rozdiel medzi priemermi.
Kedy sa používa?
Používa sa na porovnanie dvoch priemerov alebo pomerov. Tiež používame t-test, keď sú populačné parametre pre používateľa neznáme. Existujú zhruba tri prípady použitia scenára t-test, ktoré sú nasledujúce:
- Nezávislý výberový t-test sa používa, ak chceme porovnať priemer dvoch skupín.
- Spárovaný vzorkový t-test sa používa, keď chceme porovnať priemer z tej istej skupiny, ale v rôznych časových bodoch.
- Jeden vzorový t-test sa používa, keď potrebujeme skontrolovať priemer individuálnej skupiny proti neznámemu priemeru.
Používanie T-testu v programe Excel
- V programe Excel je prvou a najdôležitejšou vecou, ktorú potrebujeme, inštalácia doplnku s názvom Analýza údajov. Potom musíme prejsť na kartu „Údaje“ na karte ponuky a kliknúť na ňu. Zobrazí sa tu možnosť „Analýza údajov“.
- Aby sme mohli vykonať T-test, musíme mať svoje údaje v stĺpcovom formáte. Po kliknutí na položku „Analýza údajov“ získame niekoľko štatistických testov, ktoré môžeme vykonať, a zo zoznamu musíme zvoliť t-test a kliknúť na tlačidlo „OK“.
- Zobrazí sa dialógové okno, kde musíme zadať údaje pre stopu 1 do poľa variabilného rozsahu 1 a tiež údaje zo skúšky 2 do polí variabilného rozsahu 2. V predvolenom nastavení zostáva hodnota alfa na 0,05, čo je však možné zmeniť na základe našich preferencií. Keď sú v poriadku, kliknite na „OK“.
- Teraz môžeme vidieť výsledok nášho T-testu na hárku programu Excel. Najdôležitejšou hodnotou, ktorú si tu treba uvedomiť, je hodnota P. Na základe toho, čo sme vybrali našu hodnotu alfa, ak je naša hodnota P v programe Excel menšia ako hodnota alfa, môžeme dospieť k záveru, že medzi priemermi našich dvoch súborov hodnôt je štatistický významný rozdiel.
Záver
T-test je zameraný na testovanie hypotéz, ktoré sa v zásade používa na testovanie hypotéz vzťahujúcich sa na danú populáciu. Hovorí nám to úroveň významnosti rozdielu medzi skupinami, ktoré sa zvyčajne merajú na základe priemeru. Tu v podstate zisťujeme rozdiel medzi populačnými prostriedkami a predpokladanou hodnotou.