T-test (definícia, typy) - Príklady výpočtu krok za krokom

Čo je T-test?

T-test je metóda používaná na odvodenie záveru v štatistike, ktorá je zameraná na zistenie, či existuje nejaký zásadný rozdiel medzi dvoma prostriedkami, pričom tieto dve uvažované skupiny môžu byť vo vzájomnom vzťahu.

Vysvetlenie

  • Je zameraná na testovanie hypotéz, ktoré sa v zásade používa na testovanie hypotéz týkajúcich sa danej populácie. T-test berie do úvahy štatistiku T, hodnoty distribúcie T a stupne voľnosti, ktoré sa používajú na určenie pravdepodobnosti rozdielu medzi dvoma súbormi údajov.
  • Základné fungovanie T-testu spočíva v tom, že berie do úvahy vzorku z každej z dvoch množín a zostavuje vyhlásenie o probléme zvážením nulovej hypotézy, pri ktorej sú obidva prostriedky uvedené rovnaké.
  • Na základe rovnakých vzorcov sa hodnoty nakreslia a porovnajú so štandardnými hodnotami, čo ďalej vedie k prijatiu alebo odmietnutiu nulovej hypotézy. Odmietnutie nulovej hypotézy naznačuje, že súbor údajov je dosť presný a nie náhodou.

Typy T-testu

Existujú predovšetkým štyri typy t-testu, ktoré sú nasledujúce:

# 1 - 1-ukážkový T-test

Je zameraný na testovanie, ak sa stredná hodnota, na ktorú sa zameral, rovná priemeru jednej populácie, napr. Testovanie, či je priemerná hmotnosť študentov triedy 5 vyššia ako 45 kg

# 2 - 2-ukážkový T-test

Je zameraný na testovanie, či sa stredná hodnota, na ktorú sa zameral, rovná priemeru dvoch nezávislých populácií, napr. Testovanie, či sa priemerná hmotnosť študentov triedy 5 pre chlapcov líši od priemeru študentov triedy 5 pre dievčatá.

# 3 - Spárovaný T-test

Je zameraný na testovanie, či sa priemer hodnoty, na ktorú sa človek zameral, rovná priemeru rozdielov medzi pozorovaniami, ktoré sú závislé. napr. porovnanie známok študentov pred a po ukončení školného pre každý predmet nám pomáha zistiť, či je školné dostatočne významné na zlepšenie známok študentov.

# 4 - T-test v regresnom výstupe

Berie do úvahy koeficient v regresnej rovnici a testy, do akej miery sa líši od nulovej hodnoty. napr. Ak je skóre prijímacej skúšky významným faktorom pri určovaní, či študent získa dobré konečné skóre.

Predpoklady T-testu

  • Prvý predpoklad t-testu súvisí s mierkou merania. Súvisí to s tým, či stupnica sleduje súvislú alebo radovú stupnicu
  • Druhý predpoklad sa môže týkať náhodnej povahy vzorky. To znamená, že zhromaždené údaje by mali mať čisto náhodný charakter.
  • Tretím predpokladom môže byť, že keď vykreslíme údaje týkajúce sa rozdelenia t-testu, malo by sa riadiť normálnym rozdelením a priniesť zvončekovo zakrivený graf.
  • Štvrtým predpokladom môže byť, že pre t-distribúciu a konkrétne pre získanie tvaru zvonovej krivky potrebujeme mať väčšiu veľkosť vzorky.
  • Konečným predpokladom môže byť predpoklad pre t-test. Odchýlka by mala mať homogénnu povahu. e. štandardné odchýlky sú takmer rovnaké.

Ako vypočítať?

Funguje v dvoch rôznych scenároch, tj. Jeden pre nezávislú vzorku a druhý pre závislú vzorku.

# 1 - Nezávislý vzorový scenár

  • Musíme vypočítať súčet, veľkosť vzorky, ktorá je určená znakom „N“, a hodnotu skóre pre priemer pre každú z nezávislých vzoriek. Potom je potrebné vypočítať stupeň voľnosti pre každú nezávislú vzorku.
  • To predstavuje odpočítanie vzorky od jednej, ktorú označujeme ako „n-1“. Potom je potrebné vypočítať odchýlku a štandardnú odchýlku.
  • Sčítajú sa stupne voľnosti vzoriek, ktoré sa označujú ako „df-total“. Ďalej musíme vynásobiť stupeň voľnosti každej vzorky s odchýlkou ​​každej z nich. Musíme pridať výslednice a potom vydeliť súčet „df-total“. Získaný výsledok sa nazýva združená variancia.
  • Súhrnná variancia sa potom vydelí n vzoriek. Výsledok získaný pre všetky vzorky sa potom pripočíta. Zoberie sa druhá odmocnina a nazýva sa to štandardná chyba rozdielu.
  • Nakoniec musíme odčítať spodný priemer vzorky od väčšieho priemeru vzorky. Získaný rozdiel sa potom vydelí štandardnou chybou rozdielu a získané výsledky sa nazývajú T-hodnota.

# 2 - Závislý vzorový scenár

  • Skóre získané z každej z dvojíc množiny údajov sa zaznamenajú a musíme ich odpočítať. Získané rozdiely sa sčítajú a označujú ako „D.“ Rozdiely každej vzorky sa štvorčekujú a pripočítajú k výsledku, ktorý sa nazýva „D-štvorček“. Potom musíme vynásobiť „N“ alebo počet skóre spárovaných s „štvorcom“.
  • Získaný výsledok sa odpočíta od štvorca celkového „D.“ Tento výsledok je ďalej rozdelený na „N-1“. Získa sa druhá odmocnina výslednice, ktorá sa nazýva deliteľ. Nakoniec musíme vydeliť celkové „D“ deliteľom, čím získate konečnú hodnotu t.

Príklady T-testu

Zoberme do úvahy, že máme skóre každého predmetu pri skúške konanej na dva semestre.

Krok 1: Odčítajte 1. fázu od 2. fázy

Krok 2: Sčítajte všetky rozdiely, tj -55

Krok 3: Zarovnajte rozdiely

Krok 4: Sčítajte všetky štvorce rozdielu, tj. 983

Krok 5: Použitie vzorca na výpočet hodnoty T.

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Hodnota T = -2,29

Získaná hodnota T sa potom porovná s hodnotou T získanou z tabuľky s použitím hodnoty p a stupňa voľnosti. Ak je vypočítaná hodnota t väčšia ako hodnota tabuľky pri konkrétnej preddefinovanej hladine alfa, môžeme nulovú hypotézu odmietnuť a povedať, že existuje rozdiel medzi priemermi.

Kedy sa používa?

Používa sa na porovnanie dvoch priemerov alebo pomerov. Tiež používame t-test, keď sú populačné parametre pre používateľa neznáme. Existujú zhruba tri prípady použitia scenára t-test, ktoré sú nasledujúce:

  • Nezávislý výberový t-test sa používa, ak chceme porovnať priemer dvoch skupín.
  • Spárovaný vzorkový t-test sa používa, keď chceme porovnať priemer z tej istej skupiny, ale v rôznych časových bodoch.
  • Jeden vzorový t-test sa používa, keď potrebujeme skontrolovať priemer individuálnej skupiny proti neznámemu priemeru.

Používanie T-testu v programe Excel

  • V programe Excel je prvou a najdôležitejšou vecou, ​​ktorú potrebujeme, inštalácia doplnku s názvom Analýza údajov. Potom musíme prejsť na kartu „Údaje“ na karte ponuky a kliknúť na ňu. Zobrazí sa tu možnosť „Analýza údajov“.
  • Aby sme mohli vykonať T-test, musíme mať svoje údaje v stĺpcovom formáte. Po kliknutí na položku „Analýza údajov“ získame niekoľko štatistických testov, ktoré môžeme vykonať, a zo zoznamu musíme zvoliť t-test a kliknúť na tlačidlo „OK“.
  • Zobrazí sa dialógové okno, kde musíme zadať údaje pre stopu 1 do poľa variabilného rozsahu 1 a tiež údaje zo skúšky 2 do polí variabilného rozsahu 2. V predvolenom nastavení zostáva hodnota alfa na 0,05, čo je však možné zmeniť na základe našich preferencií. Keď sú v poriadku, kliknite na „OK“.
  • Teraz môžeme vidieť výsledok nášho T-testu na hárku programu Excel. Najdôležitejšou hodnotou, ktorú si tu treba uvedomiť, je hodnota P. Na základe toho, čo sme vybrali našu hodnotu alfa, ak je naša hodnota P v programe Excel menšia ako hodnota alfa, môžeme dospieť k záveru, že medzi priemermi našich dvoch súborov hodnôt je štatistický významný rozdiel.

Záver

T-test je zameraný na testovanie hypotéz, ktoré sa v zásade používa na testovanie hypotéz vzťahujúcich sa na danú populáciu. Hovorí nám to úroveň významnosti rozdielu medzi skupinami, ktoré sa zvyčajne merajú na základe priemeru. Tu v podstate zisťujeme rozdiel medzi populačnými prostriedkami a predpokladanou hodnotou.

Zaujímavé články...