Test štvorcových chí v Excel Ako urobiť test Chi Square s príkladom

Test chí-kvadrát s programom Excel

Chi-Square test v programe Excel je najčastejšie používaný neparametrický test používaný na porovnanie dvoch alebo viacerých premenných pre náhodne vybrané údaje. Je to typ testu, ktorý sa používa na zistenie vzťahu medzi dvoma alebo viacerými premennými. Používa sa v štatistikách, ktoré sú tiež známe ako Chi-Square P-hodnota, v programe Excel nemáme zabudovanú funkciu, ale môžeme použiť vzorce na vykonanie testu chí-kvadrát v programe Excel pomocou matematického vzorca pre test chi-kvadrát.

Typy

  1. Chí-kvadrát test na dobrú kondíciu
  2. Chi-kvadrát test nezávislosti dvoch premenných.

# 1 - Chi-Square test na správnosť prispôsobenia

Používa sa na vnímanie blízkosti vzorky, ktorá vyhovuje populácii. Symbol testu Chi-Square je (2). Je to súčet všetkých ( Pozorovaný počet - Očakávaný počet) 2 / Očakávaný počet.

  • Kde k-1 stupňov voľnosti alebo DF.
  • Kde Oi je pozorovaná frekvencia, k je kategória a Ei je očakávaná frekvencia.

Poznámka: - Správnosť zhody štatistického modelu sa týka pochopenia toho, ako dobre sa vzorové údaje hodia k súboru pozorovaní.

Používa sa

  • Dôveryhodnosť dlžníkov na základe ich vekových skupín a osobných pôžičiek
  • Vzťah medzi výkonom obchodníkov a absolvovaným školením
  • Návratnosť jednej akcie a akcií odvetvia, ako je farmaceutický alebo bankový sektor
  • Kategória divákov a vplyv televíznej kampane.

# 2 - Chi-Squareov test nezávislosti dvoch premenných

Používa sa na kontrolu, či sú premenné navzájom autonómne alebo nie. S (r-1) (c-1) stupňami voľnosti

Kde Oi je pozorovaná frekvencia, r je počet riadkov, c je počet stĺpcov a Ei je očakávaná frekvencia.

Poznámka: - Dve náhodné premenné sa nazývajú nezávislé, ak rozdelenie pravdepodobnosti jednej premennej nie je ovplyvnené druhou.

Používa sa

Test nezávislosti je vhodný pre nasledujúce situácie:

  • Existuje jedna kategorická premenná.
  • Existujú dve kategorické premenné a budete musieť určiť ich vzájomný vzťah.
  • Existujú krížové tabuľky a je potrebné nájsť vzťah medzi dvoma kategorickými premennými.
  • Existujú nekvantifikovateľné premenné (Napríklad odpovede na otázky ako, vyberajú si zamestnanci v rôznych vekových skupinách rôzne typy zdravotných plánov?)

Ako urobiť test Chi-Square v programe Excel? (s príkladom)

Manažér reštaurácie chce nájsť vzťah medzi spokojnosťou zákazníkov a platmi ľudí čakajúcich na stoly. V tomto nastavíme hypotézu na testovanie námestia Chi

  • Zoberie náhodnú vzorku 100 zákazníkov s otázkou, či bola služba vynikajúca, dobrá alebo slabá.
  • Potom kategorizuje platy čakajúcich ľudí na nízke, stredné a vysoké.
  • Predpokladajme, že hladina významnosti je 0,05. H0 a H1 tu označujú nezávislosť a závislosť kvality služieb od platov čakajúcich ľudí.
  • H 0 - kvalita služieb nezávisí od platov ľudí čakajúcich na stoly.
  • H 1 - kvalita služieb závisí od platov ľudí čakajúcich na stoly.
  • Jej objavy sú uvedené v nasledujúcej tabuľke:

V tomto prípade máme 9 dátových bodov, máme 3 skupiny, z ktorých každá dostala inú správu o plate a výsledok je uvedený nižšie.

Teraz budeme počítať súčet všetkých riadkov a stĺpcov. Urobíme to pomocou vzorca, tj SUM. Aby sme v stĺpci Súčet dosiahli hodnotu Celkom vynikajúci, napísali sme = SUM (B4: D4) a potom stlačte kláves Enter.

Toto nám dá 26 . To isté vykonáme so všetkými riadkami a stĺpcami.

Na výpočet stupňa slobody (DF) používame (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Existujú 3 kategórie služieb a 3 kategórie platov.
  • Máme 27 respondentov so stredným platom (dolný rad, stredný)
  • Máme 51 respondentov s dobrou službou (posledný stĺpec, stred)

Teraz musíme vypočítať očakávané frekvencie: -

Očakávané frekvencie je možné vypočítať pomocou vzorca: -

  • Na výpočet pre Výborný použijeme vynásobenie súčtu Nízkych a súčtu Výborných vydelené N.

Predpokladajme, že musíme počítať pre 1. riadok a 1. stĺpec (= B7 * E4 / B9 ) . Takto bude očakávaný počet zákazníkov, ktorí hlasovali za vynikajúci servis pre platy čakajúcich, nízky, tj 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

Podobne musíme urobiť to isté pre všetkých a vzorec sa uplatňuje v nasledujúcom diagrame.

Získame tabuľku očakávaných frekvencií, ako je uvedené nižšie: -

Poznámka: - Predpokladajme, že hladina významnosti je 0,05. H0 a H1 tu označujú nezávislosť a závislosť kvality služieb od platov čakajúcich stolov.

Po výpočte očakávanej frekvencie vypočítame chí-kvadrát dátové body pomocou vzorca.

Body Chi-Square = (pozorované - očakávané) 2 / očakávané

Na výpočet prvého bodu napíšeme = (B4-B14) 2 / B14.

Skopírujeme a prilepíme vzorec do iných buniek, aby sme hodnotu vyplnili automaticky.

Potom vypočítame hodnotu chi (vypočítaná hodnota) pridaním všetkých hodnôt uvedených nad tabuľkou.

Hodnotu Chi sme dostali ako 18 65823 .

Na výpočet kritickej hodnoty použijeme tabuľku kritických hodnôt chí-kvadrát alebo môžeme použiť vzorec uvedený nižšie.

Tento vzorec obsahuje 2 parametre CHISQ.INV.RT (pravdepodobnosť, stupeň voľnosti).

Pravdepodobnosť je 0,05 a je to významná hodnota, ktorá nám pomôže určiť, či akceptujeme nulovú hypotézu (H 0 ) alebo nie.

Kritická hodnota chí-kvadrátu je 9,487729037.

Teraz nájdeme hodnotu chí-kvadrátu alebo (P-hodnota) = CHITEST (skutočný_rozsah, očakávaný_rozsah)

Rozsah od = CHITEST (B4: D6, B14: D16) .

Ako sme videli, hodnota chi-testu alebo P-hodnoty je = 0,00091723.

Vypočítali sme všetky hodnoty. Hodnoty chí-kvadrát (vypočítaná hodnota) sú významné iba vtedy, keď je ich hodnota rovnaká alebo vyššia ako kritická hodnota 9,48, tj. Aby akceptovala nulovú hypotézu (H 0 ), musí byť kritická hodnota (tabuľková hodnota) vyššia ako 18,65 .

Ale tu Vypočítaná hodnota > Tabuľková hodnota

X 2 (vypočítané)> X 2 (uvedené v tabuľke)

18,65> 9,48

V takom prípade odmietneme nulovú hypotézu (H 0 ) a bude prijatá alternatíva (H 1 ) .

  • Môžeme tiež použiť P-hodnotu na predpovedanie toho istého, tj. Ak P-hodnota <= α (významná hodnota 0,05), bude nulová hypotéza odmietnutá.
  • Ak je hodnota P> α , nezavrhujte nulovú hypotézu .

Tu P-hodnota (0,0009172) < α (0,05), odmietnuť H 0 , akceptovať H 1

Z vyššie uvedeného príkladu usudzujeme, že kvalita služieb závisí od platov čakajúcich ľudí.

Na čo treba pamätať

  • Považuje druhú mocninu normálnej variácie.
  • Vyhodnocuje, či sa frekvencie pozorované v rôznych kategóriách významne líšia od frekvencií očakávaných pri stanovenom súbore predpokladov.
  • Určuje, ako dobre sa predpokladaná distribúcia hodí k údajom.
  • Používa kontingenčné tabuľky (v prieskumoch trhu sa tieto tabuľky nazývajú krížové karty).
  • Podporuje merania na nominálnej úrovni.

Zaujímavé články...