Distribúcia vzorkovania - definícia, typy a príklady

Čo je to distribúcia vzoriek?

Distribúciu vzorkovania možno definovať ako rozdelenie pravdepodobnosti pomocou štatistík tak, že sa najskôr vyberie konkrétna populácia a potom sa použijú náhodné vzorky, ktoré sa odoberajú z populácie, tj. V zásade sa zameriava na šírenie frekvencií súvisiacich so šírením rôznych výsledkov alebo výsledky, ktoré sa môžu prípadne uskutočniť pre konkrétnu vybranú populáciu.

Vysvetlenie

  • Mnoho výskumníkov, akademikov, trhových stratégov atď. Uprednostňuje distribúciu vzoriek namiesto výberu celej populácie. Vďaka tomu je sada údajov ľahká a tiež spravovateľná. Aby sme to uľahčili, predpokladajme, že obchodník chce urobiť analýzu počtu mladých ľudí, ktorí jazdia na bicykli medzi dvoma regiónmi vo vekovej hranici 13-18 rokov.
  • Z tohto dôvodu nebude brať do úvahy celú populáciu prítomnú v dvoch regiónoch vo veku 13-18 rokov, čo je prakticky nemožné, a aj keby to bolo príliš časovo náročné a súbor údajov nie je zvládnuteľný . Namiesto toho marketingový pracovník odoberie sadu vzoriek po 200 z každého regiónu a vykoná distribúciu.
  • Priemerný počet použití bicykla sa tu označuje ako priemerná hodnota vzorky. Každá vybraná vzorka má vygenerovaný svoj vlastný priemer a rozdelenie vykonané pre získaný priemerný priemer je definované ako rozdelenie vzorky. Získaná odchýlka sa označuje ako štandardná chyba.

Príklad rozdelenia vzoriek

  1. Za predpokladu, že výskumný pracovník vedie štúdiu o váhach obyvateľov konkrétneho mesta a má k dispozícii päť pozorovaní alebo vzoriek, tj. 70 kg, 75 kg, 85 kg, 80 kg a 65 kg. Mesto sa všeobecne považuje za mesto s normálnym rozdelením a z hľadiska hmotnostných mier si zachováva štandardnú odchýlku 5 kg. Priemer sa teda môže vypočítať ako (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. Tiež predpokladáme, že veľkosť populácie je obrovská; teda aby sme prešli na druhý krok, vydelíme počet pozorovaní alebo vzoriek 1, tj. 1/5 = 0,20. Teraz musíme vziať druhú odmocninu 0,20, čo predstavuje 0,45. Druhá odmocnina sa potom vynásobí štandardnou odchýlkou, tj 0,45 * 5 = 2,25 kg. Takto získaná štandardná chyba je 2,25 kg a získaná stredná hodnota bola 75 kg. Tieto dva faktory možno použiť na opis rozdelenia.

Typy distribúcie vzoriek

# 1 - Distribúcia vzorkovania priemeru

  • To možno definovať ako pravdepodobnostné rozšírenie všetkých priemerov vzoriek vybraných náhodne na pevnej veľkosti z konkrétnej populácie. Ak sa vzorky rozhodli pre normálnu populáciu, šírenie získaného priemeru bude tiež normálne vzhľadom na priemer a štandardnú odchýlku.
  • Ak populácia nie je normálna až stále, distribúcia prostriedkov bude mať tendenciu približovať sa k normálnemu rozdeleniu za predpokladu, že veľkosť vzorky je dosť veľká.

# 2 - Rozdelenie vzoriek proporcií

Toto je primárne spojené so štatistikami zahrnutými do atribútov. Tu vstupuje do hry úloha binomickej distribúcie. Spravidla reaguje na zákony binomického rozdelenia, ale s nárastom veľkosti vzorky sa zvyčajne stáva opäť normálnym rozdelením.

# 3 - Študentova T-distribúcia

Tento typ distribúcie sa používa, keď výskumník nepozná štandardnú odchýlku populácie alebo ak je veľkosť vzorky veľmi malá. Tento typ rozdelenia je veľmi symetrický a spĺňa podmienku štandardného normálneho variátu. Keď sa veľkosť vzorky zväčšuje, rovnomerné rozdelenie T má tendenciu veľmi sa približovať normálnemu rozdeleniu.

# 4 - F Distribúcia

  • Ak je v čitateľovi povinne prítomná väčšia variancia, nájde distribúcia F svoje využitie, pretože stupeň voľnosti mení aj kritické hodnoty zmien F, čo je použiteľné pre veľké aj malé odchýlky. To je možné vypočítať z dostupných tabuliek.
  • Porovnanie sa vykoná z nameranej hodnoty F patriacej do súboru vzoriek a hodnoty, ktorá sa vypočíta z tabuľky, ak je predchádzajúca rovnaká alebo väčšia ako tabuľková hodnota, bude nulová hypotéza štúdie zamietnutá.

# 5 - Chi-Square Formula Distribúcia

Tento typ distribúcie sa používa, keď dátová sada zahŕňa prácu s hodnotami, ktoré zahŕňajú sčítanie štvorcov. Pridá sa množina štvorcových veličín patriacich do rozptylu vzoriek, a tak sa vytvorí distribučné rozšírenie, ktoré nazývame chí-kvadrát distribúcia.

Dôležitosť

  • To je dôležité, pretože to zjednodušuje cestu k štatistickým záverom. Okrem toho umožňuje, aby sa analytické úvahy zamerali skôr na statické rozdelenie ako na zmiešané pravdepodobnostné rozšírenie každej vybranej jednotky vzorky.
  • Eliminácia variability prítomnej v štatistike sa vykonáva pomocou tohto rozdelenia.
  • Poskytuje nám odpoveď na pravdepodobné výsledky, ktoré sa stanú najpravdepodobnejšie.
  • Zohrávajú kľúčovú úlohu v inferenčných štatistických štúdiách, čo znamená, že zohrávajú hlavnú úlohu pri tvorbe záverov o celej populácii.

Záver

  • To je v štatistike kľúčové, pretože slúži ako hlavný vodítko k štatistickému vyvodeniu. V zásade usmerňujú výskumných pracovníkov, akademikov alebo štatistikov o rozšírení frekvencií a signalizujú škálu najrôznejších pravdepodobných výsledkov, ktoré je možné ďalej označiť celou populáciou.
  • Prvotným faktorom, ktorý je tu zahrnutý, je priemer vzorky a štandardná chyba, ktoré nám v prípade odhadov pomôžu vypočítať aj distribúciu vzorky. Existujú rôzne typy distribučných techník a každá sa uplatňuje na základe scenára a súboru údajov.

Zaujímavé články...