Veľkosť vzorky (definícia, vzorec) Vypočítajte veľkosť vzorky

Vzorec na určenie veľkosti vzorky populácie

Vzorec veľkosti vzorky pomáha pri výpočte alebo určení minimálnej veľkosti vzorky, ktorá je potrebná na poznanie adekvátneho alebo správneho podielu populácie spolu s úrovňou spoľahlivosti a mierou chyby.

Pojem „vzorka“ sa vzťahuje na časť populácie, ktorá nám umožňuje vyvodiť závery o populácii, a preto je dôležité, aby veľkosť vzorky bola dostatočná na to, aby bolo možné vyvodiť zmysluplné závery. Inými slovami, je to minimálna veľkosť, ktorá je potrebná na odhad skutočného podielu populácie s požadovanou mierou chybovosti a spoľahlivosti. Preto je určenie vhodnej veľkosti vzorky jedným z opakujúcich sa problémov v štatistickej analýze. Jeho rovnicu možno odvodiť pomocou veľkosti populácie, kritickej hodnoty normálneho rozdelenia, podielu vzorky a chybovej odchýlky.

Veľkosť vzorky n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 ))

kde,

  • N = veľkosť populácie,
  • Z = kritická hodnota normálneho rozdelenia na požadovanej úrovni spoľahlivosti,
  • p = podiel vzorky,
  • e = rozpätie chyby

Ako vypočítať veľkosť vzorky? (Krok za krokom)

  • Krok 1: Najskôr určte veľkosť populácie, čo je celkový počet odlišných entít vo vašej populácii a je označená písmenom N. (Poznámka: Ak je veľkosť populácie veľmi veľká, ale presný počet nie je známy, použite 100 000, pretože veľkosť vzorky sa pre populácie väčšie ako táto príliš nemení.)
  • Krok 2: Ďalej určite kritickú hodnotu normálneho rozdelenia na požadovanej úrovni spoľahlivosti. Napríklad kritická hodnota pri 95% miere spoľahlivosti je 1,96.
  • Krok 3: Ďalej určite podiel vzorky, ktorý sa dá použiť z výsledkov predchádzajúcich prieskumov alebo ktorý sa dá zhromaždiť vykonaním malého pilotného prieskumu. (Poznámka: Ak si nie ste istí, môžete vždy použiť 0,5 ako konzervatívny prístup, čím získate čo najväčšiu veľkosť vzorky.)
  • Krok 4: Ďalej určite hranicu chyby, čo je rozsah, v ktorom sa očakáva, že skutočná populácia bude ležať. (Poznámka: Čím je miera chyby menšia, tým viac je presnosť, a teda presná odpoveď.)
  • Krok 5: Nakoniec je možné odvodiť rovnicu veľkosti vzorky pomocou veľkosti populácie (krok 1), kritickej hodnoty normálneho rozdelenia na požadovanej úrovni spoľahlivosti (krok 2), podielu vzorky (krok 3) a hranice chyby ( krok 4), ako je uvedené nižšie.

Príklady

Príklad č

Vezmime si príklad maloobchodníka, ktorý má záujem vedieť, koľko ich zákazníkov si od nich kúpilo položku po prezretí ich webovej stránky v určitý deň. Vzhľadom na to, že ich web má v priemere 10 000 zobrazení za deň, určuje veľkosť vzorky zákazníkov, ktorú musia monitorovať, na 95% úrovni spoľahlivosti s 5% mierou chyby, ak:

  • Nie sú si istí aktuálnym konverzným pomerom.
  • Z predchádzajúcich prieskumov vedia, že konverzný pomer je 5%.

Vzhľadom na to,

  • Veľkosť populácie, N = 10 000
  • Kritická hodnota pri 95% hladine spoľahlivosti, Z = 1,96
  • Marža chyby, e = 5% alebo 0,05

1 - Pretože súčasný konverzný pomer nie je známy, predpokladajme p = 0,5

Preto možno veľkosť vzorky vypočítať pomocou vzorca ako,

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 )))))

Preto bude 370 zákazníkov postačovať na vyvodenie zmysluplných záverov.

2 - Aktuálny konverzný pomer je p = 5% alebo 0,05

Preto je možné veľkosť vzorky vypočítať pomocou vyššie uvedeného vzorca ako,

= (10 000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 )))))

Preto v tomto prípade bude na vyvodenie zmysluplného vyvodenia postačujúca veľkosť 72 zákazníkov.

Príklad č

Zoberme si vyššie uvedený príklad a v tomto prípade predpokladajme, že veľkosť populácie, tj. Denné prezeranie webových stránok, je medzi 100 000 a 120 000, ale potom nie je známa presná hodnota. Zvyšok hodnôt je rovnaký spolu s konverzným pomerom 5%. Vypočítajte veľkosť vzorky pre 100 000 aj 120 000.

Vzhľadom na to,

  • Podiel vzorky, p = 0,05
  • Kritická hodnota pri 95% hladine spoľahlivosti, Z = 1,96
  • Rozpätie chyby, e = 0,05

Preto možno veľkosť vzorky pre N = 100 000 vypočítať ako,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Preto možno veľkosť vzorky pre N = 120 000 vypočítať ako,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Preto sa dokazuje, že s narastajúcou veľkosťou populácie je veľmi veľká, stáva sa pri výpočte veľkosti vzorky irelevantnou.

Relevantnosť a použitie

Výpočet veľkosti vzorky je dôležitý na pochopenie konceptu vhodnej veľkosti vzorky, pretože sa používa na validitu výsledkov výskumu. V prípade, že je príliš malý, neprinesie platné výsledky, zatiaľ čo príliš veľká vzorka môže znamenať stratu peňazí aj času. Štatisticky sa významná veľkosť vzorky používa predovšetkým na prieskumy trhu, zdravotníctvo a vzdelávanie.

Zaujímavé články...