Vzorec na určenie veľkosti vzorky populácie
Vzorec veľkosti vzorky pomáha pri výpočte alebo určení minimálnej veľkosti vzorky, ktorá je potrebná na poznanie adekvátneho alebo správneho podielu populácie spolu s úrovňou spoľahlivosti a mierou chyby.
Pojem „vzorka“ sa vzťahuje na časť populácie, ktorá nám umožňuje vyvodiť závery o populácii, a preto je dôležité, aby veľkosť vzorky bola dostatočná na to, aby bolo možné vyvodiť zmysluplné závery. Inými slovami, je to minimálna veľkosť, ktorá je potrebná na odhad skutočného podielu populácie s požadovanou mierou chybovosti a spoľahlivosti. Preto je určenie vhodnej veľkosti vzorky jedným z opakujúcich sa problémov v štatistickej analýze. Jeho rovnicu možno odvodiť pomocou veľkosti populácie, kritickej hodnoty normálneho rozdelenia, podielu vzorky a chybovej odchýlky.
Veľkosť vzorky n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 ))
kde,
- N = veľkosť populácie,
- Z = kritická hodnota normálneho rozdelenia na požadovanej úrovni spoľahlivosti,
- p = podiel vzorky,
- e = rozpätie chyby
Ako vypočítať veľkosť vzorky? (Krok za krokom)
- Krok 1: Najskôr určte veľkosť populácie, čo je celkový počet odlišných entít vo vašej populácii a je označená písmenom N. (Poznámka: Ak je veľkosť populácie veľmi veľká, ale presný počet nie je známy, použite 100 000, pretože veľkosť vzorky sa pre populácie väčšie ako táto príliš nemení.)
- Krok 2: Ďalej určite kritickú hodnotu normálneho rozdelenia na požadovanej úrovni spoľahlivosti. Napríklad kritická hodnota pri 95% miere spoľahlivosti je 1,96.
- Krok 3: Ďalej určite podiel vzorky, ktorý sa dá použiť z výsledkov predchádzajúcich prieskumov alebo ktorý sa dá zhromaždiť vykonaním malého pilotného prieskumu. (Poznámka: Ak si nie ste istí, môžete vždy použiť 0,5 ako konzervatívny prístup, čím získate čo najväčšiu veľkosť vzorky.)
- Krok 4: Ďalej určite hranicu chyby, čo je rozsah, v ktorom sa očakáva, že skutočná populácia bude ležať. (Poznámka: Čím je miera chyby menšia, tým viac je presnosť, a teda presná odpoveď.)
- Krok 5: Nakoniec je možné odvodiť rovnicu veľkosti vzorky pomocou veľkosti populácie (krok 1), kritickej hodnoty normálneho rozdelenia na požadovanej úrovni spoľahlivosti (krok 2), podielu vzorky (krok 3) a hranice chyby ( krok 4), ako je uvedené nižšie.

Príklady
Príklad č
Vezmime si príklad maloobchodníka, ktorý má záujem vedieť, koľko ich zákazníkov si od nich kúpilo položku po prezretí ich webovej stránky v určitý deň. Vzhľadom na to, že ich web má v priemere 10 000 zobrazení za deň, určuje veľkosť vzorky zákazníkov, ktorú musia monitorovať, na 95% úrovni spoľahlivosti s 5% mierou chyby, ak:
- Nie sú si istí aktuálnym konverzným pomerom.
- Z predchádzajúcich prieskumov vedia, že konverzný pomer je 5%.
Vzhľadom na to,
- Veľkosť populácie, N = 10 000
- Kritická hodnota pri 95% hladine spoľahlivosti, Z = 1,96
- Marža chyby, e = 5% alebo 0,05
1 - Pretože súčasný konverzný pomer nie je známy, predpokladajme p = 0,5

Preto možno veľkosť vzorky vypočítať pomocou vzorca ako,

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 )))))

Preto bude 370 zákazníkov postačovať na vyvodenie zmysluplných záverov.
2 - Aktuálny konverzný pomer je p = 5% alebo 0,05
Preto je možné veľkosť vzorky vypočítať pomocou vyššie uvedeného vzorca ako,

= (10 000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10 000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 )))))

Preto v tomto prípade bude na vyvodenie zmysluplného vyvodenia postačujúca veľkosť 72 zákazníkov.
Príklad č
Zoberme si vyššie uvedený príklad a v tomto prípade predpokladajme, že veľkosť populácie, tj. Denné prezeranie webových stránok, je medzi 100 000 a 120 000, ale potom nie je známa presná hodnota. Zvyšok hodnôt je rovnaký spolu s konverzným pomerom 5%. Vypočítajte veľkosť vzorky pre 100 000 aj 120 000.
Vzhľadom na to,
- Podiel vzorky, p = 0,05
- Kritická hodnota pri 95% hladine spoľahlivosti, Z = 1,96
- Rozpätie chyby, e = 0,05

Preto možno veľkosť vzorky pre N = 100 000 vypočítať ako,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Preto možno veľkosť vzorky pre N = 120 000 vypočítať ako,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Preto sa dokazuje, že s narastajúcou veľkosťou populácie je veľmi veľká, stáva sa pri výpočte veľkosti vzorky irelevantnou.
Relevantnosť a použitie
Výpočet veľkosti vzorky je dôležitý na pochopenie konceptu vhodnej veľkosti vzorky, pretože sa používa na validitu výsledkov výskumu. V prípade, že je príliš malý, neprinesie platné výsledky, zatiaľ čo príliš veľká vzorka môže znamenať stratu peňazí aj času. Štatisticky sa významná veľkosť vzorky používa predovšetkým na prieskumy trhu, zdravotníctvo a vzdelávanie.