Definícia hypergeometrickej distribúcie
V štatistikách a teórii pravdepodobnosti je hypergeometrické rozdelenie v zásade zreteľným rozdelením pravdepodobnosti, ktoré definuje pravdepodobnosť úspechov k (tj. Niekoľko náhodných ťahov pre nakreslený objekt, ktorý má určitú špecifikovanú vlastnosť) v žiadnom z ťahov bez akejkoľvek náhrady z daného veľkosť populácie N, ktorá obsahuje presne K objektov majúcich túto vlastnosť, kde môže byť žreb úspešný alebo zlyhať.
Vzorec pre pravdepodobnosť hypergeometrickej distribúcie sa odvodzuje pomocou počtu položiek v populácii, počtu položiek vo vzorke, počtu úspechov v populácii, počtu úspechov vo vzorke a niekoľkých kombinácií. Matematicky je pravdepodobnosť vyjadrená ako,
P = K C k * (N - K) C (n - k) / N C n
kde,
- N = počet položiek v populácii
- n = počet položiek vo vzorke
- K = počet úspechov v populácii
- k = počet úspechov vo vzorke
Priemerná a štandardná odchýlka hypergeometrického rozdelenia je vyjadrená ako,
Priemer = n * K / N štandardná odchýlka = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2Vysvetlenie
Krok 1: Najskôr určte celkový počet položiek v populácii, ktorý označuje N. Napríklad počet hracích kariet v balíčku je 52.
Krok 2: Ďalej určite počet položiek vo vzorke, označený n - napríklad počet kariet vytiahnutých z balíčka.
Krok 3: Ďalej určite inštancie, ktoré sa budú považovať za úspechy v populácii, a označuje ich K. Napríklad počet sŕdc v celkovom balíku, ktorý je 13.
Krok 4: Ďalej určite inštancie, ktoré sa budú považovať za úspechy v odobratej vzorke a sú označené k. Napr. Počet sŕdc na kartách vytiahnutých z balíčka.
Krok 5: Nakoniec je vzorec pre pravdepodobnosť hypergeometrickej distribúcie odvodený pomocou počtu položiek v populácii (krok 1), počtu položiek vo vzorke (krok 2), počtu úspechov v populácii (krok 3) a počet úspechov vo vzorke (krok 4), ako je uvedené nižšie.
P = K C k * (N - K) C (n - k) / N C nPríklady hypergeometrickej distribúcie (so šablónou programu Excel)
Príklad č
Zoberme si príklad bežného balíka hracích kariet, kde je náhodne vylosovaných 6 kariet bez výmeny. Určite pravdepodobnosť nakreslenia presne 4 červených kariet balíkov, tj diamantov alebo sŕdc.
- Dané, N = 52 (keďže v bežnom hracom balíčku je 52 kariet)
- n = 6 (počet kariet náhodne vytiahnutých z balíčka)
- K = 26 (keďže v súprave diamantov a sŕdc je každá 13 červených kariet)
- k = 4 (počet červených kariet, ktoré sa majú považovať za úspešné vo odobratej vzorke)
Riešenie:
Pravdepodobnosť vytiahnutia presne 4 červených kariet suít na vylosovaných 6 kariet je možné vypočítať pomocou vyššie uvedeného vzorca ako,

Pravdepodobnosť = K C k * (N - K) C (n - k) / N C n
= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6
= 26 C, 4 * 26 C 2 / 52 C 6
= 14950 * 325/20358520
Pravdepodobnosť bude -

Pravdepodobnosť = 0,2387 ~ 23,87%
Preto existuje 23,87% pravdepodobnosť vytiahnutia presne 4 červených kariet pri vytiahnutí 6 náhodných kariet z obyčajného balíčka.
Príklad č
Zoberme si ďalší príklad peňaženky, ktorá obsahuje 5 bankoviek 100 $ a 7 $ 1 bankovky. Ak sú náhodne vybrané 4 účty, potom určte pravdepodobnosť výberu presne 3 účty 100 $.
- Vzhľadom na to, N = 12 (počet 100 dolárových bankoviek + počet 1 dolárových bankoviek)
- n = 4 (počet náhodne vybraných účtov)
- K = 5 (pretože existuje 5 100 dolárových bankoviek)
- k = 3 (počet 100 dolárových bankoviek, ktoré sa majú považovať za úspech vo vybranej vzorke)
Riešenie:
Pravdepodobnosť výberu presne 3 dolárových bankoviek 100 v náhodne zvolených 4 bankovkách preto možno vypočítať pomocou vyššie uvedeného vzorca ako,

Pravdepodobnosť = K C k * (N - K) C (n - k) / N C n
= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4
= 5 C 3 * 7 C 1 / 12 C 4
= 10 * 7/495
Pravdepodobnosť bude -

Pravdepodobnosť = 0,1414 ~ 14,14%
Preto existuje 14,14% pravdepodobnosť, že si vyberiete presne 3 účty v hodnote 100 dolárov, pričom budete čerpať 4 náhodné účty.
Relevantnosť a použitie
Koncept hypergeometrickej distribúcie je dôležitý, pretože poskytuje presný spôsob určovania pravdepodobností, keď počet pokusov nie je príliš vysoký a že vzorky sa odoberajú z konečnej populácie bez výmeny. Hypergeometrická distribúcia je v skutočnosti analogická k binomickej distribúcii, ktorá sa používa, keď je počet pokusov podstatne vysoký. Na odber vzoriek bez náhrady sa však používa predovšetkým hypergeometrická distribúcia.