Hypergeometrická distribúcia (definícia, vzorec) Ako vypočítať?

Definícia hypergeometrickej distribúcie

V štatistikách a teórii pravdepodobnosti je hypergeometrické rozdelenie v zásade zreteľným rozdelením pravdepodobnosti, ktoré definuje pravdepodobnosť úspechov k (tj. Niekoľko náhodných ťahov pre nakreslený objekt, ktorý má určitú špecifikovanú vlastnosť) v žiadnom z ťahov bez akejkoľvek náhrady z daného veľkosť populácie N, ktorá obsahuje presne K objektov majúcich túto vlastnosť, kde môže byť žreb úspešný alebo zlyhať.

Vzorec pre pravdepodobnosť hypergeometrickej distribúcie sa odvodzuje pomocou počtu položiek v populácii, počtu položiek vo vzorke, počtu úspechov v populácii, počtu úspechov vo vzorke a niekoľkých kombinácií. Matematicky je pravdepodobnosť vyjadrená ako,

P = K C k * (N - K) C (n - k) / N C n

kde,

  • N = počet položiek v populácii
  • n = počet položiek vo vzorke
  • K = počet úspechov v populácii
  • k = počet úspechov vo vzorke

Priemerná a štandardná odchýlka hypergeometrického rozdelenia je vyjadrená ako,

Priemer = n * K / N štandardná odchýlka = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Vysvetlenie

Krok 1: Najskôr určte celkový počet položiek v populácii, ktorý označuje N. Napríklad počet hracích kariet v balíčku je 52.

Krok 2: Ďalej určite počet položiek vo vzorke, označený n - napríklad počet kariet vytiahnutých z balíčka.

Krok 3: Ďalej určite inštancie, ktoré sa budú považovať za úspechy v populácii, a označuje ich K. Napríklad počet sŕdc v celkovom balíku, ktorý je 13.

Krok 4: Ďalej určite inštancie, ktoré sa budú považovať za úspechy v odobratej vzorke a sú označené k. Napr. Počet sŕdc na kartách vytiahnutých z balíčka.

Krok 5: Nakoniec je vzorec pre pravdepodobnosť hypergeometrickej distribúcie odvodený pomocou počtu položiek v populácii (krok 1), počtu položiek vo vzorke (krok 2), počtu úspechov v populácii (krok 3) a počet úspechov vo vzorke (krok 4), ako je uvedené nižšie.

P = K C k * (N - K) C (n - k) / N C n

Príklady hypergeometrickej distribúcie (so šablónou programu Excel)

Príklad č

Zoberme si príklad bežného balíka hracích kariet, kde je náhodne vylosovaných 6 kariet bez výmeny. Určite pravdepodobnosť nakreslenia presne 4 červených kariet balíkov, tj diamantov alebo sŕdc.

  • Dané, N = 52 (keďže v bežnom hracom balíčku je 52 kariet)
  • n = 6 (počet kariet náhodne vytiahnutých z balíčka)
  • K = 26 (keďže v súprave diamantov a sŕdc je každá 13 červených kariet)
  • k = 4 (počet červených kariet, ktoré sa majú považovať za úspešné vo odobratej vzorke)

Riešenie:

Pravdepodobnosť vytiahnutia presne 4 červených kariet suít na vylosovaných 6 kariet je možné vypočítať pomocou vyššie uvedeného vzorca ako,

Pravdepodobnosť = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C, 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

Pravdepodobnosť bude -

Pravdepodobnosť = 0,2387 ~ 23,87%

Preto existuje 23,87% pravdepodobnosť vytiahnutia presne 4 červených kariet pri vytiahnutí 6 náhodných kariet z obyčajného balíčka.

Príklad č

Zoberme si ďalší príklad peňaženky, ktorá obsahuje 5 bankoviek 100 $ a 7 $ 1 bankovky. Ak sú náhodne vybrané 4 účty, potom určte pravdepodobnosť výberu presne 3 účty 100 $.

  • Vzhľadom na to, N = 12 (počet 100 dolárových bankoviek + počet 1 dolárových bankoviek)
  • n = 4 (počet náhodne vybraných účtov)
  • K = 5 (pretože existuje 5 100 dolárových bankoviek)
  • k = 3 (počet 100 dolárových bankoviek, ktoré sa majú považovať za úspech vo vybranej vzorke)

Riešenie:

Pravdepodobnosť výberu presne 3 dolárových bankoviek 100 v náhodne zvolených 4 bankovkách preto možno vypočítať pomocou vyššie uvedeného vzorca ako,

Pravdepodobnosť = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

Pravdepodobnosť bude -

Pravdepodobnosť = 0,1414 ~ 14,14%

Preto existuje 14,14% pravdepodobnosť, že si vyberiete presne 3 účty v hodnote 100 dolárov, pričom budete čerpať 4 náhodné účty.

Relevantnosť a použitie

Koncept hypergeometrickej distribúcie je dôležitý, pretože poskytuje presný spôsob určovania pravdepodobností, keď počet pokusov nie je príliš vysoký a že vzorky sa odoberajú z konečnej populácie bez výmeny. Hypergeometrická distribúcia je v skutočnosti analogická k binomickej distribúcii, ktorá sa používa, keď je počet pokusov podstatne vysoký. Na odber vzoriek bez náhrady sa však používa predovšetkým hypergeometrická distribúcia.

Zaujímavé články...