Empirické pravidlo - definícia, vzorec, spôsob použitia v štatistike?

Čo je to empirické pravidlo v štatistike?

Empirické pravidlo v štatistike uvádza, že takmer všetky (95%) pozorovaní pri normálnom rozdelení ležia v rozmedzí 3 štandardných odchýlok od priemeru. Toto je veľmi dôležité pravidlo a pomáha pri predpovedaní.

Vzorec

Vzorec zobrazuje predpokladané percento pozorovaní, ktoré budú ležať v rámci každej štandardnej odchýlky od priemeru.

Pravidlo hovorí, že:

  • 68% pozorovaní bude ležať v rozmedzí +/- 1 štandardnej odchýlky od priemeru
  • 95% pozorovaní bude ležať v rozmedzí +/- 2 štandardných odchýlok od priemeru
  • 7% pozorovaní bude ležať v rozmedzí +/- 3 štandardných odchýlok od priemeru

Ako použiť?

Používa sa to v predpovednom trende súboru údajov. Ak je súbor údajov rozsiahly a je náročné študovať celú populáciu, môže sa na vzorku použiť empirické pravidlo, aby ste získali odhad, ako budú údaje v populácii reagovať, ak sa od vás vyžaduje, aby ste zistili priemerný plat všetkých účtovníci v USA. Potom je to náročná úloha, pretože počet obyvateľov je obrovský. V takom prípade teda môžete zvoliť povedzme 90 pozorovaní náhodne z celej populácie.

Takže teraz budete mať 90 platov. Musíte nájsť strednú a štandardnú odchýlku pozorovaní. Ak sledovanie nasleduje po normálnom rozdelení, je možné ho uplatniť a urobiť odhad platov všetkých účtovníkov v USA.

Povedzme, že priemerný plat vzorky vyjde na 90 000 dolárov. A štandardná odchýlka je 5 000 dolárov. Takže z celej populácie 68% účtovníkov čerpá plat v rozmedzí +/- 1 Štandardné odchýlky od priemeru. Pretože stredná hodnota je 90 000 dolárov a štandardná odchýlka je 5 000 dolárov. Takže 68% všetkých účtovníkov v USA je platených v rozmedzí od 90 000 dolárov +/- (1 x 5 000 dolárov). To je v rozmedzí 85 000 až 95 000 dolárov

Ak sa rozložíme o niečo viac, potom sa 95% všetkých účtovníkov v USA vypláca v rozmedzí stredných +/- 2 štandardných odchýlok. 90 000 dolárov +/- (2 * 5 000). Rozsah je teda od 80 000 do 100 000 dolárov.

V širšom rozmedzí 99,7% všetkých účtovníkov čerpá platy v rozmedzí od priemeru +/- 3 štandardné odchýlky. To je 90 000 +/- (3 * 5 000). Rozsah je od 75 000 do 105 000 dolárov

Jasne vidíte, že bez skúmania celej populácie by sa dali urobiť odhady týkajúce sa populácie. Ak niekto plánuje pracovať ako účtovník v USA, potom môže ľahko očakávať, že jeho plat sa bude pohybovať od 75 000 do 105 000 dolárov

Tento druh odhadu pomáha uľahčiť prácu a vytvárať prognózy týkajúce sa budúcnosti.

Príklady empirických pravidiel

Pán X sa snaží zistiť priemerný počet rokov, ktoré človek prežije po odchode do dôchodku, pričom dôchodkový vek považuje za 60. Ak je priemerný rok prežitia 50 náhodných pozorovaní 20 rokov a SD je 3, potom zistite pravdepodobnosť, že poberá dôchodok viac ako 23 rokov

Riešenie

Empirické pravidlo uvádza, že 68% pozorovaní bude ležať v rámci 1 štandardnej odchýlky od priemeru. Tu je priemer pozorovaní 20.

68% pozorovaní bude ležať v rozmedzí 20 +/- 1 (štandardná odchýlka), čo je 20 +/- 3. Rozsah je teda 17 až 23.

Existuje 68% šanca, že minimum rokov, ktoré človek prežije po odchode do dôchodku, je medzi 17 až 23. Teraz je percento, ktoré leží mimo tohto rozsahu, (100 - 68) = 32%. 32 je rozdelených rovnomerne na obe strany, čo znamená 16% pravdepodobnosť, že minimálne roky budú pod 17 a 16% pravdepodobnosť, že minimálne roky budú väčšie ako 23.

Takže pravdepodobnosť, že osoba bude čerpať viac ako 23 rokov dôchodku, je 16%.

Empirické pravidlo vs. Čebyševova veta

Empirické pravidlo sa uplatňuje na množiny údajov, ktoré sledujú normálne rozdelenie, čo znamená zvonček. Pri normálnom rozdelení majú obe strany distribúcie pravdepodobnosť 50%.

Ak množina údajov nie je normálne distribuovaná, potom existuje ďalšia aproximácia alebo pravidlo, ktoré sa vzťahuje na všetky typy množín údajov, čo je Čebyševova veta. Hovorí to tri veci:

  • Aspoň 3/4 th všetkých pozorovaní bude ležať vnútri 2Standard odchýlky od priemeru. Je to silná aproximácia. To znamená, že ak existuje 100 pozorovanie, potom 3/4 th z pozorovania, ktoré sú 75 pozorovaní bude ležať v rozmedzí +/- 2 štandardnej odchýlky od priemeru.
  • Aspoň 8/9 th všetkých pozorovaní bude ležať vnútri 3Standard odchýlky od priemeru.
  • Najmenej 1 - 1 / k 2 všetkých pozorovaní leží v rámci K štandardných odchýlok od priemeru. Tu sa K označuje ako akékoľvek celé číslo.

Kedy použiť?

Dáta sú v modernom svete ako zlato. Z rôznych zdrojov prúdia obrovské údaje a používajú sa na rôzne aproximácie alebo predpovede. Ak súbor údajov sleduje normálne rozdelenie, zobrazí sa krivka v tvare zvonu; potom sa dá použiť empirické pravidlo. Aplikuje sa na pozorovania, aby sa vytvorila aproximácia pre populáciu.

Akonáhle je vidieť, že pozorovania ukazujú štruktúru normálneho rozdelenia, nasleduje empirické pravidlo, aby sa zistilo niekoľko pravdepodobností pozorovaní. Pravidlo je mimoriadne užitočné pre mnoho štatistických predpovedí.

Záver

Empirické pravidlo je štatistický koncept, ktorý pomáha vykresliť pravdepodobnosť pozorovaní a je veľmi užitočný pri hľadaní aproximácie obrovskej populácie. Vždy je potrebné poznamenať, že ide o aproximácie. Vždy existuje šanca na mimoriadne hodnoty, ktoré v distribúcii neklesnú. Zistenia teda nie sú presné a mali by sa prijať preventívne opatrenia, ak sa bude postupovať podľa prognózy.

Zaujímavé články...