Čo je normalizačný vzorec?
V štatistike pojem „normalizácia“ označuje zmenšenie súboru údajov tak, aby normalizované údaje spadali do rozsahu od 0 do 1. Takéto normalizačné techniky pomáhajú porovnávať zodpovedajúce normalizované hodnoty z dvoch alebo viacerých rôznych súborov údajov spôsobom, ktorý eliminuje účinky zmien v mierke súborov údajov, tj súbor údajov s veľkými hodnotami sa dá ľahko porovnať s súborom údajov s menšími hodnotami.
Rovnica pre normalizáciu sa odvodí spočiatku odpočítaním minimálnej hodnoty od premennej, ktorá sa má normalizovať. Minimálna hodnota sa odpočíta od maximálnej hodnoty a potom sa predchádzajúci výsledok vydelí druhou.
Matematicky je normalizačná rovnica reprezentovaná ako,
x normalizované = (x - x minimum ) / (x maximum - x minimum )
Vysvetlenie normalizačného vzorca
Rovnicu výpočtu normalizácie možno odvodiť pomocou nasledujúcich jednoduchých štyroch krokov:
Krok 1: Najskôr identifikujte minimálnu a maximálnu hodnotu v súbore údajov a sú označené x minimum a x maximum .
Krok 2: Ďalej vypočítajte rozsah súboru údajov odpočítaním minimálnej hodnoty od maximálnej hodnoty.
Rozsah = x maximum - x minimum
Krok 3: Ďalej určite, o koľko viac je premenná normalizovaná od minimálnej hodnoty, odčítaním minimálnej hodnoty od premennej, tj. X - x minimum .
Krok 4: Nakoniec sa odvodí vzorec na výpočet normalizácie premennej x vydelením výrazu v kroku 3 výrazom v kroku 2, ako je uvedené vyššie.
Príklady normalizačného vzorca (so šablónou programu Excel)
Pozrime sa na niekoľko jednoduchých až pokročilých príkladov normalizačných rovníc, aby sme tomu lepšie porozumeli.
Normalizačný vzorec - príklad č
Určte normalizovanú hodnotu 11,69, tj na stupnici (0,1), ak majú údaje najnižšiu a najvyššiu hodnotu 3,65, respektíve 22,78.
Z uvedeného sme zhromaždili nasledujúce informácie.

Preto je výpočet normalizačnej hodnoty 11,69 nasledovný,

- x (normalizované) = (11,69 - 3,65) / (22,78 - 3,65)
Normalizačná hodnota 11,69 je -

- x (normalizované) = 0,42
Hodnota 11,69 v danom súbore údajov môže byť prevedená na stupnici (0,1) ako 0,42.
Normalizačný vzorec - príklad č. 2
Zoberme si ďalší príklad súboru údajov, ktorý predstavuje testovacie známky dosiahnuté 20 študentmi počas nedávneho vedeckého testu. Prezentujte výsledky testov všetkých študentov v rozmedzí od 0 do 1 pomocou normalizačných techník. Výsledok testu (zo 100) je nasledovný:

Podľa daného skóre testu,
Najvyššiu známku z testu získa študent 11, tj. X maximum = 95 a
Najnižšiu testovú známku zaznamenal študent 6, tj. X minimálne = 37

Výpočet normalizovaného skóre študenta 1 je teda nasledovný,

- Normalizované skóre študenta 1 = (78 - 37) / (95 - 37)
Normalizované skóre študenta 1

- Normalizované skóre študenta 1 = 0,71
Podobne sme vykonali výpočet normalizácie skóre pre všetkých 20 študentov nasledovne,
- Skóre študenta 2 = (65 - 37) / (95 - 37) = 0,48
- Skóre študenta 3 = (56 - 37) / (95 - 37) = 0,33
- Skóre študenta 4 = (87 - 37) / (95 - 37) = 0,86
- Skóre študenta 5 = (91 - 37) / (95 - 37) = 0,93
- Skóre študenta 6 = (37 - 37) / (95 - 37) = 0,00
- Skóre študenta 7 = (49 - 37) / (95 - 37) = 0,21
- Skóre študenta 8 = (77 - 37) / (95 - 37) = 0,69
- Skóre študenta 9 = (62 - 37) / (95 - 37) = 0,43
- Skóre študenta 10 = (59 - 37) / (95 - 37) = 0,38
- Skóre študenta 11 = (95 - 37) / (95 - 37) = 1,00
- Skóre študenta 12 = (63 - 37) / (95 - 37) = 0,45
- Skóre študenta 13 = (42 - 37) / (95 - 37) = 0,09
- Skóre študenta 14 = (55 - 37) / (95 - 37) = 0,31
- Skóre študenta 15 = (72 - 37) / (95 - 37) = 0,60
- Skóre študenta 16 = (68 - 37) / (95 - 37) = 0,53
- Skóre študenta 17 = (81 - 37) / (95 - 37) = 0,76
- Skóre študenta 18 = (39 - 37) / (95 - 37) = 0,03
- Skóre študenta 19 = (45 - 37) / (95 - 37) = 0,14
- Skóre študenta 20 = (49 - 37) / (95 - 37) = 0,21
Teraz nakreslíme graf pre normalizované skóre študentov.

Kalkulačka normalizačných vzorcov
Môžete použiť túto kalkulačku normalizačných vzorcov.
X | |
X minimálne | |
X maximálne | |
X normalizované | |
X normalizované = |
|
|
Relevantnosť a použitie
Koncept normalizácie je veľmi dôležitý, pretože sa často používa v rôznych oblastiach, napríklad v ratingoch, kde sa normalizačná technika používa na prispôsobenie hodnôt nameraných na rôznych škálach do pomeru pojmovo bežnej stupnice (0 až 1). Koncept normalizácie je možné použiť aj na zložitejšie a komplikovanejšie úpravy, ako je uvedenie celého súboru rozdelenia pravdepodobnosti upravených hodnôt do súladu alebo kvantilná normalizácia, v ktorej sú zosúladené kvantily rôznych mier.
Taktiež nachádza uplatnenie vo vzdelávacom hodnotení (ako je uvedené vyššie) na zosúladenie skóre študentov s normálnym rozdelením. Táto technika však nedokáže veľmi dobre zvládať odľahlé hodnoty, čo je jedno z jej primárnych obmedzení.
Túto šablónu Excel pre normalizačný vzorec si môžete stiahnuť tu - Šablóna pre normalizáciu vzorca Excel
Odporúčané články
Toto bol sprievodca normalizačným vzorcom. Tu diskutujeme o tom, ako normalizovať dané hodnoty spolu s príkladmi a šablónou programu Excel na stiahnutie. Viac o štatistickom modelovaní sa môžete dozvedieť z nasledujúcich článkov -
- Vzorec Poissonovej distribúcie
- Vzorec normálneho rozdelenia
- Štandardný vzorec pre normálne rozdelenie
- Čo je európska možnosť?