R na druhú (R ^ 2) - definícia, vzorec, výpočet R na druhú

Čo je R štvorcový (R2) v regresii?

R-kvadrát (R 2 ) je dôležité štatistické opatrenie, ktorým je regresný model, ktorý predstavuje podiel rozdielu alebo odchýlky v štatistickom vyjadrení pre závislú premennú, čo možno vysvetliť nezávislou premennou alebo premennými. Stručne povedané, určuje, ako dobre sa dáta zmestia do regresného modelu.

R štvorcový vzorec

Pre výpočet R na druhú musíte určiť korelačný koeficient a potom musíte výsledok štvrtiť.

R štvorcový vzorec = r 2

Kde r možno korelačný koeficient vypočítať takto:

r = n (∑xy) - ∑x ∑y / √ (n * ( 2x 2 - (∑x) 2 )) * (n * (2y 2 - (∑y) 2 ))

Kde,

  • r = Korelačný koeficient
  • n = číslo v danom súbore údajov
  • x = prvá premenná v kontexte
  • y = druhá premenná

Vysvetlenie

Ak existuje nejaký vzťah alebo korelácia, ktorá môže byť lineárna alebo nelineárna medzi týmito dvoma premennými, potom to znamená, že ak dôjde k zmene nezávislej premennej v hodnote, potom sa druhá závislá premenná pravdepodobne zmení v hodnote, povedzme lineárne alebo nelineárne.

V čitateľovej časti vzorca sa vykoná test, či sa pohybujú spoločne, a odstráni sa ich individuálny pohyb a relatívna sila pri vzájomnom pohybe. Menovateľská časť vzorca zmenší čitateľa tak, že odmocninu súčinu rozdielov premenné z ich štvorcových premenných. A keď tento výsledok umocníte na druhú, dostaneme R na druhú, čo nie je nič iné ako koeficient determinácie.

Príklady

Príklad č

Zvážte nasledujúce dve premenné xay, od ktorých sa vyžaduje, aby ste vypočítali hodnotu R na druhú v regresii.

Riešenie:

Pomocou vyššie uvedeného vzorca musíme najskôr vypočítať korelačný koeficient.

Všetky hodnoty v tabuľke vyššie máme n = 4.

Poďme teraz zadať hodnoty do vzorca, aby sme sa dostali k číslu.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17 501,06 / 17 512,88

Korelačný koeficient bude

r = 0,99932480

Výpočet bude teda nasledovný,

r 2 = (0,99932480) 2

R štvorcový vzorec v regresii

r 2 = 0,998650052

Príklad č

India, rozvojová krajina, chce uskutočniť nezávislú analýzu toho, či zmeny cien ropy ovplyvnili jej rupiu. Nasleduje história ceny ropy Brent a ocenenia rupií oproti dolárom, ktoré prevládali v priemere za tie roky nižšie.

RBI, centrálna banka v Indii, vás oslovila, aby ste o nej na nasledujúcom stretnutí predniesli prezentáciu. Zistite, či pohyby ropy ovplyvňujú pohyby rupií za dolár?

Riešenie:

Pomocou vyššie uvedeného vzorca pre koreláciu môžeme najskôr vypočítať korelačný koeficient. Zaobchádzanie s priemernou cenou ropy ako s jednou premennou, napríklad x, a s rupiou za dolár ako s ďalšou premennou ako y.

Všetky hodnoty v tabuľke vyššie máme n = 6.

Poďme teraz zadať hodnoty do vzorca, aby sme sa dostali k číslu.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1 715,95

Korelačný koeficient bude

r = -0,3614

Výpočet bude teda nasledovný,

r 2 = (-0,3614) 2

R štvorcový vzorec v regresii

r 2 = 0,1306

Analýza: Ukazuje sa, že existuje malý vzťah medzi zmenami v cenách ropy a zmenami v cene indickej rupie. Keď sa cena ropy zvýši, ovplyvnia to aj zmeny v indickej rupii. Ale keďže hodnota R na druhú je iba 13%, potom zmeny v cene ropy vysvetľujú oveľa menej zmeny v indickej rupii a indická rupia podlieha zmenám aj v iných premenných, ktoré je potrebné zohľadniť.

Príklad č

Laboratórium XYZ vedie výskum výšky a hmotnosti a zaujíma ho, či existuje nejaký vzťah medzi týmito premennými. Potom, čo zhromaždil vzorku 5 000 ľudí pre každú kategóriu, prišiel s priemernou hmotnosťou a priemernou výškou v tejto konkrétnej skupine.

Ďalej sú uvedené podrobnosti, ktoré zhromaždili.

Musíte vypočítať R na druhú a dospieť k záveru, či tento model vysvetľuje, že výškové rozdiely ovplyvňujú odchýlky hmotnosti.

Riešenie:

Pomocou vyššie uvedeného vzorca pre koreláciu môžeme najskôr vypočítať korelačný koeficient. Zaobchádzanie s výškou ako s jednou premennou, napríklad s x, a s hmotnosťou ako s ďalšou premennou ako s y.

Všetky hodnoty v tabuľke vyššie máme n = 6.

Poďme teraz zadať hodnoty do vzorca, aby sme sa dostali k číslu.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6 581,05 / 7 075,77

Korelačný koeficient bude

Korelačný koeficient (r) = 0,9301

Výpočet bude teda nasledovný,

r 2 = 0,8651

Analýza: Korelácia je pozitívna a zdá sa, že existuje určitý vzťah medzi výškou a hmotnosťou. Keď sa výška zvyšuje, zdá sa, že sa zvyšuje aj hmotnosť človeka. Zatiaľ čo R2 naznačuje, že 86% zmien atribútov výšky k zmenám v hmotnosti a 14% je nevysvetlených.

Relevantnosť a použitie

Relevancia R na druhú v regresii je jej schopnosť nájsť pravdepodobnosť budúcich udalostí, ktoré sa vyskytnú v rámci daných predpovedaných výsledkov alebo výsledkov. Ak sa do modelu pridá viac vzoriek, potom by koeficient ukazoval pravdepodobnosť alebo pravdepodobnosť nového bodu alebo nového súboru údajov, ktorý spadne na čiaru. Aj keď majú obe premenné silné spojenie, určenie nepreukazuje príčinnú súvislosť.

Niektoré z priestorov, kde sa R ​​na druhú väčšinou používa, sú na sledovanie výkonnosti podielových fondov, na sledovanie rizika v hedžových fondoch, na stanovenie toho, ako dobre sa akcie pohybujú na trhu, kde R2 by naznačovalo, koľko pohybov na akcii je možné vysvetliť pohybmi na trhu.

Zaujímavé články...