Regresia najmenších štvorcov - Ako vytvoriť líniu Best Fit?

Definícia metódy najmenších štvorcov

Regresná metóda najmenších štvorcov je forma regresnej analýzy, ktorá stanovuje vzťah medzi závislou a nezávislou premennou spolu s lineárnou čiarou. Tento riadok sa označuje ako „najlepšie vyhovujúci riadok“.

Regresná analýza je štatistická metóda, pomocou ktorej je možné odhadnúť alebo predpovedať neznáme hodnoty jednej premennej zo známych hodnôt inej premennej. Premenná, ktorá sa používa na predikciu záujmu premennej, sa nazýva nezávislá alebo vysvetľujúca premenná a premenná, ktorá sa predpovedá, sa nazýva závislá alebo vysvetlená premenná.

Uvažujme o dvoch premenných, x & y. Tie sú vynesené do grafu s hodnotami x na hodnotách osi x y na osi y. Tieto hodnoty sú v dolnom grafe zobrazené bodkami. Cez bodky je nakreslená rovná čiara - označuje sa ako čiara najlepšieho prispôsobenia.

Cieľom regresie najmenších štvorcov je zabezpečiť, aby čiara vedená cez množinu poskytnutých hodnôt vytvorila najužší vzťah medzi hodnotami.

Regresia najmenších štvorcov

Regresná priamka v rámci metódy najmenších štvorcov sa počíta z nasledujúceho vzorca -

ŷ = a + bx

Kde,

  • ŷ = závislá premenná
  • x = nezávislá premenná
  • a = y-prechod
  • b = sklon priamky

Sklon priamky b sa počíta pomocou nasledujúceho vzorca -

Alebo

Odsek Y, 'a' sa počíta pomocou nasledujúceho vzorca -

Line of Best Fit in the Least Square Regression

Najlepšie vyhovujúca čiara je priamka vedená bodovým rozptylom údajových bodov, ktorý najlepšie predstavuje vzťah medzi nimi.

Uvažujme o nasledujúcom grafe, kde je množina údajov vykreslená pozdĺž osi xay. Tieto údajové body sú znázornené pomocou modrých bodiek. Cez tieto body sú nakreslené tri čiary - zelená, červená a modrá čiara. Zelená čiara prechádza cez jeden bod a červená čiara cez tri údajové body. Modrá čiara však prechádza štyrmi údajovými bodmi a vzdialenosť medzi zvyškovými bodmi a modrou čiarou je v porovnaní s ostatnými dvoma čiarami minimálna.

Vo vyššie uvedenom grafe predstavuje modrá čiara čiaru najlepšej zhody, pretože leží najbližšie ku všetkým hodnotám a vzdialenosť medzi bodmi mimo čiary k čiare je minimálna (tj. Vzdialenosť medzi zvyškami a čiarou najlepšieho zhody - označuje sa aj ako súčet druhých mocnín zvyškov). V ďalších dvoch riadkoch, oranžovej a zelenej, je vzdialenosť medzi zvyškami k riadkom väčšia v porovnaní s modrou čiarou.

Metóda najmenších štvorcov poskytuje najužší vzťah medzi závislými a nezávislými premennými minimalizáciou vzdialenosti medzi zvyškami a čiarou najlepšej zhody, tj súčet štvorcov zvyškov je pri tomto prístupe minimálny. Preto pochádza výraz „najmenšie štvorce“.

Príklady regresnej priamky najmenších štvorcov

Použime tieto vzorce v nasledujúcej otázke -

Príklad č

Podrobnosti o skúsenostiach technikov v spoločnosti (za niekoľko rokov) a ich hodnotení výkonnosti sú uvedené v nasledujúcej tabuľke. Pomocou týchto hodnôt odhadnite hodnotenie výkonu pre technika s 20-ročnými skúsenosťami.

Skúsenosti technika (v rokoch) Výkonnostné hodnotenie
16 87
12 88
18 89
4 68
3 78
10 80
5 75
12 83

Riešenie -

Aby sme najskôr vypočítali najmenšie štvorce, vypočítame priesečník Y (a) a sklon priamky (b) takto -

Sklon priamky (b)

  • b = 6727 - ((80 * 648) / 8) / 1018 - ((80) 2 /8)
  • = 247/218
  • = 1,13

Y-úsek (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Regresná priamka sa počíta takto -

Nahradením hodnoty 20 vo vzorci hodnotou 20,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Hodnotenie výkonu pre technika s 20-ročnou praxou sa odhaduje na 92,3.

Príklad č

Regresná rovnica najmenších štvorcov pomocou programu Excel

Regresnú rovnicu najmenších štvorcov je možné vypočítať pomocou programu Excel pomocou nasledujúcich krokov -

  • Vložte tabuľku s údajmi do programu Excel.
  • Vložte bodový graf pomocou údajových bodov.
  • Vložte trendovú čiaru do bodového grafu.
  • V časti Možnosti trendovej čiary - vyberte lineárnu trendovú čiaru a vyberte zobrazenie rovnice v grafe.
  • Regresná rovnica najmenších štvorcov pre danú množinu údajov programu Excel je zobrazená v grafe.

Vypočíta sa teda regresná rovnica najmenších štvorcov pre danú množinu údajov programu Excel. Pomocou rovnice je možné robiť predpovede a analýzy trendov. Nástroje programu Excel tiež poskytujú podrobné regresné výpočty.

Výhody

  • Metóda najmenších štvorcov regresnej analýzy je najvhodnejšia pre predikčné modely a analýzu trendov. Najlepšie sa používa v oblastiach ekonomiky, financií a akciových trhov, kde sa hodnota akejkoľvek budúcej premennej predpovedá pomocou existujúcich premenných a vzťahu medzi nimi.
  • Metóda najmenších štvorcov poskytuje najužší vzťah medzi premennými. Rozdiel medzi súčtom druhých mocnín zvyškov po čiaru najlepšieho prispôsobenia je pri tejto metóde minimálny.
  • Výpočtový mechanizmus je jednoduchý a ľahko použiteľný.

Nevýhody

  • Metóda najmenších štvorcov sa spolieha na stanovenie najbližšieho vzťahu medzi danou množinou premenných. Mechanizmus výpočtu je citlivý na údaje a v prípade akýchkoľvek odľahlých hodnôt (výnimočných údajov) môžu mať výsledky zásadný vplyv.
  • Tento typ výpočtu je najvhodnejší pre lineárne modely. Pre nelineárne rovnice sa používajú dôkladnejšie výpočtové mechanizmy.

Záver

Metóda najmenších štvorcov je jednou z najpopulárnejších metód predikčných modelov a analýzy trendov. Pri správnom výpočte poskytuje najlepšie výsledky.

Zaujímavé články...