Regresia (význam, typy) Čo je to regresná analýza?

Čo je regresia?

Regresná analýza je štatistické meranie používané vo finančníctve, investovaní atď., Ktorého cieľom je vytvoriť vzťah medzi závislou premennou a inými radmi nezávislých premenných a hlavným zameraním je určenie sily vyššie uvedeného vzťahu.

Vysvetlenia

  • Aby sme laicky vysvetlili regresnú analýzu, predpokladajme, že vedúci predaja spoločnosti sa veľmi snaží predpovedať tržby nasledujúceho mesiaca. Zahŕňa veľa faktorov, ktoré riadia predaj produktu, počnúc počasím až po novú stratégiu konkurenta, festival a zmenu životného štýlu spotrebiteľov.
  • Toto je metóda vyrovnania sa z niekoľkých faktorov, ktoré ovplyvňujú predaj, ktoré majú najväčší vplyv. Môže pomôcť pri zodpovedaní mnohých otázok, ako napríklad čo sú najdôležitejšie faktory, ktoré faktory sú menej dôležité, aký je vzťah medzi týmito faktormi a čo je najdôležitejšie, aká je záruka týchto faktorov.
  • Tieto faktory sa nazývajú premenné. Hlavný faktor, ktorý sa snažíme predpovedať, sa nazýva závislá premenná a ďalšie faktory, ktoré majú vplyv na závislú premennú, sa nazývajú nezávislé premenné.

Vzorec

Jednoduchú lineárnu regresnú analýzu v programe Excel môžeme vyjadriť ako nasledujúci vzorec a meria sa vzťah medzi závislou premennou a jednou nezávislou premennou.

Y = a + bX + ϵ

Tu:

  • Y - závislá premenná
  • X - nezávislá (vysvetľujúca) premenná
  • a - Zachytiť
  • b - sklon
  • ϵ - Zvyšok (chyba)

Ako interpretovať regresnú analýzu?

To sa dá interpretovať predpokladom jednoduchého scenára. Berieme tu vzťah medzi cenami starožitných zbierok na aukciu a dobou ich starnutia. Čím viac starožitnosť starne, tým viac stúpa cena. Za predpokladu, že sme nastavili údaje za posledných 50 predmetov, ktoré boli dražené, môžeme predpovedať, aké budú budúce ceny v aukcii, na základe veku predmetu. Pomocou týchto údajov môžeme zostaviť regresnú rovnicu.

Regresný vzorec, ktorý umožňuje nastaviť vzťah medzi vekom a cenou, je nasledovný:

y = chyba β0 + β1 x +
  • Tu je závislým faktorom Y. Y predstavuje cenu každej položky, ktorá sa má dražiť, zatiaľ čo nezávislým faktorom je X, ktorý určuje vek.
  • Parametre β0 a β1 sú parametre, ktoré nie sú známe a budú odhadnuté rovnicou.
  • β0 je konštanta, ktorá sa používa na definovanie lineárnej trendovej čiary, ktorá zachytáva os Y.
  • β1 je konštanta, ktorá demonštruje veľkosť zmeny hodnoty závislej premennej ako súvisiacu funkciu zmeny implikovanej pre nezávislé premenné.
  • Toto sa v zásade nazýva sklon rovnice. Ak je svah líniový, znamená to, že existuje pomerný vzťah medzi vekom a cenou, a ak je svah inverzný, znamená to, že vzťah je nepriamo úmerný.
  • Chyba môže byť definovaná ako hluk alebo zmenu v cieľovej premennej a je náhodné.

Príklady regresnej analýzy z reálneho života

Predpokladajme, že musíme vytvoriť vzťah medzi uskutočneným predajom a sumou vynaloženou na reklamu súvisiacu s produktom.

Všeobecne môžeme pozorovať pozitívny vzťah medzi množstvom predaja a sumou vynaloženou na reklamu. Spojením jednoduchej lineárnej regresnej rovnice máme:

Y = a + bX

Predpokladajme, že dostaneme hodnotu ako

Y = 500 + 30X

Interpretácia výsledkov:

Predpovedaný sklon 30 nám pomáha vyvodiť záver, že priemerný predaj sa zvyšuje o 30 dolárov ročne, keď sa zvyšujú výdavky na reklamu.

Typy regresnej analýzy

# 1 - lineárne

Toto je možné vyjadriť ako vzorec uvedený nižšie a meria sa ním vzťah medzi závislou premennou a jednou nezávislou premennou.

# 2 - Polynóm

V tejto metóde sa analýza používa na meranie vzťahu medzi jednotlivými závislými faktormi a viacerými nezávislými premennými.

# 3 - Logistické

Tu má závislý faktor alebo premenná binárnu povahu. Nezávislé premenné môžu byť spojité alebo binárne. Pri multinomiálnej logistickej regresii si môžeme dovoliť mať pri výbere našej nezávislej premennej viac ako dve kategórie.

# 4 - kvantitatívne

Toto je aditívny koncept lineárnej regresie a primárne sa používa, keď sú v dátach odľahlé hodnoty a krivica.

# 5 - Elastická sieť

To je užitočné, keď človek pracuje s veľmi vysoko korelovanými nezávislými premennými.

# 6 - Regresia hlavných komponentov (PCR)

Toto je technika, ktorá je použiteľná v prípade, že v dátach je príliš veľa nezávislých premenných alebo je tu viackolinearita

# 7 - Čiastočné najmenšie štvorce (PLS)

Je to opačná metóda hlavnej zložky, kde máme nezávislé korelácie vysoko korelované. Je použiteľné aj vtedy, keď existuje veľa nezávislých premenných.

# 8 - Vektor podpory

To môže poskytnúť riešenie lineárnych a nelineárnych modelov. Využíva nelineárne funkcie jadra na nájdenie optimálneho riešenia pre nelineárne modely.

# 9 - Poradové

Je použiteľné na predpovedanie zoradených hodnôt. V zásade je vhodné, keď má závislá premenná ordinálny charakter

# 10 - Poisson

Toto platí, keď závislá premenná má údaje o počte.

# 11 - Negatívny dvojčlen

Je tiež použiteľné spravovať iba údaje o počte, že negatívna binomická regresia nepredpokladá rozdelenie počtu, ktorý má rozptyl rovný jeho priemeru, zatiaľ čo Poissonova regresia predpokladá rozptyl rovný jeho priemeru.

# 12 - Quasi Poisson

Je náhradou za negatívnu binomickú regresiu. Je použiteľné aj pre údaje o rozptýlenom počte. Rozptyl kvázi-Poissonovho modelu je lineárnou funkciou priemeru, zatiaľ čo rozptyl záporného binomického modelu je kvadratickou funkciou priemeru.

# 13 - Cox

Začne sa viac využívať na analýzu údajov čas od udalosti.

Rozdiel medzi regresiou a koreláciou

  • Regresia ustanovuje vzťah medzi nezávislou odchýlkou ​​a závislou premennou, kde sú obe premenné odlišné, zatiaľ čo korelácia určuje asociáciu alebo závislosť dvoch premenných, kde nie je rozdiel medzi oboma premennými.
  • Hlavným cieľom regresie je vytvoriť líniu najlepšej zhody a odhad jednej premennej sa robí na základe iných, zatiaľ čo v korelácii sa ukazuje lineárny vzťah medzi dvoma premennými.
  • V tomto prípade odhadujeme veľkosť určitej zmeny rozpoznanej premennej (X) na odhadovanej premennej (Y), zatiaľ čo pri korelácii sa pomocou koeficientu meria, do akej miery sa obe premenné pohybujú spoločne.
  • Je to proces odhadu veľkosti náhodných nezávislých premenných na základe veľkosti staticky závislej premennej, zatiaľ čo korelácia nám pomáha rozhodnúť sa o konkrétnej hodnote na vyjadrenie vzájomnej závislosti medzi oboma premennými.

Záver

  • Regresná analýza primárne využíva údaje na vytvorenie vzťahu medzi dvoma alebo viacerými premennými. Tu sa predpokladá, že vzťahy existujúce v minulosti sa budú odrážať aj v súčasnosti alebo budúcnosti. Málokto to považuje za časový posun medzi minulosťou a súčasnosťou / budúcnosťou.
  • Je to však veľmi používaná technika predpovedania a odhadovania. Aj keď to zahŕňa matematiku, ktorá môže byť pre mnohých používateľov náročná, dá sa táto technika pomerne ľahko použiť, najmä ak je k dispozícii model.

Zaujímavé články...