Upload
dragoi-cristian
View
292
Download
1
Embed Size (px)
Citation preview
7/29/2019 Metoda de regresie liniara simpla
1/22
Seminar aplicatii ale metodei de
regresie liniara simpla (unifactoriala)
Modelare Economica semestrul II,
an univ. 2010- 2011
1ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
2/22
Metode cauzate - Regresia
Scopul analizei de regresie: de a arta cum este legat o variabil Y de una sau mai
multe variabile Xi cu ajutorul unei ecuaii care d posibilitatea de a previzionavariabilele dependente n funcie de valorile cunoscute ale variabilelor
independente Xi.
Prin analiza de corelaie se urmrete: msurarea gradului de interdependen
ntre variabila dependent Y i variabilele independente Xi, interdependen
explicat prin ecuaia de regresie utilizat.
ME aplicatii seminar - an univ. 2010-2011 2
7/29/2019 Metoda de regresie liniara simpla
3/22
Corelatia
- evaluarea gradului de asociere ntrevariabilele independente, atunci cnd
ecuaia de regresie conine cel puin douvariabile independente Xi. Aceasta arat nce msurdou valori sunt legate ntre eleintensitatea legturii este exprimat cuajutorul a doi indicatori:
coeficientul de corelaie (R) msoarputerea relaiei de dependen liniar
printr-o valoare numeric ntre1 i 1 coeficientul de determinare (R2) - msoar
reducerea relativ n variaia lui Yce poatefi atribuit cunoaterii factorilor Xi i arelaieiY = f(X).
De exemplu, o valoare R2=0.76 indicc aproximativ76% din variaia total a variabilei Y poate fi
explicat prin variabilele dependente X incluse nmodel (o valoare 0.8 este consideratacceptabil).
ME aplicatii seminar - an univ. 2010-2011 3
7/29/2019 Metoda de regresie liniara simpla
4/22
Regresia liniar simpl- exprimat prin ecuaia de regresie:
Pentru a aprecia semnificaia estimatorilor:
pentru un set de date de volum se aplictestulStudentcu n-2 grade de libertate
pentru se aplic testul z al distribuiei normale[1]
formulnd ipotezele: H0: a=0ib=0iHa : a si b au semnificatiestatistica
Dac i atunci ipoteza H0 se respinge i se apreciaz ca a ib sunt
semnificativi din punct de vedere statistic.
[1]Teorema de limitcentralstabiletec suma (i media) unei mulimi de variabile aleatoare urmeaz o distribuienormal, dac eantionul este suficient de mare, indiferent de forma distribuiei de la care provine variabilaindividual. Teorema este folosit adesea pentru a explica ipoteza de normalitate a termenului de eroare nstudiul econometric, care permite folosirea testului statistic tpentru testarea ipotezelor, deoarece acest termende eroare se presupune cnglobeaz suma unei mulimi aleatoare de factori necunoscui(omii).
ta
a
tb
b
30n
30n
ii xbaY
4ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
5/22
Interpretarea rezultatelor testarea semnificatie coeficientilor de regresie
Test statistic (statistical test) formula matematica sau functie care se foloseste pentru a stabilidiferentaobservata intre rezultatele obtinute in grupul tratat si cele obtinute in grupul de control suntsuficient de mari pentru a concluziona ca sunt statistic semnificative. Testele statistice determina o valoarecare se asociaza cu valoarea lui P. Exista mai multe tipuri de teste statistice: F, t, Z si chi-patrat. Alegereatipului de studiu depinde de conditiile in care se realizeaza studiul, ex. ce variabile de rezultat exista, daca saunu pacientii din studiu au fost in mod randomizat alesi dintr-o populatie generala sau daca se poate sustineca rezultatele finale intr-o populatie au o distributie normala sau un alt tip de distributie.
Testarea ipotezei (hypothesis testing) modalitatea de interpretare a rezultatelor unui studiu clinic (trial) careimplica stabilirea probabilitatii ca observarea unui efect la tratament sa fi aparut numai datorita intamplarii(sansei) daca ipoteza specificata se dovedeste adevarata. In mod normal ipoteza specificata este o ipotezanula, care este formulata inainte de inceperea sudiului si presupune ca interventia din studiu nu are un efectreal / adevarat. Testarea ipotezei se foloseste pentru a determina daca ipoteza nula este sau nu respinsa
Ipoteza nula (null hypothesis) in testarea ipotezei, ipoteza care spune ca interventia nu are nici un efect ex.arata ca nu exista nici o deosebire intre rezultatele obtinute de grupul de tratament si cele din grupul control.Daca testul statistic indica faptul ca valoarea P se afla la sau deasupra unei valori specificate a (ex. 0.01 sau0.05, care reprezinta probabilitatea de a face eroare pozitiva - false-positive error) atunci orice efect observatal tratamentului nu este semnificativ statistic iar ipoteza nula nu poate fi respinsa. Daca valoarea P este maimica decat valoarea specificata a lui a, atunci efectul tratamentului este statistic semnificativ iar ipotezanula va fi respinsa. Daca intervalul de incredere (ex. de 95% sau 99%) include efect 0 al tratamentului ,atunci ipoteza nula nu poate fi respinsa .
ME aplicatii seminar - an univ. 2010-2011 5
7/29/2019 Metoda de regresie liniara simpla
6/22
Interpretarea rezultatelor testarea semnificatie coeficientilor de regresie
Intervalul de incredere (confidence interval) - stabileste gradul de incertitudine privind estimarea construita. Secalculeaza din diferenta observata intre datele reale obtinute si cele obtinute in grupul de control sidimensiunea esantionului de studiu. Intervalul de incredere este sirul de valori aflate deasupra si sub punctulestimat care este probabil si include valoarea adevarata a efectului tratamentului. Folosirea intervalului deincredere presupune ca un studiu furnizeaza un esantion de observatii (din multe esantioane posibile) care arfi obtinut daca studiul se repeta de mai multe ori. Frecvent se foloseste un interval de incredere de 90% , 95%sau 99%. Astfel exista o probabilitate de 95% ca intervalul de incredere 95% calculat intr-un studiu sa includa
valoarea reala a efectului tratamentului. De exemplu, in testarea unui tratament medical, daca intervalul deincredere include un efect terapeutic nul ipoteza nula care spune ca nu exista nici un efect al tratamentuluinu poate fi respinsa.
Semnificatie statistica (statistical significance) concluzia, stabilita cu un test statistic, ca o interventie are unefect real, bazata pe diferenta observata intre rezultatele obtinute in grupul tratat si cele obtinute in grupulde control, grupuri care sunt suficient de mari astfel incat diferentele sa nu fie datorate intamplarii.Semnificatia statistica indica probabilitatea ca diferentele observate sa se datoreasca sansei daca ipoteza nulaeste adevarata; nu furnizeaza informatii despre magnitudinea efectului unui tratament. (Semnificatia
statistica este necesara dar nu suficienta in stabilirea semnificatiei clinice).
Valoarea P (Pvalue) in testarea ipotezei, probabilitatea ca o diferenta observata intre rezultatele obtinute ingrupurile de interventie si control sa se datoreze numai intamplarii (sansei) daca ipoteza nula este adevarata.Daca valoarea lui P este mai mica decat valoarea specificata a (in mod uzual 0.01 sau 0.05) aleasa de lainceput in studiu, atunci ipoteza nula va fi respinsa.
ME aplicatii seminar - an univ. 2010-2011 6
7/29/2019 Metoda de regresie liniara simpla
7/22
Semnificaia statistic a parametrilor modeluluiDistribuia t(Student)*1+ se folosete n testele ipotezelor pe eantioane mici i n care variana variabilei respective
trebuie estimat n raport cu datele. Este o distribuie de probabilitate n form de clopot, n care valoareamedie este egal cu zero, dispersia variabilelor n jurul valorii medii fiind dependent de gradele de libertate*2+
dictate de mrimea eantionului. Gradele de libertate arat numrul de elemente informaionale care pot variaindependent unul de altul; se spune c un eantion de n observaii are n grade de libertate. De exemplu,calcularea unei medii simple a eantionului implic pierderea unui grad de libertate deoarece variaiileindependente n n-1din observaiile din eantion vor necesita o schimbare compensatorie n cel de al n leagrad de libertate, pentru a se menine valoarea medie a eantionului. Tot astfel, calcularea valorilor pentru unnumr de kparametri n cadrul unui exemplu econometric implic pierderea a kgrade de libertate, rmnnd(n-k).
Dac erorile sunt distribuite normal se ateapt ca aproximativ 68% dintre valorile lui ys fie situate ntr-un intervalmai mic de (eroarea standard de previziune) uniti fa de valoarea medie, sau 95% la mai puin de 2 sau 99%la mai puin de 3.
Fiecare din parametrii estimai este caracterizat de o eroare standard deoarece determinarea lor se face pe bazaunui eantion de date; probabil un alt eantion ar duce la obinerea altor valori ale parametrilor modelului.Valoarea aproximativ a statisticii tde verificare a semnificaiei coeficienilor modelului se calculeaz cu relaia:
Ca regul, se realizeaz excluderea din model a oricrui coeficient pentru care . Orice coeficient pentru care estediferit de zero la un nivel de semnificaie de aproximativ 5%. Includerea n model a unor coeficieni cu valoriabsolute ale statisticii testului tsubstanial mai mici dect 2,0 va spori numrul parametrilor modelului i va
duce la reducerea preciziei prediciei.
[1] Testul teste testul cel mai des utilizat n analizele economice cantitative i este definit ca raportul dintre o variabil normal i o variabil mprit la numrul gradelor de libertate.
[2] Gradele de libertatearat numrul de elemente informaionale care pot varia independent unul de altul. Se spune c uneantion de n observaii are ngrade de libertate. Totui, calcularea mediei simple a eantionului implic pierderea unui grad delibertate deoarece variaiile independente n n-1din observaiile din eantion vor necesita o schimbare compensatorie n cel de al- n -lea grad de libertate, pentru a se menine valoarea medie a eantionului. Tot astfel, calcularea valorilor pentru un numr de kparametri n cadrul unui exemplu econometric implic pierderea a kgrade de libertate, rmnnd (n-k).Gradele de libertate intradesea ca parametri n distribuii de probabilitate (distribuia tsau ) crora le poate afecta alura n mod fundamental.
uluicoeficientaestimatadardtanseroarea
ipotezaprinuluicoeficientvaloareaestimatcoeficientt
7ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
8/22
Interpretarea riscului de acceptare / respingere a H0
Eroare de tip I este dat de respingereaipotezei nule atunci cnd, de fapt,aceasta ar fi trebuit acceptat;
se confirm/valideaz o ipotez care nueste adevrat
impact: concluzii gresite care pot ducela identificarea unor soluii/deciziiinadecvate
Eroarea de tip II este urmareaacceptrii ipotezei nule cnd, de fapt,aceasta trebuie respins:
n fapt, se ignor/ se pierde un efectimportant
in consecint, se pot trata doualternative/ opiuni ca identice dei, nrealitate, acestea sunt diferite.
8ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
9/22
Principiul analizei dispersionaleDATA = FIT + RESIDUAL
9ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
10/22
Perform a regression analysis
Linear regression produces the slope of a line that best fits a single set of data. Based on a year's worthof sales figures, for example, linear regression can tell you the projected sales for March of thefollowing year by giving you the slope and y-intercept (that is, the point where the line crosses the y-axis) of the line that best fits the sales data. By following the line forward in time, you can estimatefuture sales, if you can safely assume that growth will remain linear.
Exponential regression produces an exponential curve that best fits a set of data that you suspect doesnot change linearly with time. For example, a series of measurements of population growth will nearlyalways be better represented by an exponential curve than by a line.
Multiple regression is the analysis of more than one set of data, which often produces a more realistic
projection. You can perform both linear and exponential multiple regression analyses. For example,suppose you want to project the appropriate price for a house in your area based on square footage,number of bathrooms, lot size, and age. Using a multiple regression formula, you can estimate a price,based on a database of information gathered from existing houses.
Linear regression
The equation y = mx + b algebraically describes a straight line for a set of data with one independentvariable where x is the independent variable, y is the dependent variable, m represents the slope ofthe line, and b represents the y-intercept.
If a line represents a number of independent variables in a multiple regression analysis to an expectedresult, the equation of the regression line takes the form y=m1x1+m2x2+...+mnxn+b in which y is thedependent variable,x1 throughxn are n independent variables, m1 through mn are the coefficients ofeach independent variable, and b is a constant.
10ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
11/22
Calculating exponential regression
Unlike linear regression, which plots values along a
straight line, exponential regression describes a
curve by calculating the array of values needed to
plot it.
The equation that describes an exponential regression
curve is y = b * m1x1* m2
x2* * mnxn
If you have only one independent variable, theequation is y = b * m
x
11ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
12/22
Analysis ToolPak (Pachet de instrumente de
analiz)
Instrumentul de analiz Regresie execut analiza de regresieliniar prin utilizarea metodei ptratelor mici pentru agsi o linie care corespunde unui set de observaii. Aveiposibilitatea analizrii modului n care o singur variabildependent este afectat de valorile uneia sau a maimultor variabile independente.
http://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspx
12ME aplicatii seminar - an univ. 2010-2011
http://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspx7/29/2019 Metoda de regresie liniara simpla
13/22
Lucrul cu EXCEL - Perform a regression analysis
Linear regression produces the slope of a line that best fits a single set of data.Based on a year's worth of sales figures, for example, linear regression can tell you the projected sales for March
of the following year by giving you the slope and y-intercept (that is, the point where the line crosses the y-axis) of the line that best fits the sales data. By following the line forward in time, you can estimate futuresales, if you can safely assume that growth will remain linear.
Exponential regression produces an exponential curve that best fits a set of data that yoususpect does not change linearly with time.
For example, a series of measurements of population growth will nearly always be better represented by anexponential curve than by a line.
Multiple regression is the analysis of more than one set of data, which often produces a more
realistic projection. You can perform both linear and exponential multiple regression analyses.
Linear regression
The equation y = mx + b algebraically describes a straight line for a set of data with oneindependent variable where x is the independent variable, y is the dependent variable, mrepresents the slope of the line, and b represents the y-intercept.
If a line represents a number of independent variables in a multiple regression analysis to an
expected result, the equation of the regression line takes the form y=m1x1+m2x2+...+mnxn+b inwhich y is the dependent variable, x1 through xn are n independent variables, m1 through mnare the coefficients of each independent variable, and b is a constant.
Non-Linear regression Unlike linear regression, which plots values along a straight line,exponential regression describes a curve by calculating the array of values needed to plot it.The equation that describes an exponential regression curve isy = b * m1
x1* m2x2 * * mn
xn. Ifyou have only one independent variable, the equation isy = b * m
x
13ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
14/22
Studiu de caz previziunea cursului de schimb
valutar leu-euro februarie 2011-
Extragere de date info financiar BNR
MSS - MAPSS - 2010 - 2011 1414ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
15/22
15ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
16/22
16ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
17/22
17ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
18/22
18ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
19/22
19ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
20/22
20ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
21/22
21ME aplicatii seminar - an univ. 2010-2011
7/29/2019 Metoda de regresie liniara simpla
22/22
22ME aplicatii seminar - an univ. 2010-2011