![]()
Economie
Regresia multiplaREGRESIA MULTIPLA De multe ori, studiul unui fenomen economic necesita introducerea mai multor variabile explicative. O variabila endogena se exprima, deci, in functie de mai multe variabile exogene. Metodele de regresie utilizate sunt in acest caz generalizari ale celor din capitolul anterior. 1. Modelul liniar al regresiei multiple Consideram acum modelul: (1) in care: Y reprezinta o variabila endogena; X1, X2 ,, Xp sunt variabile exogene; a1, a2 ,, ap sunt parametri necunoscuti care trebuie estimati. Modelul nu contine o constanta deoarece variabila Xp poate fi considerata
astfel ca xpt=1, Folosind notatiile:
ecuatia (1) se scrie sub forma matriceala: (2) Ipoteze fundamentale Ipotezele I1, I2 din capitolul II raman valabile: ceea ce era adevarat pentru xt este acum valabil pentru xit, i=1,2,,p. Ipoteza I3 referitoare la variabilele exogene se modifica astfel: a. absenta coliniaritatii variabilelor exogene: Nu exista nici o
multime de p numere reale Matricea X de format (Txp) are in acest caz rangul p (T>p) si matricea (X'X), unde X' este transpusa lui X, este nesingulara, deci exista inversa ei (X'X)-1. b.
Atunci cand 2. Determinarea estimatorilor parametrilor Pentru a scrie ecuatiile normale utilizam interpretarea
geometrica data in capitolul II. Ne propunem sa minimizam
expresia Fie vectorii Y, X1,
X2,,Xp in spatiul ortonormat
Vectorul Efectuind produsele scalare, rezulta sistemul de ecuatii:
Sau, cu notatiile matriciale introduse: X'Y=(X'X)a , de unde rezulta: (3) Proprietatile estimatorului Aratam ca a. transformam expresia (3) inlocuind Y prin expresia lui in functie de X: (4) Aplicand operatorul de medie expresiei (4), rezulta:
Dar, b. Prin definitie: Din (4)
rezulta:
Insa Se poate arata ca daca ipoteza a) din I3
ramane valabila cand Propozitie. Estimatorul Pentru a arata aceasta proprietate vom construi un estimator liniar pentru a care sa aiba varianta minima si el va fi identic cu cel obtinut prin MCMMP. Fie a* un estimator liniar al lui a, adica a*=MY, unde M este o matrice cu coeficienti constanti de format (pxT). Estimatorul a* este nedeplasat daca: adica Pentru ca a* sa fie nedeplasat, trebuie ca (MX)=I (matricea unitate de ordinul p). Construim acum matricea de varianta si covarianta a lui a*: Dar, se obtine
solutia Un astfel de estimator se numeste "estimator BLUE" (best liniar unbiaised estimator). 4. Determinarea unui estimator
nedeplasat al variantei Varianta reziduurilor Avem ca:
Dar:
Notam: G este o matrice de format (TxT) cu proprietatile G G (simetrica) si G2 G (idempotenta de grad 2). Am obtinut
Atunci, rezulta ca:
Insa, Aratam ca (permutarea intre In final rezulta:
T este numarul de observatii, p este numarul de parametri de estimat si relatia gasita o generalizeaza pe cea din capitolul II. 5. Teste si regiuni de incredere Ipoteza de normalitate a erorilor et fiind indeplinita, se pot generaliza rezultatele obtinute
la regresia simpla. Deoarece (*) (**) (***) Legea Student este utilizata in mod curent pentru a aprecia
validitatea estimatorului unui coeficient ai.
De exemplu, daca se testeaza ipoteza (H0:ai=0) contra ipotezei (H1:ai Observatie Pentru T>30 si a=0,05, Mai
general, cand se pune problema de a sti daca un coeficient ai este diferit de o valoare
particulara Daca tcalculat>ttabelat
concludem ca Consideram acum toti estimatorii variabila aleatoare (**) variabila aleatoare
Aceleasi principii conduc la determinarea de regiuni de incredere
relative la un numar oarecare de coeficienti din model. Daca q este numarul coeficientilor
retinuti, in spatiul
cu Daca dorim sa testam, la pragul de semnificatie a, ipoteza (H0:aq= se accepta
ipoteza H0 ( Observatie Se
observa ca valoarea tabelata F
depinde de 6. Previziunea variabilei endogene Daca presupunem cunoscute la un moment q valorile (x1q, x2q,, xpq) atunci previziunea variabilei endogene va fi:
Eroarea de previziune va fi variabila aleatoare:
Se constata ca media erorii de previziune este zero:
iar varianta erorii de previziune este: deoarece Deducem ca:
iar sub forma matriciala:
unde: Observatie: Se
arata ca daca T este finit si et sunt normal distribuite, atunci 7. Coeficientul de corelatie multipla R. Analiza variantei Si in acest caz, ecuatia variantei se scrie: Coeficientul de corelatie multipla R are definitia:
Din reprezentarea geometrica facuta, rezulta
ca dar stim
ca Observatie: Cand se
centreaza valorile X si Y, vectorul Expresia matriciala a coeficientului de corelatie multipla este:
Coeficientul Dar, judecarea calitatii unui model
doar prin valoarea lui O definire mai precisa a lui
1. daca p=1, atunci 2. daca p>1, atunci 3. 4. Analiza variantei Atunci cand studiem rolul jucat de exogene asupra evolutiei endogenei, ne putem intreba care este partea de variabilitate explicata de una sau mai multe variabile exogene. Reluam modelul initial: (1) si consideram q variabile printre cele p, pe care le indexam de la 1 la q: (2) Variabilitatea ne-explicata de cele q exogene in modelul (1) este variabilitatea reziduala asociata modelului (2). Fie: Variabilitatea ne-explicata de cele p exogene din modelul (1) este: Variabilitatea explicata de cele (p-q) exogene din modelul (1) atunci cand a1,,aq sunt estimati cu modelul (2) este atunci:
Stim ca Rezultatele se grupeaza, adesea, intr-un tabel de analiza a variantei:
In figura anterioara avem:
Hq apartine lui (L) si triunghiul AHpHq este dreptunghic in Hp.
8. Experienta de calcul Dispunem de observatiile din tabelul de mai jos si ne
propunem sa explicam variabile endogena Y pornind de la variabilele exogene X1 si X2,
printr-un model liniar de forma: adica:
Sa observam ca numarul de observatii (T=9) este mic, din ratiuni de simplificare a calculelor. Vom estima modelul, presupunind ca sunt indeplinite ipotezele principale ale modelului liniar general de regresie: - ipoteze stochastice: - ipoteze structurale: daca numarul de variabile exogene
veritabile este k, atunci p=k+1 este numarul parametrilor de
estimat. Trebuie ca rangul matricii X
sa fie egal cu p (p<T), iar matricea In exemplul nostru avem k=2 si p= Atunci,
unde: modelul se scrie:
Deoarece
Pentru a
calcula estimatorul Pentru a
determina estimatorul celui de al treilea parametru, a3, utilizam relatia: Modelul estimat
este: Cautam
acum un estimator nedeplasat pentru varianta reziduurilor. Am vazut ca acest estimator
este dat de relatia:
Matricea de
varianta si covarianta a vectorului Coeficientul de corelatie multipla R2, are valoarea: Variabilitatea
totala = Variabilitatea
reziduala = Variabilitatea explicata = Variabilitatea totala - Variabilitatea reziduala = =1248 - 68,4296 = 1179,5704
Tabelul de analiza a variantei (variabile centrate):
|