Upload
esben
View
49
Download
2
Tags:
Embed Size (px)
DESCRIPTION
Økonometri 1. Dummy variable 17. marts 2003. Dagens program. Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4) HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier - PowerPoint PPT Presentation
Citation preview
Økonometri 1: Dummy variable 1
Økonometri 1
Dummy variable17. marts 2003
Økonometri 1: Dummy variable 2
Dagens program
Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4)
HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier Dummy variable for kvalitative variable med flere end to
kategorier Interaktionsled med dummy variable Chow testet
Økonometri 1: Dummy variable 3
Kvalitative variable
Indtil nu har vi (hovedsagligt) set på kvantitative variable (løn, priser, forbrug, indkomst)
.. Men hvad med kvalitative variable? Kvalitative variable:
Diskrete variable Eksempler:
Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt)
Økonometri 1: Dummy variable 4
Kvalitative variable
I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal
Eksempler: arbejdstid og helbred
Økonometri 1: Dummy variable 5
Kvalitative variable med to kategorier For kvalitative variable med to kategorier laves ofte
en dummy variabel Dummy variable
Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1,
når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0
Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og
binære variable
Økonometri 1: Dummy variable 6
Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple
regressionsmodel som alm. forklarende variable
Eks: lønrelationen
hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med
samme uddannelse og erfaring) og når antagelse MLR 3 er opfyldt
0 1 2 3log i i i i itimelon udd erfaring kvinde
3(log( ) | , , 1) (log( ) | , , 0)i iE timelon udd erfaring kvinde E timelon udd erfaring kvinde
Økonometri 1: Dummy variable 7
Kvalitative variable med to kategorier Fortolkning af parameteren til dummy variablen:
Parameteren til dummy variablen måler forskellen mellem de to kategorier
Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet
..men afkast af de øvrige forklarende variable er de sammen for de to grupper
Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)
Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)
Vil man have den eksakte procentuelle forskel skal følgende formel anvendes 100*[exp( ) 1]
Økonometri 1: Dummy variable 8
Kvalitative variable med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy
for mand? Man kan blot omparametrisere så får man den
samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også
er et konstantled i modellen) -> Perfekt multikollinaritet
1i imand kvinde
Økonometri 1: Dummy variable 9
Evaluering af programmer
Et meget vigtigt eksempel på dummy variable er ”program evaluation”
Eks: Effekten af jobtræningskurser Simpel tilfælde: to grupper
”Treatment” (forsøgs-) gruppen: dem som deltager i programmet
”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment”
gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen
(pga. den måde økonomiske data fremkommer)
Økonometri 1: Dummy variable 10
Kvalitative variable med flere end to kategorier Hvad hvis den kvalitative variabel har m kategorier (og m>2)
Generelt skal man lave m-1 dummy variable Den kategori hvortil der ikke hører en dummy variabel kaldes reference
kategorien Hvis man inkluderer m dummy variable og et konstantled er der perfekt
multikollinaritet Parametrene til dummy variablene angiver forskellen mellem den
pågældende kategori og reference kategorien Betyder valget af reference kategori noget?
Nej, ikke for estimation, prediktioner Ja, fortolkningen af parametrene til dummy variablene afhænger af
reference kategorien
Økonometri 1: Dummy variable 11
Kvalitative variable med flere end to kategorier Eksempel: Hvad hvis man brugte dummy variable til at
kontrollere for uddannelse Uddannelseskategorier for højeste fuldførte udd.:
Folkeskole (udd<=9) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd.
(udd=11,12,13) Videregående uddannelse (udd>13)
Model0 1 2 3 4 5log 10i i i i i i itimelon erfaring kvinde klasse gym videreg
Økonometri 1: Dummy variable 12
Kvalitative variable med flere end to kategorier (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy
variable? Fordele: generelt mere fleksibel form Ulempe: flere variable i regressionen (tab af
frihedsgrader) Test for betydning af den kvalitative variabel udføres
ved et F-test for at alle parametrene til dummyerne er lig 0
Økonometri 1: Dummy variable 13
Kvalitative variable med flere end to kategorier (fortsat) Eksempel: sammenligning af effekten af
uddannelse
Effekten af uddannelseuddaar
(mean) lon_d (mean) lon_u
5 10 15 20
4.8
5
5.2
5.4
Økonometri 1: Dummy variable 14
Interaktionsled med to dummy variable Interaktionsled med dummy variable er helt analogt
til interaktionsled med kvantitative variable og ofte anvendt
Eksempel: Arbejdsudbud
Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn
Denne restriktion kan fjernes ved at introducere et interaktionsled
0 1 2i i iarbejdstid kvinde børn
0 1 2 3( * )i i i i iarbejdstid kvinde børn børn kvinde
Økonometri 1: Dummy variable 15
Interaktionsled med to dummy variable Eksempel: lønrelationen – interaktion mellem
køn og ægteskabelig status Hvorfor skal ægteskabelig status med i en
lønrelation? Skal der en interaktionseffekt mellem køn og
ægteskabelig status med?
Økonometri 1: Dummy variable 16
Interaktionsled med dummy variable og kvantitative variable Interaktionsled mellem dummy variable og
kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel
Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2)
Eksempel: Lønrelationen- afkastet af erfaring afhænger af køn
0 1 2 3 4
0 3 1 2 4
log ( * )log ( ) ( )*
i i i i i i i
i i i i i i
timelon udd erfaring kvinde erfaring kvindetimelon kvinde udd kvinde erfaring
Økonometri 1: Dummy variable 17
Interaktionsled med dummy variable og kvantitative variable Tests Samme afkast af erfaring: Ingen forskel på mænd og kvinder:
4 0 3 4 0
Økonometri 1: Dummy variable 18
Chow test Test for om der er forskel mellem to grupper Modellen kan formuleres ved brug af dummy’er (d=1 for
gruppe 2)
Hypotesen kan formuleres som Hvis der er mange forklarende variable kan modellen skrives
som
hvor g=1,2 (to forskellige grupper) Hypotese
k+1 restriktioner
,0 ,1 1 ,2 2 ,g g g g k ky x x x
0 1,0 2,0 1, 2,: , , k kH
0 1 1 2 2
1 2 1 3 2 2 1( * ) ( * ) ( * )k k
k k k k k
y x x xd d x d x d x
0 1 2 2 1: 0k k kH
Økonometri 1: Dummy variable 19
Chow test (fortsat)
Teststørrelsen udregnes ved at lave tre regressioner af y på en konstant og (uden dummy-variable), hvor SSR størrelsen noteres: Regression for gruppe 1 alene -> SSR1
Regression for gruppe 2 alene -> SSR2
Regression for både gruppe 1 og 2 ->SSRP
1 2, , , kx x x
Økonometri 1: Dummy variable 20
Chow test (fortsat)
Teststørrelsen
Hvor n er det samlede antal obs. (både fra gruppe 1 og 2) k+1 er antal restriktioner
Teststørrelsen er F-fordelt med (k+1, n-2(k+1)) frihedsgrader
NB: Dette test er det klassiske F-test
1 2
1 2
( ( )) /( 1)( ) /( (2( 1))
PSSR SSR SSR kFSSR SSR n k
( ) //( ( ))
R UR
UR
SSR SSR qF
SSR antal frihedsgrader UR
Økonometri 1: Dummy variable 21
Chow test (fortsat)
Eksempel: Lønrelation Grupper: mænd og kvinder Model
Teststørrelse (se SAS-output)
F-fordelt med (3,1040) frihedsgrader
,0 ,1 ,2log i g g i g i itimelon udd erfaring
(79.22515 (30.71222 40.61740)) / 3 38.37(30.71222 40.61740) /(1046 6)
F