21
Økonometri 1: Dummy variable 1 Økonometri 1 Dummy variable 17. marts 2003

Økonometri 1

  • Upload
    esben

  • View
    49

  • Download
    2

Embed Size (px)

DESCRIPTION

Økonometri 1. Dummy variable 17. marts 2003. Dagens program. Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4) HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier - PowerPoint PPT Presentation

Citation preview

Page 1: Økonometri 1

Økonometri 1: Dummy variable 1

Økonometri 1

Dummy variable17. marts 2003

Page 2: Økonometri 1

Økonometri 1: Dummy variable 2

Dagens program

Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.1-7.4)

HUSK EKSAMENSTILMELDING Kvalitative variable Dummy variable for kvalitative variable med to kategorier Dummy variable for kvalitative variable med flere end to

kategorier Interaktionsled med dummy variable Chow testet

Page 3: Økonometri 1

Økonometri 1: Dummy variable 3

Kvalitative variable

Indtil nu har vi (hovedsagligt) set på kvantitative variable (løn, priser, forbrug, indkomst)

.. Men hvad med kvalitative variable? Kvalitative variable:

Diskrete variable Eksempler:

Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt)

Page 4: Økonometri 1

Økonometri 1: Dummy variable 4

Kvalitative variable

I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal

Eksempler: arbejdstid og helbred

Page 5: Økonometri 1

Økonometri 1: Dummy variable 5

Kvalitative variable med to kategorier For kvalitative variable med to kategorier laves ofte

en dummy variabel Dummy variable

Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1,

når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0

Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og

binære variable

Page 6: Økonometri 1

Økonometri 1: Dummy variable 6

Kvalitative variable med to kategorier Dummy variable kan inkluderes i den multiple

regressionsmodel som alm. forklarende variable

Eks: lønrelationen

hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med

samme uddannelse og erfaring) og når antagelse MLR 3 er opfyldt

0 1 2 3log i i i i itimelon udd erfaring kvinde

3(log( ) | , , 1) (log( ) | , , 0)i iE timelon udd erfaring kvinde E timelon udd erfaring kvinde

Page 7: Økonometri 1

Økonometri 1: Dummy variable 7

Kvalitative variable med to kategorier Fortolkning af parameteren til dummy variablen:

Parameteren til dummy variablen måler forskellen mellem de to kategorier

Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet

..men afkast af de øvrige forklarende variable er de sammen for de to grupper

Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)

Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable)

Vil man have den eksakte procentuelle forskel skal følgende formel anvendes 100*[exp( ) 1]

Page 8: Økonometri 1

Økonometri 1: Dummy variable 8

Kvalitative variable med to kategorier Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy

for mand? Man kan blot omparametrisere så får man den

samme model (Husk ) Begge variable kan ikke inkluderes (hvis der også

er et konstantled i modellen) -> Perfekt multikollinaritet

1i imand kvinde

Page 9: Økonometri 1

Økonometri 1: Dummy variable 9

Evaluering af programmer

Et meget vigtigt eksempel på dummy variable er ”program evaluation”

Eks: Effekten af jobtræningskurser Simpel tilfælde: to grupper

”Treatment” (forsøgs-) gruppen: dem som deltager i programmet

”control” (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for ”treatment”

gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen

(pga. den måde økonomiske data fremkommer)

Page 10: Økonometri 1

Økonometri 1: Dummy variable 10

Kvalitative variable med flere end to kategorier Hvad hvis den kvalitative variabel har m kategorier (og m>2)

Generelt skal man lave m-1 dummy variable Den kategori hvortil der ikke hører en dummy variabel kaldes reference

kategorien Hvis man inkluderer m dummy variable og et konstantled er der perfekt

multikollinaritet Parametrene til dummy variablene angiver forskellen mellem den

pågældende kategori og reference kategorien Betyder valget af reference kategori noget?

Nej, ikke for estimation, prediktioner Ja, fortolkningen af parametrene til dummy variablene afhænger af

reference kategorien

Page 11: Økonometri 1

Økonometri 1: Dummy variable 11

Kvalitative variable med flere end to kategorier Eksempel: Hvad hvis man brugte dummy variable til at

kontrollere for uddannelse Uddannelseskategorier for højeste fuldførte udd.:

Folkeskole (udd<=9) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd.

(udd=11,12,13) Videregående uddannelse (udd>13)

Model0 1 2 3 4 5log 10i i i i i i itimelon erfaring kvinde klasse gym videreg

Page 12: Økonometri 1

Økonometri 1: Dummy variable 12

Kvalitative variable med flere end to kategorier (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy

variable? Fordele: generelt mere fleksibel form Ulempe: flere variable i regressionen (tab af

frihedsgrader) Test for betydning af den kvalitative variabel udføres

ved et F-test for at alle parametrene til dummyerne er lig 0

Page 13: Økonometri 1

Økonometri 1: Dummy variable 13

Kvalitative variable med flere end to kategorier (fortsat) Eksempel: sammenligning af effekten af

uddannelse

Effekten af uddannelseuddaar

(mean) lon_d (mean) lon_u

5 10 15 20

4.8

5

5.2

5.4

Page 14: Økonometri 1

Økonometri 1: Dummy variable 14

Interaktionsled med to dummy variable Interaktionsled med dummy variable er helt analogt

til interaktionsled med kvantitative variable og ofte anvendt

Eksempel: Arbejdsudbud

Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn

Denne restriktion kan fjernes ved at introducere et interaktionsled

0 1 2i i iarbejdstid kvinde børn

0 1 2 3( * )i i i i iarbejdstid kvinde børn børn kvinde

Page 15: Økonometri 1

Økonometri 1: Dummy variable 15

Interaktionsled med to dummy variable Eksempel: lønrelationen – interaktion mellem

køn og ægteskabelig status Hvorfor skal ægteskabelig status med i en

lønrelation? Skal der en interaktionseffekt mellem køn og

ægteskabelig status med?

Page 16: Økonometri 1

Økonometri 1: Dummy variable 16

Interaktionsled med dummy variable og kvantitative variable Interaktionsled mellem dummy variable og

kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel

Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2)

Eksempel: Lønrelationen- afkastet af erfaring afhænger af køn

0 1 2 3 4

0 3 1 2 4

log ( * )log ( ) ( )*

i i i i i i i

i i i i i i

timelon udd erfaring kvinde erfaring kvindetimelon kvinde udd kvinde erfaring

Page 17: Økonometri 1

Økonometri 1: Dummy variable 17

Interaktionsled med dummy variable og kvantitative variable Tests Samme afkast af erfaring: Ingen forskel på mænd og kvinder:

4 0 3 4 0

Page 18: Økonometri 1

Økonometri 1: Dummy variable 18

Chow test Test for om der er forskel mellem to grupper Modellen kan formuleres ved brug af dummy’er (d=1 for

gruppe 2)

Hypotesen kan formuleres som Hvis der er mange forklarende variable kan modellen skrives

som

hvor g=1,2 (to forskellige grupper) Hypotese

k+1 restriktioner

,0 ,1 1 ,2 2 ,g g g g k ky x x x

0 1,0 2,0 1, 2,: , , k kH

0 1 1 2 2

1 2 1 3 2 2 1( * ) ( * ) ( * )k k

k k k k k

y x x xd d x d x d x

0 1 2 2 1: 0k k kH

Page 19: Økonometri 1

Økonometri 1: Dummy variable 19

Chow test (fortsat)

Teststørrelsen udregnes ved at lave tre regressioner af y på en konstant og (uden dummy-variable), hvor SSR størrelsen noteres: Regression for gruppe 1 alene -> SSR1

Regression for gruppe 2 alene -> SSR2

Regression for både gruppe 1 og 2 ->SSRP

1 2, , , kx x x

Page 20: Økonometri 1

Økonometri 1: Dummy variable 20

Chow test (fortsat)

Teststørrelsen

Hvor n er det samlede antal obs. (både fra gruppe 1 og 2) k+1 er antal restriktioner

Teststørrelsen er F-fordelt med (k+1, n-2(k+1)) frihedsgrader

NB: Dette test er det klassiske F-test

1 2

1 2

( ( )) /( 1)( ) /( (2( 1))

PSSR SSR SSR kFSSR SSR n k

( ) //( ( ))

R UR

UR

SSR SSR qF

SSR antal frihedsgrader UR

Page 21: Økonometri 1

Økonometri 1: Dummy variable 21

Chow test (fortsat)

Eksempel: Lønrelation Grupper: mænd og kvinder Model

Teststørrelse (se SAS-output)

F-fordelt med (3,1040) frihedsgrader

,0 ,1 ,2log i g g i g i itimelon udd erfaring

(79.22515 (30.71222 40.61740)) / 3 38.37(30.71222 40.61740) /(1046 6)

F