44
7/23/2019 Coeficiente de Determinacion Parcial http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 1/44 Coeficiente de Determinación Parcial SEMANA 10

Coeficiente de Determinacion Parcial

  • Upload
    m4gn3to

  • View
    227

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 1/44

Coeficiente de Determinación Parcial 

SEMANA 10

Page 2: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 2/44

Coeficiente de Determinación Parcial 

Los coeficientes son una medida de la porción de la variación

en la variable dependiente que es explicada por cada variable

explicativa, mientras se controla o se mantiene constante a las

demás variables explicativas.

Page 3: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 3/44

Así pues, en un modelo de regresión múltiple con dos

variables explicativas tenemos:

y también

Page 4: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 4/44

en la que:

SSR(X1  / X2) = suma de cuadrados de la contribución de la

variable X1 al modelo de regresión dado que la variable X2 

ha sido incluida en el modelo.

SST = suma total de cuadrados para Y

SSR(X1 y X2) = suma de cuadrados de regresión cuando las

variables X1  y X2  están incluidas en el modelo de regresión

múltiple.

SSR(X2  / X1) = suma de cuadrados de la contribución de lavariable X2 al modelo de regresión dado que la variable X1 

ha sido incluida en el modelo.

Page 5: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 5/44

Mientras que en un modelo de regresión múltiple que

contiene varias (P ) variables explicativas, tenemos:

Page 6: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 6/44

Para nuestro problema sobre el consumo de petróleo para

calefacción podemos calcular

El coeficiente de determinación parcial de la variable Ycon X1, mientras se mantiene constante X2 puede

interpretarse como que, para una cantidad fija

(constante) de aislamiento en el ático, 95.61% de la

variación en el consumo de petróleo para calefaccióndurante enero puede explicarse por la variación en la

temperatura atmosférica diaria promedio en dicho mes.

Page 7: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 7/44

y

El coeficiente de determinación parcial de la variable Ycon X2, mientras se mantiene constante X1 puede

interpretarse como que, para una temperatura atmosférica

diaria promedio dada (constante), 85.88% de la variación

en el consumo de petróleo para calefacción durante enero

 puede ser explicada por la variación en la cantidad deaislamiento.

Page 8: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 8/44

El Modelo de Regresión Curvilíneo 

En nuestro análisis de la regresión simple y en el de

regresión múltiple, hemos supuesto que la relación entre Y

y cada variable explicativa es lineal.

Sin embargo, existen varios tipos diferentes de relaciones

entre variables. Una de las relaciones no lineales más

comunes es la relación polinomial curvilínea entre dos

variables en la que Y aumenta (o disminuye) con una

rapidez variable  para diferentes valores de X.

Page 9: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 9/44

Este modelo de una relación polinomial entre X y Y puede

expresarse como:

en la que:

Este modelo de regresión es parecido al modelo de

regresión múltiple con dos variables explicativas, excepto

en que la segunda variable explicativa, en este caso, es

 justamente el cuadrado de la primera variable.

Page 10: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 10/44

La ecuación de regresión para el modelo polinomial

curvilíneo con una variable explicativa (X1) y una

variable dependiente (Y) es:

(1)

Page 11: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 11/44

Un planteamiento alternativo al modelo de regresión

curvilíneo expresado en la ecuación (1) consiste en centrar

los datos mediante la sustracción de la media de la variable

explicativa de cada valor del modelo.

Este modelo de regresión centrada se presenta en la

siguiente ecuación:

(2)

Page 12: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 12/44

Matemáticamente hablando, la ecuación (1) y la ecuación(2) son equivalentes.

La diferencia entre los dos métodos se presenta en los

términos correspondientes a la intersección y al efectolineal.

Page 13: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 13/44

Búsqueda de los Coeficientes de Regresión y

Predicción de Y 

Con el fin de ilustrar el modelo de regresión curvilíneo,

suponga que el departamento de mercadotecnia de una

cadena grande de supermercados desea estudiar la

flexibilidad de precios de los paquetes de rasuradorasdesechables. Se seleccionó una muestra aleatoria de 15

tiendas con igual afluencia de clientes y colocación de

artículos (es decir, junto a las cajas registradoras).

Page 14: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 14/44

El número de paquetes vendidos y el precio en cada tienda

se presentan en la siguiente tabla:

TABLA: Ventas y precios de paquetes de rasuradoras desechables para una

muestra de 15 tiendas 

Ventas Precio (ctvos.) Ventas Precio (ctvos.)

142

151

163

168

176

91

100

107

79

79

79

79

79

99

99

99

115

126

77

86

95

100

106

99

99

119

119

119

119

119

Page 15: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 15/44

Con el propósito de investigar la selección del modelo

adecuado que representa la relación entre precio y ventas,

se graficó un diagrama de dispersión en la siguiente figura:FIG.: Diagrama de dispersión del precio (X) y las ventas (Y)

Page 16: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 16/44

Un examen más detallado de éste nos indica que la

disminución de las ventas se nivela con un aumento de

los precios

Por consiguiente, parece que podría ser más apropiado

utilizar un modelo curvilíneo para estimar las ventas

 basándose en el precio, en lugar de usar un modelo lineal.

Page 17: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 17/44

Ventas(Y) Precio(X1i) Precio2 1i   11i     11i    

142 79 6241 -20 400151 79 6241 -20 400

163 79 6241 -20 400

168 79 6241 -20 400

176 79 6241 -20 400

91 99 9801 0 0

100 99 9801 0 0

107 99 9801 0 0115 99 9801 0 0126 99 9801 0 0

77 119 14161 20 400

86 119 14161 20 400

95 119 14161 20 400

106 119 14161 20 400

Page 18: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 18/44

En la siguiente Fig. se presenta el resultado parcial obtenido

con el paquete MINITAB para los datos de nuestro ejemplo,

utilizando el modelo centrado (ecuación 2).Análisis de RegresiónLa ecuación de regresión es:

 Ventas(Y) = 108 - 1.68 (X1i - media) + 0.0465 (X1i - media)sq

Predictor Coef StDev T P

Constant 107.800  5.756 18.73 0.000

(X1i - m -1.6800  0.2035 -8.26  0.000

(X1i - m 0.04650  0.01762 2.64  0.022

S = 12.87 R-Sq = 86.2% R-Sq(adj) = 83.9%

 Análisis de Varianza

Source DF SS MS F P

Regression 2 12442.8 6221.4  37.56 0.000

Residual Error 12 1987.6 165.6 Total 14 14430.4

Page 19: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 19/44

En la figura observamos que:

8.107"

0   b   68.1"

1   b   0465.011  b  

Por consiguiente, el modelo curvilíneo centrado puede

expresarse como:

Page 20: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 20/44

Para interpretar los coeficientes vemos que las ventas

disminuyen con un aumento de los precios; sin embargo,

observamos también que estas disminuciones en las ventasse nivelan o se reducen al aumentar el precio.

Esto se puede ver al predecir las ventas promedios para

 paquetes con precios de 79 centavos, 99 centavos y 119

centavos ($1.19) Utilizando nuestra ecuación de regresióncurvilínea

Page 21: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 21/44

 para 791   i

 X  ,tenemos

 para 991   i X  , tenemos

 para 1191   i X  , tenemos

Page 22: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 22/44

Así pues, observamos que se espera que una tienda quevende las rasuradoras en 79 centavos venda 52.2 paquetes

más que una tienda que vende las rasuradoras en 99

centavos.

Pero se espera que una tienda que las vende a 99 centavos

venda solamente 15 paquetes más que una tienda que las

venda a $1.19.

Page 23: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 23/44

Diagrama de dispersión que representa la relación

curvilínea entre el precio (X) y las ventas (Y)

Page 24: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 24/44

Prueba de la Significación del Modelo Curvilíneo 

Ahora que el modelo curvilíneo ha sido ajustado a los

datos, podemos determinar si existe una relación

curvilínea significativa entre las ventas, Y, y el precio, X.

De manera parecida a la regresión múltiple, las hipótesisnula y alternativa pueden establecerse como

0: 1110        H    (no existe relación entre X1 y Y)

11 :   H   y/o 011       (el último coeficiente de regresión no es igual a cero)

Page 25: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 25/44

La hipótesis nula puede ser probada utilizando una prueba

F.

Utilizando los resultados obtenidos para nuestro problema

mediante el paquete MINITAB, se tiene:

Si se selecciona un nivel de segnificación de 0.05, tenemos

que, para 2 y 12 grados de libertad, el valor crítico de ladistribución F es de 3.89

Page 26: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 26/44

Se llega a la conclusión de que existe una relación

curvilínea significativa entre las ventas y el precio

de las rasuradoras.

Page 27: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 27/44

En el análisis de regresión curvilínea, el coeficiente de

determinación múltiple puede calcularse con la ecuación

siguiente:

De los resultados del paquete MINITAB, tenemos:

SSR = 12,442.8 y SST = 14,430.4

Así pues,

Page 28: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 28/44

Este coeficiente de determinación múltiple, cuyo valor se

calculó en 0.862, puede interpretarse como que el 86.2%de la variación en las ventas puede ser explicado por la

relación curvilínea entre las ventas (Y) y el precio (X).

También se puede calcular un coeficiente de

determinación ajustado para tomar en cuenta el número

de variables explicativas y el número de grados libertad.

En nuestro modelo de regresión curvilíneo, P = 2,

 puesto que tenemos dos variables independientes

Page 29: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 29/44

Por consiguiente, para las ventas de rasuradoras, tenemos:

Page 30: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 30/44

Prueba del Efecto Curvilineal 

Al utilizar un modelo de regresión para examinar una relación

entre dos variables, nos gustaría ajustar no sólo el modelomás preciso, sino también el más sencillo que pueda expresar

dicha relación.

En consecuencia, resulta importante examinar si existe una

diferencia significativa entre el modelo curvilíneo

y el modelo lineal

Page 31: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 31/44

Estos dos modelos pueden ser comparados mediante la determinación del efecto de regresión que se tiene al agregar

el término curvilíneo, dado que el término lineal ya ha sido incluido, esto es, )./( 1

2

1   X  X SSR  

Podemos utilizar la prueba t  para el coeficiente de regresión con el fin de determinarsi cada variable particular hace una contribución significativa al modelo de regresión

De acuerdo con el resultado obtenido con el paquete MINITAB, observamos queel error estándar de cada coeficiente de regresión y su correspondiente estadística t  

están disponibles.

Page 32: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 32/44

Podemos probar la significación de la contribución del

efecto curvilíneo con las siguientes hipótesis nula y

alternativa:

H 0  : El incluir el efecto curvilíneo no mejora significativamente el modelo ( )0( 11     .

H 1  : El incluir el efecto curvilíneo mejora significativamente el modelo )0( 11     .

Para nuestros datos:

Si se selecciona un nivel de significación de 0.05,encontramos que con doce grados de libertad, los valores

críticos son – 2.1788 y +2.1788

Page 33: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 33/44

Puesto que t   = 2.64 > t 12  =2.1788, nuestra decisión sería

rechazar H 0   y llegar a la conclusión de que el modelo

curvilíneo es significativamente mejor que el modelo lineal

en la representación de la relación entre las ventas y los precios.

Page 34: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 34/44

Prueba del Efecto Lineal 

Como en el caso del efecto curvilíneo, podemos utilizar la

prueba t  para determinar la contribución del efecto lineal

dado que el efecto curvilíneo ya se encuentra incluido en el

modelo.Para nuestros datos,

Page 35: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 35/44

Las hipótesis nula y alternativa para probar la contribución

del efecto lineal al modelo de regresión son:

0: '10      H   (La inclusión del efecto lineal no mejora el modelo de efecto curvilíneo.)

0: '

11      H   (La inclusión del efecto lineal mejora el modelo de efecto curvilíneo.)

Si se selecciona un nivel de significación de 0.05,

encontramos que con doce grados de libertad, los valorescríticos son – 2.1788 y +2.1788

Page 36: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 36/44

Modelos de Variables Ficticias 

En nuestro análisis de los modelos de regresión múltiple

efectuada hasta el momento, hemos supuesto que cada

variable explicativa (o independiente) es numérica.

Sin embargo, se tienen muchos casos en los que se necesitatomar en cuenta variables categóricas como parte del proceso

de desarrollo del modelo.

Por ejemplo, si se tiene los resultados de una Encuesta de

satisfacción de los empleados en una empresa, y utilizamos laantigüedad (en número de años) en la planta de trabajo para

desarrollar un modelo para predecir el ingreso.

Page 37: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 37/44

Además, podemos desear también incluir el efecto de

factores como el sexo de los trabajadores, si los

individuos participan en decisiones presupuestales, sitoman parte en las decisiones que afectan su trabajo y si

están orgullosos de estar trabajando para la organización.

El uso de variables ficticias   es el vehículo que nos permite tomar en consideración variables categóricas

como parte del modelo de regresión.

Si una variable independiente categórica tiene dos

categorías, entonces solamente se necesitará unavariable ficticia para representar a las dos categorías.

Page 38: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 38/44

La variable ficticia particular (X d ) se define como:

Examinemos un modelo para predecir el ingreso de los

empleados basándonos en la antigüedad en la planta de

trabajo (X 1 ) y si el individuo participa o no en decisiones

 presupuestales.

Page 39: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 39/44

Una variable ficticia correspondiente a la participación en

decisiones presupuestales (X 2  )  se define como:

Suponiendo que la pendiente entre el ingreso y laantigüedad en la planta de trabajo es la misma para ambos

grupos, el modelo de regresión puede establecerse como:

(1)

Page 40: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 40/44

iY   ingreso correspondiente al empleado i .

Page 41: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 41/44

Usando la muestra de 57 empleados cuya ocupación está

clasificada como técnica de ventas, se ajustó el modeloestablecido en la ecuación (1).

Los valores de los coeficientes de regresión de muestra

resultantes (b 0  , b 1  y b 2  )  , de los errores estándar y de t  

se resumen en la siguiente tabla:

Page 42: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 42/44

TABLA: Resumen de los Resultados para el Modelo de

Variable Ficticia

 Nombre de la variable

Coeficiente de regresión

Error estándar t

Constante

Años

Participación en decisiones

 presupuestales

13.936

0.7314

8.027

3.850

0.1759

3.341

3.62

4.16

2.40

Page 43: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 43/44

Observe lo siguiente:

1. Manteniendo constante el efecto de si el individuo

 participa en decisiones presupuestales, se estima que

cada año adicional de antigüedad en la planta de trabajo

se obtiene en promedio $731.40 en el ingreso del

empleado.

2. b 2  mide el efecto sobre el ingreso de haber participado

en decisiones presupuestales (X2 = 1) en comparación con

no haber participado en tales decisiones (X2 = 0). Por lo

tanto, manteniendo la antigüedad en la planta de trabajo

constante, estimamos que un empleado que participa endecisiones presupuestales tendrá, en promedio, un ingreso

de $8,027.00 por encima de alguien que no participa en

dichas decisiones

Page 44: Coeficiente de Determinacion Parcial

7/23/2019 Coeficiente de Determinacion Parcial

http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 44/44

Utilizando los resultados de la tabla anterior, el modelo para

estos datos puede establecerse como:

Para empleados que no participan en decisiones

 presupuestales el modelo se reduce a:

 puesto que X2 = 0

Para empleados que sí participan en decisiones

 presupuestales el modelo se reduce a:

 puesto que X2 = 1