Upload
m4gn3to
View
227
Download
0
Embed Size (px)
Citation preview
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 1/44
Coeficiente de Determinación Parcial
SEMANA 10
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 2/44
Coeficiente de Determinación Parcial
Los coeficientes son una medida de la porción de la variación
en la variable dependiente que es explicada por cada variable
explicativa, mientras se controla o se mantiene constante a las
demás variables explicativas.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 3/44
Así pues, en un modelo de regresión múltiple con dos
variables explicativas tenemos:
y también
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 4/44
en la que:
SSR(X1 / X2) = suma de cuadrados de la contribución de la
variable X1 al modelo de regresión dado que la variable X2
ha sido incluida en el modelo.
SST = suma total de cuadrados para Y
SSR(X1 y X2) = suma de cuadrados de regresión cuando las
variables X1 y X2 están incluidas en el modelo de regresión
múltiple.
SSR(X2 / X1) = suma de cuadrados de la contribución de lavariable X2 al modelo de regresión dado que la variable X1
ha sido incluida en el modelo.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 5/44
Mientras que en un modelo de regresión múltiple que
contiene varias (P ) variables explicativas, tenemos:
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 6/44
Para nuestro problema sobre el consumo de petróleo para
calefacción podemos calcular
El coeficiente de determinación parcial de la variable Ycon X1, mientras se mantiene constante X2 puede
interpretarse como que, para una cantidad fija
(constante) de aislamiento en el ático, 95.61% de la
variación en el consumo de petróleo para calefaccióndurante enero puede explicarse por la variación en la
temperatura atmosférica diaria promedio en dicho mes.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 7/44
y
El coeficiente de determinación parcial de la variable Ycon X2, mientras se mantiene constante X1 puede
interpretarse como que, para una temperatura atmosférica
diaria promedio dada (constante), 85.88% de la variación
en el consumo de petróleo para calefacción durante enero
puede ser explicada por la variación en la cantidad deaislamiento.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 8/44
El Modelo de Regresión Curvilíneo
En nuestro análisis de la regresión simple y en el de
regresión múltiple, hemos supuesto que la relación entre Y
y cada variable explicativa es lineal.
Sin embargo, existen varios tipos diferentes de relaciones
entre variables. Una de las relaciones no lineales más
comunes es la relación polinomial curvilínea entre dos
variables en la que Y aumenta (o disminuye) con una
rapidez variable para diferentes valores de X.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 9/44
Este modelo de una relación polinomial entre X y Y puede
expresarse como:
en la que:
Este modelo de regresión es parecido al modelo de
regresión múltiple con dos variables explicativas, excepto
en que la segunda variable explicativa, en este caso, es
justamente el cuadrado de la primera variable.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 10/44
La ecuación de regresión para el modelo polinomial
curvilíneo con una variable explicativa (X1) y una
variable dependiente (Y) es:
(1)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 11/44
Un planteamiento alternativo al modelo de regresión
curvilíneo expresado en la ecuación (1) consiste en centrar
los datos mediante la sustracción de la media de la variable
explicativa de cada valor del modelo.
Este modelo de regresión centrada se presenta en la
siguiente ecuación:
(2)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 12/44
Matemáticamente hablando, la ecuación (1) y la ecuación(2) son equivalentes.
La diferencia entre los dos métodos se presenta en los
términos correspondientes a la intersección y al efectolineal.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 13/44
Búsqueda de los Coeficientes de Regresión y
Predicción de Y
Con el fin de ilustrar el modelo de regresión curvilíneo,
suponga que el departamento de mercadotecnia de una
cadena grande de supermercados desea estudiar la
flexibilidad de precios de los paquetes de rasuradorasdesechables. Se seleccionó una muestra aleatoria de 15
tiendas con igual afluencia de clientes y colocación de
artículos (es decir, junto a las cajas registradoras).
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 14/44
El número de paquetes vendidos y el precio en cada tienda
se presentan en la siguiente tabla:
TABLA: Ventas y precios de paquetes de rasuradoras desechables para una
muestra de 15 tiendas
Ventas Precio (ctvos.) Ventas Precio (ctvos.)
142
151
163
168
176
91
100
107
79
79
79
79
79
99
99
99
115
126
77
86
95
100
106
99
99
119
119
119
119
119
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 15/44
Con el propósito de investigar la selección del modelo
adecuado que representa la relación entre precio y ventas,
se graficó un diagrama de dispersión en la siguiente figura:FIG.: Diagrama de dispersión del precio (X) y las ventas (Y)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 16/44
Un examen más detallado de éste nos indica que la
disminución de las ventas se nivela con un aumento de
los precios
Por consiguiente, parece que podría ser más apropiado
utilizar un modelo curvilíneo para estimar las ventas
basándose en el precio, en lugar de usar un modelo lineal.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 17/44
Ventas(Y) Precio(X1i) Precio2 1i 11i 11i
142 79 6241 -20 400151 79 6241 -20 400
163 79 6241 -20 400
168 79 6241 -20 400
176 79 6241 -20 400
91 99 9801 0 0
100 99 9801 0 0
107 99 9801 0 0115 99 9801 0 0126 99 9801 0 0
77 119 14161 20 400
86 119 14161 20 400
95 119 14161 20 400
106 119 14161 20 400
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 18/44
En la siguiente Fig. se presenta el resultado parcial obtenido
con el paquete MINITAB para los datos de nuestro ejemplo,
utilizando el modelo centrado (ecuación 2).Análisis de RegresiónLa ecuación de regresión es:
Ventas(Y) = 108 - 1.68 (X1i - media) + 0.0465 (X1i - media)sq
Predictor Coef StDev T P
Constant 107.800 5.756 18.73 0.000
(X1i - m -1.6800 0.2035 -8.26 0.000
(X1i - m 0.04650 0.01762 2.64 0.022
S = 12.87 R-Sq = 86.2% R-Sq(adj) = 83.9%
Análisis de Varianza
Source DF SS MS F P
Regression 2 12442.8 6221.4 37.56 0.000
Residual Error 12 1987.6 165.6 Total 14 14430.4
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 19/44
En la figura observamos que:
8.107"
0 b 68.1"
1 b 0465.011 b
Por consiguiente, el modelo curvilíneo centrado puede
expresarse como:
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 20/44
Para interpretar los coeficientes vemos que las ventas
disminuyen con un aumento de los precios; sin embargo,
observamos también que estas disminuciones en las ventasse nivelan o se reducen al aumentar el precio.
Esto se puede ver al predecir las ventas promedios para
paquetes con precios de 79 centavos, 99 centavos y 119
centavos ($1.19) Utilizando nuestra ecuación de regresióncurvilínea
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 21/44
para 791 i
X ,tenemos
para 991 i X , tenemos
para 1191 i X , tenemos
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 22/44
Así pues, observamos que se espera que una tienda quevende las rasuradoras en 79 centavos venda 52.2 paquetes
más que una tienda que vende las rasuradoras en 99
centavos.
Pero se espera que una tienda que las vende a 99 centavos
venda solamente 15 paquetes más que una tienda que las
venda a $1.19.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 23/44
Diagrama de dispersión que representa la relación
curvilínea entre el precio (X) y las ventas (Y)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 24/44
Prueba de la Significación del Modelo Curvilíneo
Ahora que el modelo curvilíneo ha sido ajustado a los
datos, podemos determinar si existe una relación
curvilínea significativa entre las ventas, Y, y el precio, X.
De manera parecida a la regresión múltiple, las hipótesisnula y alternativa pueden establecerse como
0: 1110 H (no existe relación entre X1 y Y)
11 : H y/o 011 (el último coeficiente de regresión no es igual a cero)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 25/44
La hipótesis nula puede ser probada utilizando una prueba
F.
Utilizando los resultados obtenidos para nuestro problema
mediante el paquete MINITAB, se tiene:
Si se selecciona un nivel de segnificación de 0.05, tenemos
que, para 2 y 12 grados de libertad, el valor crítico de ladistribución F es de 3.89
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 26/44
Se llega a la conclusión de que existe una relación
curvilínea significativa entre las ventas y el precio
de las rasuradoras.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 27/44
En el análisis de regresión curvilínea, el coeficiente de
determinación múltiple puede calcularse con la ecuación
siguiente:
De los resultados del paquete MINITAB, tenemos:
SSR = 12,442.8 y SST = 14,430.4
Así pues,
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 28/44
Este coeficiente de determinación múltiple, cuyo valor se
calculó en 0.862, puede interpretarse como que el 86.2%de la variación en las ventas puede ser explicado por la
relación curvilínea entre las ventas (Y) y el precio (X).
También se puede calcular un coeficiente de
determinación ajustado para tomar en cuenta el número
de variables explicativas y el número de grados libertad.
En nuestro modelo de regresión curvilíneo, P = 2,
puesto que tenemos dos variables independientes
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 29/44
Por consiguiente, para las ventas de rasuradoras, tenemos:
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 30/44
Prueba del Efecto Curvilineal
Al utilizar un modelo de regresión para examinar una relación
entre dos variables, nos gustaría ajustar no sólo el modelomás preciso, sino también el más sencillo que pueda expresar
dicha relación.
En consecuencia, resulta importante examinar si existe una
diferencia significativa entre el modelo curvilíneo
y el modelo lineal
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 31/44
Estos dos modelos pueden ser comparados mediante la determinación del efecto de regresión que se tiene al agregar
el término curvilíneo, dado que el término lineal ya ha sido incluido, esto es, )./( 1
2
1 X X SSR
Podemos utilizar la prueba t para el coeficiente de regresión con el fin de determinarsi cada variable particular hace una contribución significativa al modelo de regresión
De acuerdo con el resultado obtenido con el paquete MINITAB, observamos queel error estándar de cada coeficiente de regresión y su correspondiente estadística t
están disponibles.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 32/44
Podemos probar la significación de la contribución del
efecto curvilíneo con las siguientes hipótesis nula y
alternativa:
H 0 : El incluir el efecto curvilíneo no mejora significativamente el modelo ( )0( 11 .
H 1 : El incluir el efecto curvilíneo mejora significativamente el modelo )0( 11 .
Para nuestros datos:
Si se selecciona un nivel de significación de 0.05,encontramos que con doce grados de libertad, los valores
críticos son – 2.1788 y +2.1788
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 33/44
Puesto que t = 2.64 > t 12 =2.1788, nuestra decisión sería
rechazar H 0 y llegar a la conclusión de que el modelo
curvilíneo es significativamente mejor que el modelo lineal
en la representación de la relación entre las ventas y los precios.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 34/44
Prueba del Efecto Lineal
Como en el caso del efecto curvilíneo, podemos utilizar la
prueba t para determinar la contribución del efecto lineal
dado que el efecto curvilíneo ya se encuentra incluido en el
modelo.Para nuestros datos,
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 35/44
Las hipótesis nula y alternativa para probar la contribución
del efecto lineal al modelo de regresión son:
0: '10 H (La inclusión del efecto lineal no mejora el modelo de efecto curvilíneo.)
0: '
11 H (La inclusión del efecto lineal mejora el modelo de efecto curvilíneo.)
Si se selecciona un nivel de significación de 0.05,
encontramos que con doce grados de libertad, los valorescríticos son – 2.1788 y +2.1788
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 36/44
Modelos de Variables Ficticias
En nuestro análisis de los modelos de regresión múltiple
efectuada hasta el momento, hemos supuesto que cada
variable explicativa (o independiente) es numérica.
Sin embargo, se tienen muchos casos en los que se necesitatomar en cuenta variables categóricas como parte del proceso
de desarrollo del modelo.
Por ejemplo, si se tiene los resultados de una Encuesta de
satisfacción de los empleados en una empresa, y utilizamos laantigüedad (en número de años) en la planta de trabajo para
desarrollar un modelo para predecir el ingreso.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 37/44
Además, podemos desear también incluir el efecto de
factores como el sexo de los trabajadores, si los
individuos participan en decisiones presupuestales, sitoman parte en las decisiones que afectan su trabajo y si
están orgullosos de estar trabajando para la organización.
El uso de variables ficticias es el vehículo que nos permite tomar en consideración variables categóricas
como parte del modelo de regresión.
Si una variable independiente categórica tiene dos
categorías, entonces solamente se necesitará unavariable ficticia para representar a las dos categorías.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 38/44
La variable ficticia particular (X d ) se define como:
Examinemos un modelo para predecir el ingreso de los
empleados basándonos en la antigüedad en la planta de
trabajo (X 1 ) y si el individuo participa o no en decisiones
presupuestales.
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 39/44
Una variable ficticia correspondiente a la participación en
decisiones presupuestales (X 2 ) se define como:
Suponiendo que la pendiente entre el ingreso y laantigüedad en la planta de trabajo es la misma para ambos
grupos, el modelo de regresión puede establecerse como:
(1)
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 40/44
iY ingreso correspondiente al empleado i .
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 41/44
Usando la muestra de 57 empleados cuya ocupación está
clasificada como técnica de ventas, se ajustó el modeloestablecido en la ecuación (1).
Los valores de los coeficientes de regresión de muestra
resultantes (b 0 , b 1 y b 2 ) , de los errores estándar y de t
se resumen en la siguiente tabla:
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 42/44
TABLA: Resumen de los Resultados para el Modelo de
Variable Ficticia
Nombre de la variable
Coeficiente de regresión
Error estándar t
Constante
Años
Participación en decisiones
presupuestales
13.936
0.7314
8.027
3.850
0.1759
3.341
3.62
4.16
2.40
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 43/44
Observe lo siguiente:
1. Manteniendo constante el efecto de si el individuo
participa en decisiones presupuestales, se estima que
cada año adicional de antigüedad en la planta de trabajo
se obtiene en promedio $731.40 en el ingreso del
empleado.
2. b 2 mide el efecto sobre el ingreso de haber participado
en decisiones presupuestales (X2 = 1) en comparación con
no haber participado en tales decisiones (X2 = 0). Por lo
tanto, manteniendo la antigüedad en la planta de trabajo
constante, estimamos que un empleado que participa endecisiones presupuestales tendrá, en promedio, un ingreso
de $8,027.00 por encima de alguien que no participa en
dichas decisiones
7/23/2019 Coeficiente de Determinacion Parcial
http://slidepdf.com/reader/full/coeficiente-de-determinacion-parcial 44/44
Utilizando los resultados de la tabla anterior, el modelo para
estos datos puede establecerse como:
Para empleados que no participan en decisiones
presupuestales el modelo se reduce a:
puesto que X2 = 0
Para empleados que sí participan en decisiones
presupuestales el modelo se reduce a:
puesto que X2 = 1