REGRESIÓN LINEAL SIMPLE.doc

Embed Size (px)

Citation preview

CAP

CAPITULO I

REGRESIN LINEAL SIMPLE

1.1. INTRODUCCIN.

El anlisis de regresin es una rama de la teora estadstica cuyo uso est muy difundido en casi todas las disciplinas cientficas. En administracin y economa es la tcnica bsica para medir o estimar las relaciones entre variables econmicas que constituyen la esencia de la teora y la vida econmica.

En este captulo estudiaremos la relacin entre dos conjuntos de datos hasta determinar una ecuacin. Esto permitir predecir el valor de la variable dependiente Y con base en un valor de la variable independiente X.

1. Se granean los puntos de X e Y en un diagrama de dispersin.

2. Se determinar la ecuacin para la recta que mejor se ajuste a los datos.

3. Se pronosticar un valor de Y con base en un valor seleccionado de X.

4. Se medir el error en un pronstico.

5. Se establecern intervalos de confianza para los pronsticos.1.2. ANLISIS DE REGRESIN

Segn se indic en la introduccin, se desarrollar una ecuacin para expresar la relacin entre dos variables, y estimar el valor de la variable dependiente Y con base en un valor seleccionado de la variable independiente X. A la tcnica empleada para hacer estas predicciones se le denomina ANLISIS DE REGRESIN.

En el anlisis de regresin el objetivo es un modelo estadstico que se puede usar para predecir los valores de una variable dependiente (o variable respuesta Y) basada en los Valores de por lo menos una variable independiente (X). Para elegir una relacin funcional particular como la representativa de la poblacin bajo estudio generalmente se procede a realizar:

1. Una consideracin analtica del fenmeno que nos ocupa.

2. Un examen del diagrama de dispersin.

Una vez decidido el tipo de funcin matemtico que mejor se ajuste se presenta el problema de elegir una expresin particular de esta familia de funciones. Cuando la relacin funcional entre la variable dependiente Y y la variable independiente X es una lnea recta, se tiene una regresin lineal simple dada por la siguiente ecuacin:

Yi = o + 1 Xi + Ei

i = 1, 2, 3, .., N

Donde:

Y : variable dependiente.

o : coeficiente de interseccin y nos dice cual es el nivel de Y cuando

X = O

1: coeficiente de regresin poblacional, o coeficiente angular.

Ei: error o residual.

1.3. SUPOCISIONES:

A) RELATIVO A LOS ERRORES (Ei)

1. "Todo error es aleatorio y tiene media cero, E (Ei) = O, para todo i = 1, 2, 3, N

2. Todos los errores tienen la misma varianza V (Ei) =

3. Los errores son independientes, COV (ej, ej ) = 0

4. Los errores se distribuyen normalmente con media igual a cero y varianza

B) RELATIVO A LAS VARIABLES.

1. La variable Y es endgena o dependiente y la variable X es predeterminada, explicativa o independiente.

2. La variable X es fija o matemticamente no es aleatoria.

3. La variable Y es aleatoria y puede descomponerse en dos partea.

Parte exacta: = bo + b1 Xi , i = 1,2,3,....,n

Parte aleatoria: ei = error o perturbacin.

Yi = + ei

Yi = bo + b1 + b1Xi + ei

4. Los parmetros de la variable aleatoria Yi son:

MEDIA E(Yi) = o + 1 XiVARIANZA V(Yi) = E[ Yi E (Yi)] Si los errores (ei) se distribuyen normalmente entonces los Yi tambin se distribuyen normalmente.

5. No hay errores de observacin en Xi e Yi.

1.4. ESTIMACIN DE LOS PARMETROS DE REGRESIN

Si conocemos toda la poblacin de valores (Yi , Xi) es posible computar los valores exactos de los parmetros de regresin o y 1. Generalmente trabajamos con muestras, en cuyo caso el problema estadstico consiste en como estimar de la mejor manera posible los parmetros o y 1. El mtodo que ms se utiliza para ajustar una recta es el mtodo de MNIMOS CUADRADOS. La lnea de regresin de mnimos cuadrados no es necesariamente la "mejor", pero posee varas propiedades estadsticas.

Yi = o + 1 Xi + Ei , i = 1,2,.N

yx = o + 1Xi

Supongamos que bo y b1 son estimadores de o y 1

1) Yi = bo + b1 Xi +ei , i = 1,2,n

n : nmero de pares.

2) ei = Yi bo b1 Xi

En ambos miembros elevamos al cuadrado y sumamos desde 1 hasta n.

3)

4)

5)

De 5

El (-2) lo pasamos a dividir al segundo miembro y nos queda la ecuacin nmero 2.

Luego las ecuaciones (1) y (2) son las ecuaciones normales.

De la ecuacin (1) obtenemos:

De la ecuacin (2) y reemplazando la formula de bo en (2) se obtiene.

Factorizando b1 se obtiene:

S.P.XY: SUMA DEL PRODUCTO X e Y

S.C.X: SUMA DE CUADRADOS DE X

S.C.Y: SUMA DE CUADRADOS DE Y SUMA DE CUADRADOS TOTAL

1.5. ECUACIN DE REGRESIN ESTIMADA

Es una expresin matemtica que define la relacin entre dos variables.

Donde:

bo: Es la interseccin con el eje Y para todo X = 0

b1 : Pendiente de la recta de regresin, o coeficiente de regresin. Mide la variacin de la variable dependiente Y cuando la variable independiente X se incrementa en una unidad.

A continuacin se desarrollar un ejemplo que se ir explicando a travs de los tpicos de regresin y correlacin a estudiar.1. PROBLEMA:

El nmero de acciones de la empresa SANTA ANITA que variaron durante un mes y el precio al final del mes se muestran en la tabla que sigue:MOVIMIENTO(miles de acciones) PRECIO ($)

42

11

54

32

21

Y=-0.1+0.7xi1. Determinar la variable X e Y.

2. Graficar los datos mustrales en un eje de coordenadas.

3. Encontrar la ecuacin de regresin estimada.

4. Granear la ecuacin de regresin, estimada junto con la grfica de los datos observados.SOLUCIN:

1. MOVIMIENTO: X

PRECIO

: Y

SOLUCIN:

Una vez encontrado los valores de bo y b1, podemos escribir la ECUACIN DE REGRESIN ESTIMADA.

INTERPRETACINbo = - 0.1 Geomtricamente es la distancia que hay del origen de coordenadas al intercepto entre el eje Y y la ecuacin de regresin estimada.

Indica que cuando los movimientos sea igual a cero (0), el precio tendr una disminucin (-) de 0.1.b1 = 0.7 Indica que para cada cambio de aumento en el movimiento (nmero de acciones), habr incremento promedio de 0.7 en el precio (Y)

se dir que es la mejor estimacin de la lnea de regresin de la poblacin:

2. PROBLEMA PARA EL ALUMNOSupongamos que un ejecutivo de una empresa quiere establecer un presupuesto flexible para estimar sus costos para un cierto rango de produccin. Los costos y producciones pasadas se encuentran en la tabla.

a) Encuentre la recta de mnimos cuadrados que le permita estimar costos a partir de la produccin.

b) Interprete los resultados.

c) Grafique los 7 puntos y la recta de mnimos cuadrados.PRODUCCIN (x $ 10 000) 3456789

COSTOS FIJOS (x $ 10 000)1210.513121313.316.5

1.6. DESCOMPOSICIN DE LA VARIACIN TOTAL

DESVIACIN TOTAL

DESVIACIN EXPLICADA O DEBIDO A LA REGRESIN

DESVIACIN NO EXPLICADA O DEBIDO AL ERROR O RESIDUAL

DESV. TOTAL = DESV. EXPLICADA + DESV. NO EXPLICADA.

S.C. TOTAL = S. C. REGRESIN + S.C. RESIDUAL

1.7. ESQUEMA DE ANALISIS DE VARIANZA (ANVA)

Para realizar un anlisis de variaciones se debe plantear las siguientes hiptesis:Ho: 1 = 0 NO EXISTE REGRESIN LINEAL ENTRE X e Y

H1: 10 EXISTE REGRESIN LINEAL ENTRE X e Y.

FTE. DE VARIACIN GDOS. DE LIBERTAD SUMA DE CUADRADOS CUAD. MEDIOS Fc.

REGRESIN

1 Fc.

RESIDUAL

n p TOTAL n 1

n : Nmero de pares.

p : Nmero de parmetros a estimar.

Donde:

Fc = C.M. regresin / C.M.residual1. S.C. TOTAL

2. S.C. REGRESIN

3.

4. S.C. RESIDUAL S.C. TOTAL S.C. REGRESIN. Para realizar un anlisis de varianza (ANVA), se utiliza la tabla de la distribucin F, con un nivel de significancia (), dando para luego comparar con el factor Fc.

a) Si Fc. F tabular, entonces rechazamos la hiptesis nula (Ho) y por lo tanto nos queda aceptar H1, con lo cual concluiremos que EXISTE REGRESIN LINEAL ENTRE LA VARIABLE X Y LA VARIABLE Y, el siguiente caso.

b) Si Fc < F tabular, entonces aceptamos la hiptesis nula (Ho), con lo cual concluiremos que NO EXISTE REGRESIN LINEAL ENTRE LAS VARIBLES X e Y.Trabajando con los datos del problemas nmero 01

Probar si existe regresin lineal entre el movimiento y el precio.SOLUCIN:

S.C.TOTAL

S.C.REGRESIN

S.C.RESIDUAL

1. PLANTEAR LAS HIPTESISHo: 1 = 0 No existe regresin lineal entre el movimiento y el precio.

H1: 10 Existe regresin lineal entre el movimiento y el precio.

2. REALIZAR EL ANALISIS DE VARIANZA (ANVA)F.V.

S.C.

G.L.

C.M.

Fc. SIGNIFIC.

REGRESIN 4.9

1

4.9 13.36 *

RESIDUAL 1.1 3 0.36667

TOTAL 6 4

Se busca en la tabla de la distribucin F. con los niveles de significancia de 1% y 5%, es decir:

3. REGIN CRTICAF(1,3) 0.01 = 34.1

Y F(1,3) 0.05 = 10.1

Como Fc. = 13.36 > 10.1, pero 13.36 < 34.1, entonces rechazamos Ho, para = 5% mas no para = 1%.

4. CONCLUSIN:Como Fc. = 13.36 es mayor que Ft= 10.1, entonces rechazamos Ho, y concluimos que existe regresin lineal entre la variable movimiento y el precio en formas significativa (*).

1.8. INTERVALOS DE CONFIANZA (I.C.)

bi : Estimador

i : Parmetro Sbi : Desv. Estand. Del Estimador.

A) PARA (o)

I.C. (o) = bot(n-2)Sbo

Donde.

Con los datos de nuestro problema:

Encontrar los intervalos de confianza para o con 95% de probabilidad.

Solucin: 1-= 0.95

= 0.05

INTERPRETACIN

Existe una probabilidad del 95% de que el verdadero valor del parmetro o est comprendido entre esos valores,

Existe un 95% de probabilidad de que este intervalo encierre al parmetro o de la lnea de regresin de la poblacin.

A) PARA (1)

I.C. (1) = b1 t (n 2) Sb1Donde:

INTERPRETACIN:

Existe un 95% de confianza de que este intervalo encierre al verdadero parmetro o coeficiente de regresin 1 de la lnea de regresin de la poblacin.

1.9. INTERVALO DE CONFIANZA PARA y.x. PARA UN VALOR DE Xo

Donde:

, remplazando Xi por Xo

PARA NUESTRO PROBLEMA: Encontrar el intervalo de confianza para y.x. con 95% de confianza, para Xo = 4 500 acciones, es decir (4.5).

Solucin:

Y = - 01 + 0.7 (4.5) = 3.05

t(3)0.025 = 3.182

INTERPRETACIN: Este intervalo de confianza nos indica que si los nmeros de acciones (movimientos) fueron de (4.5) 4 500, existe un 95% de confianza que los valores encontrados del intervalo encierre al verdadero precio promedio.

1.10. PREDICCIN DE UN VALOR PARTICULAR DE Y PARA UN VALOR DADO DE X.Una vez encontrado la ecuacin de regresin estimada podemos dar uso a esta ecuacin para los siguientes casos:

1. Predecir el precio al final del mes.

2. Construir un intervalo de prediccin para Y dado un valor X.

Donde:

PARA NUESTRO PROBLEMA

Encuentre un intervalo de prediccin del 95% para el precio que experimentar la empresa el prximo mes, si el movimiento es de 4 500 acciones.

SOLUCIN:

Interpretacin: Si se tiene muchos movimientos de acciones iguales a 4 500, existe un 95% de confianza de que el verdadero valor del precio se encuentre entre 0.75 y 5.35 dlares.

1.11. PRUEBAS DE HIPTESIS.

A) PARA o

1. Plantar las hiptesis. Ho : o = 0

H1 : o 0 2. Fijar el nivel de significancia : = 0.01 = 0.05

3. Se usa la prueba t.4. Regiones crticas.

Rechazamos Ho si:

si

Si H1: o > 0

Rechazamos Ho, si tct(n-2)

Si H1: o < 0

Rechazamos Ho, si tc - t(n-2)

5. Clculo de tc

6. Conclusin B) PARA (COEFICIENTE DE REGRESIN)

1. Plantear las hiptesis. Ho : = 0 H1 : 0

2. Fijar el nivel de significancia : = 0.01 = 0.05

3. Se usa la prueba t.

4. Regiones crticas.

Rechazamos Ho si :

si

Si H1: 1 > 0

Rechazamos Ho, si tct(n-2)

Si H1: 1 < 0

Rechazamos Ho, si tc - t(n-2)

5. Clculo de tc.

6. Conclusin:PARA NUESTRO PROBLEMA: Determinar si existe evidencias que indique que difiere de cero (0) al utilizar una relacin lineal entre el movimiento y el precio.

SOLUCIN:

1. Ho: = 0no hay regresin lineal entre x e y H1: 0si hay regresin lineal entre x e y2.

3. Usar la prueba t.

4. Regiones crticas.

5. Clculo de tc.

6. Conclusin:

Como tc.> t tabulado, entonces tc pertenece a la Regin de Rechazo (R.R.) por lo tanto rechazamos la hiptesis nula Ho, y concluimos que existe evidencias que indica que los movimientos proporcionan informacin para prediccin del precio de las acciones en cada mes.1.12. PRUEBA DE HIPTESIS PARA 1. Ho:

H1: 2.

3. Usar la prueba t.

4. Regiones crticas.

Si , entonces tc pertenece a la regin de rechazo, por lo tanto RECHAZAMOS Ho

5. Clculo de tc.

6. Conclusin: PARA NUESTRO EJEMPLO: Deseamos probar que por cada mil acciones de aumento en los movimientos, en cada mes, el precio aumenta en un dlar.SOLUCIN:

1. Ho:

H1: 2.

3. Usar la prueba t.

4. Regiones crticas.

Si , entonces tc pertenece a la regin de rechazo, por lo tanto RECHAZAMOS Ho

5. Clculo de tc.

7. Conclusin: Como tc pertenece a la R.A. aceptamos la Ho y concluimos que existe evidencias de que el precio aumentara en un dlar por cada mil acciones de aumento en las acciones.1.13. PRUEBA DE HIPTESIS PARA y.x1. Ho: a

H1: a

2.

3. Usar la prueba t.

4. Regiones crticas.

Si , entonces tc pertenece a la regin de rechazo, por lo tanto RECHAZAMOS Ho

5. Clculo de tc.

6. Conclusin

PARA NUESTRO PROBLEMA: Deseamos comprobar que el promedio de los precios es de 3 dlares cuando es de 5 000 acciones.

SOLUCION.

1. Ho: 3

H1: 3

2.

3. Usar la prueba t.

4. Regiones crticas.

5. Clculo de tc.

Y = - 0.1 + 0.7 (5) = 3.4

8. Conclusin: Como tc. = 1.01 < t(3) 0.025 = 3.182, entonces tc pertenece a la regin de aceptacin, por lo tanto aceptamos la hiptesis nula (Ho) y concluimos que el promedio del precio es de 3 dlares cuando los movimientos son en promedio de 5 00 acciones.1.14. ANLISIS DE CORRELACIN

El anlisis de correlacin es la herramienta estadstica de que nos valemos para describir el grado de relacin que existe entre dos variables x y.

Los estadsticos han inventado dos medidas para describir la correlacin entre dos variables y ellos son:

1. EL COEFICIENTE DE DETERMINACIN y

2. EL COEFICIENTE DE CORRELACIN.

EL COEFICIENTE DE DETERMINACIN (p2)

r2 : COEFICIENTE DE DETERMINACIN MUESTRAL

El coeficiente de determinacin es la manera primaria de medir el grado o fuerza, de la relacin que existe entre dos variables, X e Y.

Los valores de los coeficientes de determinacin poblacional y muestral estn comprendidos entre cero (0) y uno (1) inclusive, o tambin podemos decir entre 0% y 100%.

El coeficiente de determinacin muestral se calcula utilizando la siguiente formula:

r2: Mide la variacin total explicada por la regresin. Mide exclusivamente la fuerza de una relacin lineal entre dos variables (X e Y)

El mtodo abreviado para calcular r2 es:

EL COEFICIENTE DE CORRELACIN ()

El coeficiente de correlacin es la segunda medida con que puede describirse la eficacia con que una variable es explicada por otra. Cuando estamos trabajando con muestras, el coeficiente muestral de correlacin se denota r y es la raz cuadrada del coeficiente muestral de determinacin.

El valor de r est comprendido entre -1 y 1 inclusive, es decir:

a) Si No existe correlacin lineal entre X e Y

b) Si

c) Si

d) Si r = 1Todos los puntos se encuentran en la lnea recta

e) r = -1

PARA NUESTRO PROBLEMA: Calcular e interpretar el coeficiente de correlacin para los datos del movimiento y el precio de las acciones.

SOLUCIN:

Calcular el coeficiente de determinacin.

INTERPRETACIN:

1) Indica que el 81.7% de los cambios en los precios (Y) se asocian a los cambios en los movimientos (X), resultando un 18.3% de variabilidad que no es explicada por la regresin.

2) La ecuacin de regresin explica alrededor del 81.7% de la variacin total en el precio, y el 18.3% restante se atribuye a factores incluidos en el trmino del error o residual.

1.15. PRUEBA DE HIPTESIS PARA EL COEFICIENTE DE CORRELACIN POBLACIONAL SIMPLE.

1. Ho: p = 0 NO EXISTE CORRELACIN ENTRE X E Y.

Ho: p 0 EXISTE CORRELACIN ENTRE X E Y.

2. Nivel de significancia = 0.01 = 0.05

3. Usamos la distribucin t.

4. Regiones crticas.

5. Clculo de t.

6. Conclusin

PARA NUESTRO PROBLEMA:

Probar si existe correlacin lineal entre el movimiento y el precio. Usar un nivel se significancia del 5%.

SOLUCIN:

1. Ho: = 0

NO EXISTE CORRELACIN LINEAL ENTRE X E Y.

Ho: 0

EXISTE CORRELACIN LINEAL ENTRE X E Y.

2. Nivel de significancia = 0.01 = 0.05

3. Usamos la distribucin t.

4. Regiones crticas.

5. Clculo de tc:

6. Conclusin: Como tc > tt, entonces rechazamos Ho y concluimos que existe evidencia estadstica para indicar que el precio y el movimiento estn correlacionados.PROBLEMAS DE REGRESIN LINEAL SIMPLE Y CORRELACIN SIMPLE

1. Con los siguientes datos:X : 13 16 14 11 17 9 13 17 18 12

Y : 1.0 2.0 1.4 0.8 2.2 0.5 1.1 2..8 3.0 1.2

a) Grafique el diagrama de dispersin.

b) Desarrolle la ecuacin de estimacin que mejor describa los datos.

c) Determine Y para X = 10, 15, 20

d) Probar s existe regresin lineal entre X e Y, = 1% Y 5%. Usar la prueba F y T.

e) Calcular el error estndar de estimacin.

f) Calcule el intervalo de prediccin, con 95% de nivel de confianza, para la variable dependiente cuando X = 20.

g) Encontrar los intervalos de confianza para y con 95 % de confianza e interpretar sus resultados.

h) Encontrarlos intervalos de confianza para y.x para un valor de X = 10, con 95% de confianza.

i) Encontrar los intervalos de confianza para. para un valor de X = 15, con 95 % de seguridad,

j) Probar si por cada unidad de aumento en X la variable Y aumenta en 4 unidades.

Usar un nivel de significancia de 5%.

k) Probar si Y es 2.5 cuando X = 20, usar un nivel de significancia de 5%.

l) Calcular el coeficiente de correlacin y determinacin.

m) Probar si existe correlacin lineal entre X e Y.

2. En economa, la funcin demanda de un producto se estima a menudo calculando la regresin de la cantidad vendida (Q) sobre el precio (P). Una empresa est tratando de estimar dicha funcin para su nueva mueca "Mary" y a recabado los siguientes datos:

P 10.0 4.7 8.5 8.0 4.5 4.0 3.0 2.0

Q 100 150 128 120 162 170 180 200

a) Grafique los datos anteriores.

b) Calcule la lnea de regresin de mnimos cuadrados.

c) Interprete el valor de coeficiente de regresin.

d) Determinar los residuales y construya una grfica de los residuales con respecto a los valores ajustados del precio.

e) Utilizar la ecuacin de regresin que se encontr en (b), y estime el precio cuando la cantidad es igual a 220.

f) Probar si existe regresin lineal entre e! precio y la cantidad .Utilizar un nivel de significancia del 5%, utilizar la prueba F y la prueba T.

g) Determinar el intervalo de confianza para e! coeficiente de regresin, con 95% de seguridad.

h) Determinar el intervalo de confianza para el intercepto con 99% de seguridad.

i) Calcular el coeficiente de correlacin simple entre el precio y la cantidad.

j) Calcular e interpretar el coeficiente de determinacin.

k) Probar si la correlacin entre X e Y es significativa usar la prueba T, nivel de significancia 1 y 5%.

l) Encontrar los intervalos de confianza para y.x, cuando el precio es de 5.0, con 99% de seguridad.

m) Probar si por cada unidad de aumento en el precio, la cantidad disminuye en 9 muecas. Usar un nivel de significancia del 5 %. .

n) Probar si la cantidad vendida de muecas es de 175 cuando el precio es de 4,0 usar un nivel de significancia del 5 %.3. En la contabilidad de costos, con frecuencia se trata de estimar los gastos indirectos basndose en el nmero de unidades producidas. La gerencia de la empresa, en el problema 1, ha reunido informacin sobre estos gastos y las unidades producidas en diferentes plantes y le gustara estimar una ecuacin de regresin para predecir los gastos indirectos en el futuro.

GASTOS INDIRECTOS 191 170 272 155 280 173 234 116 153

UNIDADES 40 42 53 35 56 39 48 30 37

a) Prediga el gasto general cuando se producen 50 unidades.

b) Interprete el valor del coeficiente de regresin.

c) Probar s existe regresin lineal entre los gastos indirectos y las unidades, = 0.05 y 0.01. Usar la prueba F y la prueba T.

d) Determinar e interpretar los intervalos de confianza para bo, y b1 con 95% de seguridad.

e) Calcular el coeficiente de correlacin simple entre los gastos indirectos y las unidades.

f) Calcular e interpretar el coeficiente de determinacin.

g) Probar s la correlacin entre X e Y es significativa. Usar prueba T. = 0.05

4. Con los siguientes datos de una muestra:

a) Calcular los estimadores de bo y b1.

b) Calcular la varianza de los estimadores bo y b1.

c) Explicar el significado de los estimadores.

d) Hallar el coeficiente determinacin y el coeficiente de correlacin.

e) Es significativa la influencia de X sobre Y al 95 % de confianza?5. Con los siguientes datos:

AO

2005 2006 2007 2008 2009INGRESO

8 9 10 11 12

AHORRO

3 2 4 5 6

a) Hallar la funcin que explique el fenmeno.

b) Hallar la desviacin estndar de cada estimador.

c) Probar si el ingreso influye sobre el ahorro con 5% de significancia.

d) Hallar e interpretar el coeficiente de determinacin.

e) Estimar el ahorro cuando el ingreso es de 15.6. Se tiene inters en examinar la tasa de matrimonios y de divorcios por miles de habitantes en Tingo Mara. Las tasas para 8 aos, segn informes del INEI son:AO 2002 2003 2004 2005 2006 2007 2008 2009TASA DE MATRI 10.0 10.3 10.4 12.2 9.3 9.3 10.1 10.2

TASA DE DIVOR. 0.8 1.5 1.7 3.5 2.3 2.5 4.9 5.0

a) trace un diagrama de dispersin localizando la tasa de matrimonio en el eje X y la tasa de divorcios en el eje Y.

b) Determine la ecuacin de regresin.

c) Probar s existe regresin lineal entre las tasas de matrimonio y de divorcios, = 0.01 y 0.05 Interpretacin.

d) Calcularlos intervalos de confianza para bo y b1, con 95% de confianza.

e) Calcular e interpretar los coeficientes de correlacin y determinacin.

f) Calcular el error estndar de estimacin.

g) Probar si existe correlacin lineal entre X e Y, = 5 %

7. En el departamento de produccin de una empresa se desea examinar la relacin entre el nmero de obreros que arman un subensamble y el nmero de subensambles producidos.

Como experimento, a dos empleados se les asign armar el subensamble. Produjeron 15 durante un periodo de una hora. Despus se dedicaron a armarlo 4 empleados. Produjeron 25 subensambles durante un periodo de una hora. El conjunto completo de pares de observaciones es como sigue.

N DE OBREROS 2 4 1 5 3

PRODUCCIN 15 25 10 40 30

a) Trace un diagrama de dispersin.

b) Determine la ecuacin de regresin.

c) Si contamos con tres ensambladores, Cul es la produccin pronosticada por hora?

d) Probar si existe regresin lineal entre el nmero de obreros y la produccin, con los niveles de significancia de 1% y 5%. D su conclusin.

e) Encontrar intervalos de confianza para el coeficiente de regresin con el 95% de confianza.

f) Probar mediante la prueba T si la variable Y no esta relacionado linealmente con la variable X, usar = 0.05.

g) Probar si por cada obrero adicional en el nmero de obreros, la produccin aumenta, en 8 unidades, usar = 0.05.

h) Calcular e interpretar el coeficiente de determinacin.

i) Calcular e interpretar el coeficiente de correlacin.

j) Probar si existe correlacin lineal, entre el nmero de obreros y la produccin, usar un nivel de significancia del 5 %.

VALORES CRTICOS DE LA DISTRIBUCIN F

NIVEL DE SIGNIFICANCIA DE 5% (0.05)

GRADOS DE LIBERTAD DEL MUNERADOR

G.L.

DENOM.1234567

1161200218225230234237

218.51919.218.218.319.319.4

310.19.558.289.129.018.948.89

47.716.948.596.398.266.168.09

56.615.795.415.195.054.954.88

65.885.144.764.534.394.284.21

75.594.744.354.123.973.873.79

85.324.484.073.843.693.583.5

95.124.283.863.633.483.373.29

104.964.13.713.433.333.223.14

114843.883.593.383.23.093.01

124.753.883.493.283.1132.81

134.673.813.413.183.032.922.83

144.83.143.343.113.962.852.76

154.543.883.293.082.92.792.71

VALORES CRTICOS DE LA DISTRIBUCIN F

NIVEL DE SIGNIFICANCIA DE 1% (0.01)

GRADOS DE LIBERTAD DEL MUNERADOR

G.L.

DEL DENOM.1234567

14 0525 0005 4035 8255 764 5 8595 928

298.59999.299.299.399.399.4

334.130.829.528.728.227.927.7

421.21816.71615.515.215

516.313.312.111.41110.710.5

613.710.89.739.158.758.478.26

712.28.558.457.857.467.196.99

811.38.857.597.016.336.376.18

910.68.026.996.426.065.85.61

101070586.555.995.645.385.2

119.857.216.225.875.325.074.89

129.338.935.955.415.064.824.84

139.076.75.745.214.664.624.44

148.866.515.565.044.74.464.28

158.866.385.424.894.564.324.14

DISTRIBUCIN T DE STUDENT

G.L.NIVEL DE SIGNIFICACIN PARA PRUEBAS DE UNA COLA

0.10.050.0250.010.0050.0005

NIVEL DE SIGNIFICACIN PARA PRUEBAS DE DOS COLAS

0.,20,10,050,020,010,001

13.0786.31412.70631.82163.657636.619

21.8862.9204.3036.9656.92531.598

31.6382.3533.1824.5415.84112.941

41.5332.1322.7763.7474.6048.610

51.4762.0152.5713.3654.0326.859

61.4401.9432.4473.1433.3075.959

71.4151.8952.3652.9983.4995.405

81.3971.8602.3062.8963.3555.041

91.3831.8332.2622.8213.2504.781

101.3721.8122.2282.7643.1694.587

111.3631.7962.2012.7183.1064.437

121.3561.7822.1792.6813.0554.318

131.3501.7712.1602.6503.0124.221

141.3451.7612.1452.6242.9774.140

1513411.7532.1312.6022.9474.073

GLOSARIO

ALFA (). Probabilidad de un error de tipo I.

ANLISIS DE VARIANCIA (ANYA o - ANOVA). Tcnica estadstica con que se prueba la igualdad de 3 ms medias mustrales y que, por tanto, permite hacer inferencias sobre si las muestras provienen de poblaciones que tienen la misma media.

ANLISIS DE CORRELACIN. Tcnica con que se determina el grado de relacin

Lineal que hay entre, variables.

BETA ( ) Probabilidad de un error de tipo II.

COEFICIENTE DE CORRELACIN. Raz cuadrada del coeficiente de determinacin. Su signa indica la direccin de la relacin entre dos variables, directa o inversa.

COEFICIENTE DE DETERMINACIN. Medida de la proporcin de variacin de Y, la variable independiente; que se explica con la lnea de regresin; esto es, por la relacin de las Y con la variable independiente.

DISTRIBUCIN t DE STUDENT. Familia de distribuciones de probabilidad que se distinguen por sus grados individuales de libertad, son de forma semejante a la distribucin normal y se emplean cuando la desviacin estndar de la poblacin no conoce y el tamao de la muestra es relativamente pequea (n30).

DISTRIBUCIN F. Familia de distribuciones diferenciadas por dos parmetros (g.1 del numerador y que g.1 del denominador); se usan fundamentalmente para probar hiptesis referentes a las variancias.

DIAGRAMA DE DISPERSIN. Grfica de puntos sobre una rejilla, rectangular; las coordenadas X e Y de cada punto corresponden a las dos mediciones hechas en algn elemento particular de la muestra, y el patrn de puntos indica la relacin existente entre las dos variables.

ECUACIN DE ESTIMACIN. Frmula matemtica que relaciona la variable desconocida con las variables conocidas es el anlisis de regresin.

ERROR ESTNDAR DE ESTIMACIN. Medida de la confiabilidad de la ecuacin de estimacin, que indica la variabilidad de los puntos observados alrededor de la lnea de regresin; es decir, hasta qu punto los valores observados difieren de los predichos en la Inea de regresin.

ERROR ESTNDAR DEL COEFICIENTE DE REGRESIN. Medida de la variabilidad de los coeficientes de regresin de la muestra alrededor del verdadero coeficiente de regresin de la poblacin.

ERROR DE TIPO I. Rechazo de una hiptesis nula cuando es verdadera.

ERROR DE TIPO II. Aceptacin de una hiptesis nula cuando es falsa.

ESTIMACIN. Valor especfico observado de un estimador.

ESTIMACIN POR INTERVALO. Gama de valores que se usan para estimar el parmetro de una poblacin desconocida.

ESTIMACIN PUNTUAL." Nmero individual que sirve para estimar un parmetro de una poblacin desconocida.

ESTIMADOR. Estadstico muestral que se utiliza para estimar el parmetro de una

Poblacin.

GRADOS DE LIBERTAD (G.L.) Nmero de valores de una muestra que podemos especificar libremente, una vez que sepamos algo de ella.

HIPTESIS. Suposicin, o conjetura, que hacemos sobre un parmetro de la poblacin.

HIPTESIS ALTERNATIVA (Ha H1). Conclusin que aceptamos cuando los datos no apoyan la hiptesis nula (Ho).

HIPTESIS NULA (Ho). Hiptesis o suposicin, acerca de un parmetro de la poblacin que deseamos probar, generalmente una suposicin del status que (situacin actual)

INTERVALO DE CONFIANZA. Gama de valores que tienen alguna probabilidad especificada de incluir el verdadero valor del parmetro de la poblacin.

INTERSECCIN EN Y. Constante d cualquier recta, cuyo valor representa el valor de la variable Y cuando la variable X tiene un valor de cero (0).

LMITES DE CONFIANZA. Los lmites superior e inferior de un intervalo de confianza.

LNEA DE REGRESIN.- Lnea ajustada a un conjunto de puntos de datos para estimar la relacin entre dos variables.

NIVEL DE CNTIANZA.- Probabilidad que los estadsticos asocian a una estimacin por intervalo del parmetro de una poblacin; indica la confianza de que la estimacin por intervalo incluya el parmetro de la poblacin.

MTODO DE MNIMOS CUADRADOS. Tcnica con que se ajusta una recta mediante un conjunto de puntos, de manera que se minimice la suma de los cuadrados de las distancias verticales entre n puntos y la lnea.

NIVEL DE SIGNIFICANCIA. Valor que indica el porcentaje de los valores mustrales que se haya fuera de ciertos lmites suponiendo que la hiptesis nula sea correcta, esto es, la probabilidad de rechazarla cuando es verdadera.

PENDIENTE. Constante de cualquier recta, cuyo valor representa en qu medida el cambio de cada unidad de la variable independiente modifica la variable dependiente.

PODER DE LA PRUEBA DE HIPTESIS. Probabilidad de rechazar la hiptesis nula cuando es falsa; es decir, una medida de la eficacia con que funciona la prueba de hiptesis.

PRUEBA DE DOS EXTREMOS (COLAS). Prueba de hiptesis en la cual se rechaza la hiptesis nula (Ho), s el valor muestral es significativamente mayor o menor que el supuesto valor del parmetro de la poblacin; prueba que incluye dos regiones de rechazo.

RAZN F. Aquella que se utiliza en l anlisis de varianca, entre otras pruebas, para comparar la magnitud de dos estimaciones de la variancia de la poblacin y determinar si ambas estimaciones son aproximadamente iguales; en el anlisis de varianca, se emplea la razn de la variancia entre columnas con la variancia dentro de columnas.

REGRESIN. Proceso general de predecir una variable a partir de otra con medios estadsticos, usando datos anteriores.

REGRESIN MLTIPLE. Procedimiento estadstico en virtud del cual algunas variables se usan para predecir otra variable.

RELACIN CURVILNEA. Nexo de dos variables que es descrito por una lnea curva.

RELACIN DIRECTA. Relacin entre dos variables en la cual, al aumentar el valor de la variable independiente, tambin aumenta el de la variable dependiente.

RELACIN INVERSA.- Relacin entre dos variables en la cual, al aumentar la variable independiente disminuye, la variable dependiente.

RELACIN LNEAL.- Tipo particular de asociacin entre dos variables, que puede ser descrita matemticamente con una recta.

VARIABLE DEPENDIENTE (Y). Aquella que estamos tratando de predecir en el anlisis de regresin.

VARIABLE INDEPENDIENTE (X). La variable variables, conocidas en el anlisis de regresin.

_1189259409.unknown

_1364133889.unknown

_1364741359.unknown

_1364741780.unknown

_1364816943.unknown

_1364817441.unknown

_1364817749.unknown

_1364819469.unknown

_1425564861.unknown

_1364818350.unknown

_1364819429.unknown

_1364817491.unknown

_1364817244.unknown

_1364817392.unknown

_1364817022.unknown

_1364742617.unknown

_1364816539.unknown

_1364816555.unknown

_1364816169.unknown

_1364816491.unknown

_1364741862.unknown

_1364742188.unknown

_1364741836.unknown

_1364741551.unknown

_1364741645.unknown

_1364741701.unknown

_1364741621.unknown

_1364741469.unknown

_1364741519.unknown

_1364741407.unknown

_1364135359.unknown

_1364136993.unknown

_1364137348.unknown

_1364741151.unknown

_1364741338.unknown

_1364137430.unknown

_1364741065.unknown

_1364137543.unknown

_1364137415.unknown

_1364137303.unknown

_1364137341.unknown

_1364137284.unknown

_1364136374.unknown

_1364136774.unknown

_1364136862.unknown

_1364136623.unknown

_1364136711.unknown

_1364136086.unknown

_1364136153.unknown

_1364136212.unknown

_1364135975.unknown

_1364134355.unknown

_1364134666.unknown

_1364134705.unknown

_1364134521.unknown

_1364134042.unknown

_1364134087.unknown

_1364134172.unknown

_1364133941.unknown

_1189319308.unknown

_1189355409.unknown

_1189357830.unknown

_1364133635.unknown

_1364133760.unknown

_1364133817.unknown

_1364133695.unknown

_1189363240.unknown

_1189365291.unknown

_1189369468.unknown

_1364133605.unknown

_1364133620.unknown

_1189369579.unknown

_1189370060.unknown

_1189369497.unknown

_1189365715.unknown

_1189365801.unknown

_1189365340.unknown

_1189364640.unknown

_1189364808.unknown

_1189365149.unknown

_1189364743.unknown

_1189363344.unknown

_1189364527.unknown

_1189363265.unknown

_1189361483.unknown

_1189362523.unknown

_1189363138.unknown

_1189362368.unknown

_1189362429.unknown

_1189362444.unknown

_1189361866.unknown

_1189361272.unknown

_1189361381.unknown

_1189360877.unknown

_1189357005.unknown

_1189357286.unknown

_1189357549.unknown

_1189357641.unknown

_1189357522.unknown

_1189357155.unknown

_1189357221.unknown

_1189357141.unknown

_1189356789.unknown

_1189356848.unknown

_1189356890.unknown

_1189355635.unknown

_1189356229.unknown

_1189356264.unknown

_1189355563.unknown

_1189345690.unknown

_1189355028.unknown

_1189355291.unknown

_1189355352.unknown

_1189355272.unknown

_1189355011.unknown

_1189343579.unknown

_1189345039.unknown

_1189343310.unknown

_1189261078.unknown

_1189262659.unknown

_1189277362.unknown

_1189277686.unknown

_1189267434.unknown

_1189262369.unknown

_1189262530.unknown

_1189262327.unknown

_1189260289.unknown

_1189260504.unknown

_1189260629.unknown

_1189260399.unknown

_1189259670.unknown

_1189259933.unknown

_1189259480.unknown

_1189244044.unknown

_1189256847.unknown

_1189257357.unknown

_1189259142.unknown

_1189259269.unknown

_1189258124.unknown

_1189257020.unknown

_1189257169.unknown

_1189256950.unknown

_1189244372.unknown

_1189244623.unknown

_1189244987.unknown

_1189244500.unknown

_1189244153.unknown

_1189244215.unknown

_1189244130.unknown

_1189242351.unknown

_1189243521.unknown

_1189243982.unknown

_1189244027.unknown

_1189243959.unknown

_1189242540.unknown

_1189243499.unknown

_1189242368.unknown

_1189237851.unknown

_1189240335.unknown

_1189241264.unknown

_1189238891.unknown

_1189236334.unknown

_1189236831.unknown

_1189236267.unknown