225
Diseño de experimentos Índice General Conceptos básicos de Inferencia Estadística 1 Conceptos básicos de Inferencia Estadística. 1.1 Objetivos de la Inferencia Estadística. 1.2 Inferencia Estadística. Conceptos básicos. 1.3 Contraste o test de hipótesis. Definiciones. 1.3.1 Definiciones básicas. 1.3.2 Pasos a seguir en la realización de un contraste de hipótesis. 1.3.3 Tipos de Error en un contraste de hipótesis. 1.3.4 Nivel crítico y región crítica. 1.3.5 Potencia de un contraste. 1.3.6 Algunos contrastes paramétricos importantes. Teoría de Diseño de Experimentos 2 Principios básicos del diseño de experimentos. 2.1 Introducción. 2.2 Tipos de variabilidad. 2.3 Planificación de un experimento. 2.4 Tres principios básicos. 2.5 Algunos diseños experimentales clásicos. 2.5.1 Diseño completamente aleatorizados. 2.5.2 Diseño en bloques o con un factor bloque. 2.5.3 Diseños con dos o más factores bloque. 2.6 Ejemplos Reales. 3 Diseños con una fuente de variación. 3.1 Introducción. 3.2 Modelo matemático (diseño completamente aleatorizado). 3.3 Estimación de los parámetros.

Principios Bas Doe

Embed Size (px)

Citation preview

Captulo 2

Diseo de experimentos

ndice GeneralConceptos bsicos de Inferencia Estadstica

1 Conceptos bsicos de Inferencia Estadstica. 1.1 Objetivos de la Inferencia Estadstica. 1.2 Inferencia Estadstica. Conceptos bsicos. 1.3 Contraste o test de hiptesis. Definiciones. 1.3.1 Definiciones bsicas. 1.3.2 Pasos a seguir en la realizacin de un contraste de hiptesis. 1.3.3 Tipos de Error en un contraste de hiptesis. 1.3.4 Nivel crtico y regin crtica. 1.3.5 Potencia de un contraste. 1.3.6 Algunos contrastes paramtricos importantes.

Teora de Diseo de Experimentos

2 Principios bsicos del diseo de experimentos. 2.1 Introduccin. 2.2 Tipos de variabilidad. 2.3 Planificacin de un experimento. 2.4 Tres principios bsicos. 2.5 Algunos diseos experimentales clsicos. 2.5.1 Diseo completamente aleatorizados. 2.5.2 Diseo en bloques o con un factor bloque. 2.5.3 Diseos con dos o ms factores bloque. 2.6 Ejemplos Reales.

3 Diseos con una fuente de variacin. 3.1 Introduccin. 3.2 Modelo matemtico (diseo completamente aleatorizado). 3.3 Estimacin de los parmetros. 3.3.1 Estimadores por mxima-verosimilitud. 3.3.2 Estimadores por mnimo-cuadrticos. 3.3.3 Estimacin puntual de la varianza. 3.4 Anlisis de la varianza de una va. 3.4.1 Idea general. 3.4.2 Descomposicin de la variabilidad. 3.5 Inferencia de los parmetros del modelo. 3.5.1 Intervalos de confianza de los parmetros. 3.5.2 Contrastes. 3.5.3 Contrastes mltiples. 3.6 Efectos aleatorios. 3.6.1 El modelo matemtico de un factor aleatorio. 3.6.2 Contraste de igualdad de los efectos tratamiento.

4 Chequeo y validacin del modelo con un factor. 4.1 Hiptesis estructurales del modelo. 4.2 Bondad del ajuste del modelo. 4.3 Normalidad de los errores. 4.4 Homocedasticidad de los errores. 4.5 La familia de transformaciones de Box-Cox. 4.6 Homogeneidad de los errores. Datos atpicos. 4.7 Independencia de los errores. 4.7.1 Grficos para detectar dependencia. 4.7.2 Contrastes para detectar dependencias. 4.8 Contraste de Kruskal-Wallis. Alternativa no paramtrica al Anova.

5 Diseos con dos o ms factores. 5.1 Concepto de bloque. 5.2 Modelo de diseo en bloques completamente aleatorizados. 5.2.1 Modelo matemtico. 5.2.2 Estimacin de los parmetros. 5.2.3 Anlisis de la varianza. 5.2.4 Anlisis de residuos. 5.3 La interaccin entre factores. 5.4 Modelos de dos factores-tratamiento. 5.4.1 Modelo matemtico. 5.4.2 Estimacin de los parmetros. 5.4.3 Descomposicin de la variabilidad 5.4.4 Diseo factorial con tres factores. 5.5 Fracciones factoriales. El cuadrado latino. 5.5.1 El cuadrado latino. 5.5.2 Extensiones de los modelos de diseos experimentales.

6 Chequeo y diagnosis del modelo de regresin lineal simple. Anlisis de residuos. 6.1 Problemas al ajustar un modelo de regresin lineal simple. 6.2 La hiptesis de linealidad. Transformaciones. 6.3 Anlisis de residuos. Grficos. 6.3.1 Residuos. Tipos. 6.3.2 Grficos de residuos. 6.4 Observaciones atpicas y observaciones influyentes. 6.4.1 Valor de influencia. 6.4.2 El estadstico D de Cook. 6.5 Las hiptesis bsicas. 6.5.1 La hiptesis de normalidad. 6.5.2 La hiptesis de homocedasticidad. 6.5.3 La hiptesis de independencia. 7 Modelo de regresin lineal mltiple. 7.1 Regresin Lineal General: el modelo matemtico 7.2 Estimacin de los parmetros del modelo. 7.3 Interpretacin geomtrica. 7.4 Propiedades de los estimadores. 7.4.1 El estimador mnimo-cuadrtico de los parmetros de la recta. 7.4.2 El estimador de la varianza. 7.4.3 Intervalos de confianza para los parmetros de la recta. 7.4.4 Teorema de Gauss-Markov. 7.5 El Anlisis de la Varianza. 7.5.1 El contraste conjunto de la F. 7.5.2 Contrastes individuales de la F. 7.6 Correlacin. 7.6.1 Coeficiente de correlacin mltiple. 7.6.2 Correlacin Parcial 7.7 Prediccin en el Modelo de Regresin Lineal Mltiple. 7.7.1 Estimacin de las medias condicionadas. 7.7.2 Prediccin de una observacin.

8 Modelos de regresin lineal mltiple. Diagnosis y validacin. 8.1 Problemas en el ajuste de un modelo de regresin lineal mltiple. 8.2 Multicolinealidad. 8.3 Anlisis de residuos. Grficos. 8.4 Hiptesis de normalidad. 8.5 Hiptesis de homocedasticidad. 8.6 Hiptesis de independencia. 8.7 Anlisis de influencia. Observaciones atpicas. 8.7.1 Influencia a priori. 8.7.2 Influencia a posteriori. 8.8 Error de especificacin. 8.9 Seleccin de variables regresoras. 8.10 Criterios para la eleccin de un modelo de regresin. 8.11 Resumen de los modelos de regresin lineal.

Teora de Regresin Lineal

9 El modelo de regresin lineal simple. 9.1 Introduccin a los modelos de regresin.Objetivos. 9.2 Clasificacin de los modelos de regresin. 9.3 El modelo de regresin lineal simple. 9.3.1 Formulacin matemtica del modelo. 9.3.2 Estimacin de los parmetros del modelo. 9.3.3 Propiedades de los estimadores. 9.4 Interpretacin geomtrica del modelo. 9.5 Contrastes sobre los parmetros del modelo. El contraste individual de la t. 9.6 Tabla ANOVA del modelo de regresin lineal simple. El contraste de regresin. 9.7 El contraste de linealidad. 9.8 Coeficiente de determinacin. Coeficiente de correlacin. 9.9 Prediccin en regresin lineal simple. 9.9.1 Estimacin de las medias condicionadas. 9.9.2 Prediccin de una observacin. 9.10 Modelo de regresin lineal con regresor estocstico.

10 Otros modelos de regresin importantes. 10.1 Estimacin por mnimos cuadrados generalizados. 10.1.1 Heterocedasticidad. 10.1.2 Observaciones dependientes. 10.2 Estimacin robusta. 10.3 Estimacin polinmica. 10.4 Regresin con variables regresoras cualitativas. 10.5 Regresin con variable respuesta binaria. 10.6 Regresin contrada (ridge regression) 10.7 Regresin no lineal.

1.1 Objetivos de la Inferencia Estadstica.El objetivo de la Estadstica es medir y modelar la variabilidad del proceso mediante un modelo probabilstico.

Para modelar la variabilidad de una variable aleatoria si slo se dispone del conocimiento de una muestra de la misma se sigue el siguiente modo de actuacin:

1. Planteamiento del problema.

2. Seleccin de la muestra (Muestreo estadstico), en algunos estudios la muestra se obtiene por simulacin (Simulacin Estadstica)

3. Estudio descriptivo de la muestra, analtico y grfico (Estadstica Descriptiva).

4. En base al conocimiento de los modelos probabilsticos ms utilizados y teniendo en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teora de la Probabilidad).

5. Estimar los parmetros del modelo supuesto a partir de las observaciones muestrales utilizando los mtodos de Inferencia Estadstica: estimacin puntual, estimacin por intervalos de confianza y contrastes de hiptesis paramtricos.

6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hiptesis supuestas en el estudio, por ejemplo, que las observaciones muestrales son independientes, que no existen observaciones errneas,...,etc. Para ello se utilizan los mtodos de Inferencia no Paramtrica.

7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el proceso desde el paso 4.

Si se obtiene ms informacin se puede mejorar el conocimiento de la variabilidad de la variable de inters. Puede hacerse por los siguientes medios: Mejorar la estimacin de los parmetros del modelo, utilizando mtodos estadsticos ms eficaces.

Aumentando el tamao muestral.

Reducir la variabilidad controlando la variabilidad sistemtica que puede ser debida a factores que influyen en la variable en estudio o controlando otras variables relacionadas con la variable de inters y que explican en mayor o menor medida su comportamiento. Para ello es necesario disponer de informacin adicional a la de la propia variable de inters, y tener datos de los factores y/o variables explicativas que influyen en ella.

Este texto se estudian los modelos estadsticos que estudian una variable utilizando su relacin con otras variables y/o factores. En particular se estudiarn los dos modelos estadsticos ms importantes y utilizados en la prctica, El Diseo de Experimentos, que estudia la variabilidad de la variable de inters controlando los factores que pueden influir en la misma.

LosModelos de Regresin, que estudian la variabilidad de la variable de inters teniendo en cuenta la relacin funcional de la misma con otras variables explicativas.

1.2 Inferencia Estadstica. Conceptos bsicos.Puede definirse la Inferencia Estadstica como

El conjunto de mtodos estadsticos que permiten deducir (inferir) como se distribuye la poblacin en estudio o las relaciones estocsticas entre varias variables de inters a partir de la informacin que proporciona una muestra.

Para que un mtodo de inferencia estadstica proporcione buenos resultados debe de: Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente validada.

Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao suficiente.

Conceptos bsicos que se utilizarn en este texto son los siguientes: Poblacin: es un conjunto homogneo de individuos sobre los que se estudia una o varias caractersticas que son, de alguna forma, observables.

Muestra: es un subconjunto de la poblacin. El nmero de elementos de la muestra se denomina tamao muestral.

Muestreo aleatorio simple: es aquel en el que todos los individuos de la poblacin tienen la misma probabilidad de ser elegidos.

Muestra aleatoria simple, de una variable aleatoria X, con distribucin F, de tamao n, es un conjunto de n variables aleatorias X1,X2,...,Xn, independientes e igualmente distribudas (i.i.d.) con distribucin F.

Espacio muestral: es el conjunto de muestras posibles que pueden obtenerse al seleccionar una muestra aleatoria, de tamao n, de una cierta poblacin.

Parmetro: es cualquier caracterstica medible de la funcin de distribucin de la variable en estudio (media, varianza,..).

Estadstico: es una funcin de la muestra T. Por tanto, es una variable aleatoria que tiene una funcin de distribucin que se denomina distribucin en el muestreo de T. Los estadsticos independientes del parmetro a estimar se denominan estimadores.

Propiedades de los estimadores.

Sea n = n un estimador del parmetro . Propiedades del estimador son las siguientes

1. Estimador centrado o insesgado, tiene sesgo cero,

2. Estimador asintticamente centrado o insesgado, verifica

3. Error Cuadrtico Medio de n, es

4. Estimador consistente en media cuadrtica, verifica

5. La precisin o eficacia del estimador n es

Si el estimador es insesgado

6. Estimador de la media poblacional, se utiliza la media muestral definida por

(1.1)7. Si X sigue una distribucin N, se verifica que

(1.2)8. Estimador de la varianza poblacional, se utiliza la cuasivarianza muestral definida por

(1.3)9. Si X sigue una distribucin N, se verifica que

(1.4)10. Dado que normalmente la varianza poblacional se desconoce y es necesario estimarla, es de inters el siguiente resultado

(1.5)

1.3 Contraste o test de hiptesis. Definiciones.1.3.1 Definiciones bsicas.Un contraste o test de hiptesis es una tcnica de Inferencia Estadstica que permite comprobar si la informacin que proporciona una muestra observada concuerda (o no) con la hiptesis estadstica formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hiptesis formulada.

Una hiptesis estadstica es cualquier conjetura sobre una o varias caractersticas de inters de un modelo de probabilidad.

Un hiptesis estadstica puede ser: Paramtrica: es una afirmacin sobre los valores de los parmetros poblacionales desconocidos. Las hiptesis paramtricas se clasifican en

Simple: si la hiptesis asigna valores nicos a los parmetros ( = 1'5, = 10, X = Y ,...).

Compuesta: si la hiptesis asigna un rango de valores a los parmetros poblacionales desconocidos ( > 1'5, 5 < < 10, X < Y ,...).

No Paramtrica: es una afirmacin sobre alguna caracterstica estadstica de la poblacin en estudio. Por ejemplo, las observaciones son independientes, la distribucin de la variable en estudio es normal, la distribucin es simtrica,...

La hiptesis que se contrasta se denomina hiptesis nula y, normalmente, se denota por H0. Si se rechaza la hiptesis nula es porque se asume como correcta una hiptesis complementaria que se denomina hiptesis alternativa y se denota por H1.

1.3.2 Pasos a seguir en la realizacin de un contraste de hiptesis.Al realizar cualquier contraste de hiptesis estadstico se deben seguir las siguientes etapas:

1. Plantear el contraste de hiptesis, definiendo la hiptesis nula (H0, hiptesis que se desea contrastar), y la hiptesis alternativa (H1, cualquier forma de negacin de la hiptesis nula ).

2. Definir una medida de discrepancia entre la informacin que proporciona la muestra () y la hiptesis H0. Esta medida de discrepancia

(1.6)

3. se denomina estadstico del contraste y ser cualquier funcin de los datos muestrales y de la informacin de la hiptesis nula . La medida de discrepancia debe seguir una distribucin conocida cuando H0 sea cierta, de forma que se pueda distinguir entre: una discrepancia grande, la que tiene una probabilidad muy pequea de ocurrir cuando H0 es cierto.

una discrepancia pequea, la que tiene una probabilidad grande de ocurrir cuando H0 es cierta.

4. Decidir que valores de d se consideran muy grandes, cuando H0 es cierto, para que sean atribuibles al azar. sto es, decidir que discrepancias se consideran inadmisibles cuando H0 es correcto, lo que equivale a indicar el valor delnivel de significacin, que se denota por . 5. Tomar la muestra (), calcular el valor del estadistico asociado a la muestra (valor crtico del contraste) y analizar:

Si es pequeo (pertenece a la regin de aceptacin), entonces se acepta la hiptesis H0.

Si es grande (pertenece a la regin de rechazo), entonces se rechaza la hiptesis H0.1.3.3 Tipos de Error en un contraste de hiptesis.Al realizar un contraste se puede cometer uno de los dos errores siguientes: Error tipo I, se rechaza la hiptesis nula H0 cuando es cierta.

Error tipo II, se acepta la hiptesis nula H0 cuando es falsa.

Situacin real:

H0 es ciertaH0 es falsa

ACEPTAR H0CORRECTOERROR II

Decisin: RECHAZAR H0ERROR I CORRECTO

Tabla1.1:Situaciones posibles en un contraste de hiptesis.

Debe tenerse en cuenta que slo se puede cometer uno de los dos tipos de error y, en la mayora de las situaciones, se desea controlar controlar la probabilidad de cometer un error de tipo I.

Se denomina nivel de significacin de un contraste a la probabilidad de cometer un error tipo I, se denota por y, por tanto,

(1.7)

Fijar el nivel de significacin equivale a decidir de antemano la probabilidad mxima que se est dispuesto a asumir de rechazar la hiptesis nula cuando es cierta. El nivel de significacin lo elige el experimentador y tiene por ello la ventaja de tomarlo tan pequeo como desee (normalmente se toma = 0'05, 0'01 o 0'001). La seleccin de un nivel de significacin conduce a dividir en dos regiones el conjunto de posibles valores del estadstico de contraste: La regin de Rechazo, con probabilidad , bajo H0.

La regin de Aceptacin, con probabilidad 1 - ,bajo H0.

Si el estadstico de contraste toma un valor perteneciente a la regin de aceptacin, entonces no existen evidencias suficientes para rechazar la hiptesis nula con un nivel de significacin y el contraste se dice que estadsticamente no es significativo. Si, por el contrario, el estadstico cae en la regin de rechazo entonces se asume que los datos no son compatibles con la hiptesis nula y se rechaza a un nivel de significacin . En este supuesto se dice que el contraste es estadsticamente significativo.

Por tanto, resolver un contraste estadstico es calcular la regin de aceptacin y la regin de rechazo y actuar segn la siguiente regla de decisin:

Se obtiene la muestra = y se calcula el estadstico del contraste .

(1.8)

Segn la forma de la regin de rechazo, un contraste de hiptesis, paramtrico o no, se denomina Contraste unilateral o contraste de una cola es el contraste de hiptesis cuya regin de rechazo est formada por una cola de la distribucin del estadstico de contraste, bajo H0.

Contraste bilateral o contraste de dos colas es el contraste de hiptesis cuya regin de rechazo est formada por las dos colas de la distribucin del estadstico de contraste, bajo H0.

Figura 1.2. Contraste bilateral. H0 : = 0, H1 : 0.

Figura 1.3. Contraste unilateral H0 : > 0, H1 : < 0.En la resolucin de un problema de test de hiptesis qu parmetro que no se controla?

El error de tipo II. Se desconoce la probabilidad de aceptar la hiptesis nula cuando es falsa.

Si, simultneamente, se desea controlar la probabilidad de error de tipo I y la probabilidad de error de tipo II ((1)) se debe especificar el tamao muestral que se est dispuesto a asumir. sto es, si se quiere controlar el porcentaje de veces que se detecta la hiptesis alternativa (que se denota = 1) cuando es cierta, que en trminos de probabilidad se denota por

es necesario calcular el tamao muestral n adecuado para garantizar que ambas probabilidades de error sean las fijadas.

Obviamente existe una relacin entre los tres parmetros (n, y ()), conocidos dos de ellos se puede obtener el tercero:

n, tamao muestral,

, probabilidad de error de tipo I,

(), probabilidad de error de tipo II.

1.3.4 Nivel crtico y regin crtica.Si el contraste de hiptesis se va estudiar con una nica muestra y no de forma repetida y sistemtica, se puede utilizar una filosofa alternativa y ms informativa que se basa en los conceptos de nivel crtico y regin crtica.

Se denomina nivel crtico o p-valor a la probabilidad p de obtener una discrepancia con H0 mayor o igual que el valor crtico cuando H0 es correcto.

(1.9)La regin crtica es el conjunto de valores para los cuales d es mayor o igual que el valor crtico d . por tanto

Figura 1.7. Nivel crtico. Contraste unilateral sobre la media con = 0'84.

Comentarios: 1. El nivel crtico slo puede calcularse una vez tomada la muestra, obtenindose niveles crticos distintos para cada muestra.

2. El nivel crtico p puede interpretarse como un nivel mnimo de significacin en el sentido de que niveles de significacin iguales o superiores al p - valor llevarn a rechazar la hiptesis nula.

Por tanto, cuanto menor sea el p - valor mayor es el grado de incompatibilidad de la muestra con H0, lo que lleva a rechazar H0.

3. El clculo del nivel crtico no proporciona de modo sistemtico una decisin entre H0 y H1.

4. En las Figuras 1.7 (y 1.8) pueden verse representados el nivel crtico y la regin crtica en un contraste unilateral (y bilateral) acerca de la media, bajo la hiptesis de normalidad.

1.3.5 Potencia de un contraste.Para medir la bondad de un contraste de hiptesis se utiliza el concepto de potencia del contraste. Considrese que se est estudiando un contraste de hiptesis acerca del parmetro , siendo la hiptesis nula

frente a la hiptesis alternativa

Se denomina potencia al nivel del estadstico de contraste d a la funcin que asigna a cada valor del parmetro la probabilidad de rechazar H0 cuando es correcto.

Esto es,

donde

(1.10)

Comentarios: 1. Al grafo de la potencia se lo denomina curva de potencia. En algunos textos se trabaja con la funcin curva caracterstica de operacin definida por

(1.11)

2. Si denotamos por a la probabilidad de error de tipo I, se verifica que

Cuanto ms lejana se encuentra la alternativa H1 de H0 menor es la probabilidad de incurrir en un error tipo II () y, por consiguiente, la potencia tomar valores ms prximos a 1.

3. Si la potencia en la hiptesis alternativa es siempre muy prxima a 1 entonces se dice que el estadstico de contraste es muy potente para contrastar H0 ya que en ese caso las muestras sern, con alta probabilidad, incompatibles con H0 cuando H1 sea cierta.

Por tanto puede interpretarse la potencia de un contraste como su sensibilidad o capacidad para detectar una hiptesis alternativa.

4. Fijado un nivel de significacin , un contraste d1 se dicems potente que otro d2 para contrastar la hiptesis nula H0 si

(1.12)

5. En la Figura 1.9. se representa la funcin de potencia del contraste H0 : = 0 frente a la alternativa H1 : 0 (contraste bilateral), bajo la hiptesis de normalidad, con = 0'10 y tamao muestral n = 100. En la Figura 1.10. se representa la funcin de potencia del contraste H0 : < 0 frente a la alternativa H1 : > 0 (contraste unilateral), bajo la hiptesis de normalidad, con = 0'10 y tamao muestral n = 100.

Figura 1.9. Funcin de Potencia. Contraste bilateral acerca de la media.

Figura 1.10. Funcin de Potencia. Contraste unilateral acerca de la media.

1.3.6 Algunos contrastes paramtricos importantes.Se exponen en esta seccin algunos de los estadsticos de contraste ms importantes para contrastar hiptesis nulas del tipo H0 : = 0, siendo un parmetro desconocido y de cuyo valor depende la distribucin de una variable de inters X. Contrastes sobre la media. A partir de una muestra extrada de una poblacin X normal con media y varianza 2 desconocidas, se desea contrastar la hiptesis nula

El estadstico de contraste es

(1.13)donde es la desviacin tpica muestral corregida . Si H0 es cierto

Contrastes sobre la varianza. Sea la muestra aleatoria simple extrada de una poblacin X normal con varianza 2, se desea contrastar

El estadstico de contraste es

(1.14)Si H0 es cierto

Contrastes sobre la igualdad de varianzas. Sean dos muestras aleatorias simples e obtenidas de dos poblaciones X e Y, con distribuciones respectivas N y N. Se desea contrastar

El estadstico de contraste es

(1.15)Si H0 es cierto

Contrastes sobre la diferencia de medias, muestras independientes e igualdad de varianzas. Sean dos muestras aleatorias simples e obtenidas de dos poblaciones X e Y, con distribuciones N y N. Por tanto se supone que X2 = Y 2 = 2. Se desea contrastar

El estadstico de contraste es

(1.16)siendo

(1.17)un estimador insesgado eficiente de la varianza que se calcula a partir de la informacin que proporcionan ambas muestras. Si H0 es cierto se verifica que

Contrastes sobre la diferencia de medias, muestras independientes y varianzas desiguales. Sean dos muestras aleatorias simples e obtenidas de dos poblaciones X e Y, con distribuciones respectivas N y N,y no puede suponerse que X2 = Y 2. Para contrastar

El estadstico de contraste que se utiliza es

(1.18)Si H0 es cierto se verifica que

siendo g = n + m - 2 + , con un trmino de correccin (ver Cao y otros (2001)).

Contrastes sobre la diferencia de medias, muestreo apareado. En este caso las dos muestras aleatorias simples tienen igual tamao muestral e y son obtenidas al realizar dos observaciones Xi e Y i sobre el mismo individuo, el i-simo. Por la naturaleza del muestreo apareado las dos muestras son dependientes. Para eliminar este problema se estudia la variable diferencia Z = Y - X, por tanto, a partir de las dos muestras iniciales se calcula la muestra de diferencias , Zi = Xi - Y i. Para contrastar la hiptesis

Se utiliza el siguiente estadstico de contraste

(1.19)Si H0 es cierto

Captulo2Principios bsicos del diseo de experimentos.2.1 Introduccin.La adquisicin de conocimientos nuevos viene condicionada por dos elementos esenciales: la ocurrencia de algn hecho diferente de lo habitual,

la circunstancia de que este hecho se produzca en presencia de una persona capaz de identificarlo como extrao, reflexionar sobre l y, lo que es ms difcil, extraer consecuencias.

La experimentacin se basa en reproducir artificialmente estas dos circunstancias. Se trata de forzar la aparicin de circunstancias extraas en presencia de personas especialmente preparadas para interpretar y extraer conclusiones de lo que ocurra.

En una investigacin de tipo emprico es natural que repitiendo un experimento, en condiciones indistinguibles para el experimentador, los resultados presenten variabilidad.

La metodologa del Diseo de Experimentos estudia cmo variar deliberadamente las condiciones habituales de un proceso emprico para aumentar la probabilidad de detectar cambios significativos en la respuesta y obtener as un conocimiento ms profundo sobre el comportamiento del proceso.

Tpicamente, un experimento se realiza por una o varias de las siguientes razones: determinar las principales causas de variacin en la respuesta,

encontrar las condiciones experimentales que permiten alcanzar un valor extremo en la respuesta,

comparar las respuestas en diferentes niveles de observacin de variables controladas,

obtener un modelo matemtico que permita predecir respuestas futuras.

Pero, es realmente necesario planificar experimentos? no se podran obtener las mismas conclusiones analizando convenientemente los datos disponibles?

Puede resultar peligroso analizar datos que no proceden de una adecuada planificacin experimental aunque tambin se puede aprender de los estudios realizados a partir de datos recogidos por observacin, de forma aleatoria y no planificada. Si no se toman las debidas precauciones, en los estudios derivados de la observacin muestral, hay un alto riesgo de cometer los siguientes errores en el anlisis estadstico:

inconsistencia de los datos;

rango de variables limitado;

variables altamente correlacionadas: confusin de efectos;

variables altamente correlacionadas: relacin no causal (variable oculta).

2.2 Tipos de variabilidad.Los resultados de cualquier experimento estn sometidos a tres tipos de variabilidad:

Variabilidad sistemtica y planificada. (deseable)

Es el tipo de variabilidad que se intenta identificar con el diseo estadstico. Incluye la posible dispersin de los resultados debida a diferencias sistemticas entre las distintas condiciones experimentales impuestas en el diseo por expreso deseo del experimentador.

Cuando este tipo de variabilidad est presente y tiene un tamao importante, se espera que las respuestas tiendan a agruparse formando grupos (clusters).

Variabilidad tpica de la naturaleza del problema y del experimento. (tolerable)

Esta es la variabilidad debida al ruido aleatorio, trmino que incluye a la componente de variabilidad no planificada denominada error de medida.

Es una variabilidad impredecible e inevitable pero, si el experimento ha sido bien planificado, ser posible estimar (medir) su tamao, lo que ser de utilidad para establecer conclusiones.

Variabilidad sistemtica y no planificada. (amenaza con el desastre)

Tiene lugar cuando, debido a causas desconocidas y no planificadas en el experimento, se produce una variacin sistemtica en los resultados. En otras palabras, los resultados estn siendo sesgados sistemticamente por causas desconocidas. Esta variabilidad supone la principal causa de conclusiones errneas y estudios incorrectos.

Como se ver posteriormente existen dos estrategias principales para tratar este tipo de varibilidad: la aleatorizacin y la tcnica de bloques.2.3 Planificacin de un experimento.Las tcnicas de Diseo de Experimentos se basan en estudiar simultaneamente los efectos de todos los factores de inters, son ms eficaces y proporcionan mejores resultados con un menor coste.

A continuacin se enumeran las acciones que deben ser ejecutadas secuencialmente en una correcta planificacin de un diseo experimental y se introducen algunos conceptos bsicos en el anlisis del Diseo de Experimentos.

1.- Definir los objetivos del experimento.

Hacer una lista con las cuestiones concretas a las que debe dar respuesta el experimento. Solo se indicarn las cuestiones esenciales ya que problemas colaterales pueden complicar innecesariamente el experimento.

2.- Identificar todas las posibles fuentes de variacin.

Una fuente de variacines cualquier cosa que pueda generar variabilidad en la respuesta. Se distinguen dos tipos: aquellas cuyo efecto sobre la respuesta es de particular inters para el experimentador (factores tratamiento) y aquellas que no son de inters directo pero que se contemplan en el diseo para reducir la variabilidad no planificada (factores nuisance).

(i) Factores y sus niveles.

Se denomina factor tratamiento a cualquier variable cuyo posible efecto sobre los datos desea ser investigado. Los niveles de un factor tratamiento sern los tipos o grados especficos del factor que se utilizarn en el experimento.

Los factores tratamiento pueden ser cualitativos o cuantitativos.

Ejemplos de factores cualitativos y sus niveles respectivos son los siguientes: proveedor (diferentes proveedores de una materia prima), tipo de mquina (diferentes tipos o marcas de mquinas), trabajador (los trabajadores encargados de hacer una tarea), tipo de procesador ( los procesadores de los que se quiere comparar su velocidad de ejecucin), ....

Ejemplos de factores cuantitativos son: tamao de memoria (diferentes tamaos de memoria de ordenadores), droga (distintas cantidades de la droga), la temperatura (conjuntos de temperaturas seleccionadas en unos rangos de inters), ...

Cuando en un experimento se trabaja con ms de un factor, cada observacin es una medida en las condiciones determinadas por la combinacin de niveles de los distintos factores tratamiento. Los diseos en que existen observaciones de todas las posibles combinaciones de niveles (tratamiento) se denominan experimentos factoriales.

(ii) Unidades experimentales.

Son el material donde evaluar la variable respuesta y al que se le aplican los distintos niveles de los factores tratamiento. Por ejemplo: en informtica, ordenadores, pginas web, buscadores de internet; en agricultura, parcelas de tierra; en medicina, individuos humanos u animales; en industria, lotes de material, trabajadores, mquinas, __

(iii) Factores nuisance: bloques, factores ruido y covariables.

En cualquier experimento, adems de los factores tratamiento, cuyo efecto sobre la respuesta se quiere evaluar, tambin influyen otros factores, de escaso inters en el estudio, pero cuya influencia sobre la respuesta puede aumentar significativamente la variabilidad no planificada. Con el fin de eliminar esta influencia pueden incluirse en el diseo nuevos factores que, atendiendo a su naturaleza, pueden ser de diversos tipos.

En algunos casos el factor nuisance puede ser fijado en distintos niveles, de modo que es posible controlar su efecto a esos niveles: se mantiene constante su nivel para un grupo de unidades experimentales, se cambia a otro nivel para otro grupo y as sucesivamente. Estos factores se denominan factores de bloqueo y las unidades experimentales evaluadas en un mismo nivel del bloqueo se dice que pertenecen al mismo bloque. Incluso cuando el factor nuisance no es medible, a veces es posible agrupar las unidades experimentales en bloques de unidades similares: parcelas de tierra contiguas o perodos de tiempo prximos probablemente conduzcan a unidades experimentales ms parecidas que parcelas o perodos distantes.

Otras veces el factor nuisance es una propiedad cuantitativa de las unidades experimentales que puede ser medida antes de realizar el experimento (el tamao de un fichero informtico, la presin sangunea de un paciente). El factor se denomina entonces covariable y juega un papel importante en el anlisis estadstico.

Por ltimo, si el experimentador est interesado en la variabilidad de la respuesta cuando se modifican las condiciones experimentales, entonces los factores nuisance son incluidos deliberadamente en el experimento y no se aisla su efecto va el bloqueo. Se habla entonces de factores ruido.

Las posibles fuentes de variacin del experimento son:

Fuente Tipo

Debida a las condiciones de inters(Factores tratamiento)

Planificada y sistemtica

Debida al resto de condiciones controladas(Factores nuisance)

Planificada y sistemtica

Debida a condiciones no controladas (error de medida, material experimental,... )

No planificada, pero sistemtica?

3.- Elegir una regla de asignacin de las unidades experimentales a las condiciones de estudio (tratamientos).

La regla de asignacin, o diseo experimental, especifica que unidades experimentales se observarn bajo cada tratamiento.

4.- Especificar las medidas que se realizarn (la respuesta), el procedimiento experimental y anticiparse a las posibles dificultades.

Los datos que se recogen en un experimento son medidas de una variable respuesta o variable de inters. Es importante precisar de antemano cul ser esta variable y en qu unidades se medir.

Tambin es conveniente determinar con claridad la forma en que se harn las mediciones: instrumentos de medida, disponibilidad de stos, momento en que se tomarn, etc.

5.- Ejecutar un experimento piloto.

Un experimento piloto es un mini-experimento que utiliza un nmero pequeo de observaciones. El objetivo de su ejecucin es ayudar a completar y chequear la lista de acciones a realizar. Ventajas que proporciona este paso son las siguientes:

* permite practicar la tcnica experimental e identificar problemas no esperados en el proceso de recogida de datos,

* si es suficientemente grande puede ayudar a seleccionar un modelo adecuado al experimento principal,

* los errores experimentales observados en el experimento piloto pueden ayudar a calcular el nmero de observaciones que se precisan en el experimento principal, etc.

6.- Especificar el modelo.

El modelo matemtico especificado debe indicar la relacin que se supone que existe entre la variable respuesta y las principales fuentes de variacin identificadas en el paso 2. Dado que las tcnicas analticas que se utilizarn dependen de la forma del modelo, es importante que ste se ajuste a la realidad con la mayor precisin posible.

El tipo de modelo ms habitual es el lineal:

En este modelo la respuesta viene dada por una combinacin lineal de trminos que representan las principales fuentes de variacin planificada ms un trmino residual debido a las fuentes de variacin no planificada. El experimento piloto puede ayudar a comprobar si el modelo se ajusta razonablemente bien a la realidad.

Un modelo se denomina modelo de efectos fijos si los niveles de todos los factores han sido seleccionados por el experimentador. Es apropiado cuando el inters se centra en comparar el efecto (denominado efecto fijo) sobre la respuesta de esos niveles especficos.

Sin embargo, si un factor tiene un nmero excesvamente grande de niveles, es razonable incluir en el experimento tan slo una muestra aleatoria simple de los mismos. El efecto de ese factor se denomina efecto aleatorio. En este caso se est interesado en examinar la variabilidad de la respuesta debida a la poblacin entera de niveles del factor.

Un modelo con todos los factores de efectos aleatorios se denomina modelo de efectos aleatorios. Y los modelos en que se combinan factores de efectos fijos con factores de efectos aleatorios se denominan modelos mixtos.

7.- Esquematizar los pasos del anlisis estadstico.

El anlisis estadstico a realizar depender de: los objetivos indicados en el paso1, el diseo seleccionado en el paso3 y su modelo asociado que se habr especificado en el paso5.

Ahora es el momento de esquematizar los pasos del anlisis, incluyendo las estimaciones, contrastes e intervalos de confianza que se calcularn. Finalmente, el anlisis debe incluir un completo ejercicio de diagnosis y crtica del grado de ajuste del modelo a la realidad.

8.- Determinar el tamao muestral.

Calcular el nmero de observaciones que se deben tomar para alcanzar los objetivos del experimento.

9.- Revisar las decisiones anteriores. Modificar si es necesario.

Casi siempre es el proceso de recogida de datos la tarea que mayor tiempo consume, pero es importante realizar una planificacin previa, detallando los pasos anteriores, lo que garantizar que los datos sean utilizados de la forma ms eficiente posible.

Ningn mtodo de anlisis estadstico, por sofisticado que sea, permite extraer conclusiones correctas en un diseo de experimentos mal planificado.

Recprocamente, debe quedar claro que el anlisis estadstico es un paso ms, completamente integrado en el proceso de planificacin: El anlisis estadstico no es un segundo paso independiente de la tarea de planificacin. Es necesario comprender la totalidad de objetivos propuestos antes de comenzar con el anlisis. Si no se hace as, tratar que el experimento responda a otras cuestiones a posteriori puede ser (lo ser casi siempre) imposible.

Pero no slo los objetivos estn presentes al inicio del anlisis sino tambin la tcnica experimental empleada. Una regla de oro en la experimentacin es No invertir nunca todo el presupuesto en un primer conjunto de experimentos y utilizar en su diseo toda la informacin previa disponible.

Por ltimo, Toda persona implicada en la ejecucin del experimento y en la recoleccin de los datos debe ser informada con precisin de la estrategia experimental diseada.

Se finaliza esta seccin resumiendo la terminologa comn de los modelos de diseo de experimentos, algunos de estos trminos han sido comentados anteriormente: Unidad experimental: son los objetos, individuos, intervalos de espacio o tiempo sobre los que se experimenta.

Variable de inters o respuesta: es la variable que se desea estudiar y controlar su variabilidad.

Factor: son las variables independientes que pueden influir en la variabilidad de la variable de inters.

Niveles: cada uno de los resultados de un factor. Segn sean elegidos por el experimentador o elegidos al azar de una amplia poblacin se denominan factores de efectos fijos o factores de efectos aleatorios.

Tratamiento: es una combinacin especfica de los niveles de los factores en estudio.

Observacin experimental: es cada medicin de la variable respuesta.

Tamao del Experimento: es el nmero total de observaciones recogidas en el diseo.

Diseo Equilibrado o Balanceado: es aquel en el que todos los tratamientos son asignados a un nmero igual de unidades experimentales.

2.4 Tres principios bsicos.Existen tres principios bsicos que se deben tener siempre en cuenta al planificar un experimento: El principio de aleatorizacin.

El bloqueo.

La factorizacin del diseo.

Aleatorizar: Todos aquellos factores no controlados por el experimentador en el diseo experimental y que puden influir en los resultados sern asignados al azar a las unidades experimentales.

Por qu aleatorizar? Transforma la variabilidad sistemtica no planificada en variabilidad no planificada o ruido aleatorio. En otros trminos: previene contra la introduccin de sesgos en el experimento.

Evita la dependencia entre observaciones.

Valida muchos de los procedimientos estadsticos ms comunes.

Bloquear: Dividir o particionar las unidades experimentales en grupos llamados bloques de modo que las observaciones realizadas en cada bloque se realicen bajo condiciones experimentales lo ms parecidas posibles.

A diferencia de lo que ocurre con los factores tratamiento, el experimentador no est interesado en investigar las posibles diferencias de la respuesta entre los niveles de los factores bloque.

Por qu bloquear? Convierte la variabilidad sistemtica no planificada en variabilidad sistemtica planificada.

Cmo elegir los bloques?

Bloquear es una buena estrategia siempre y cuando sea posible dividir las unidades experimentales en grupos de unidades similares. En ocasiones los principios de aleatorizacin y de bloqueo son incompatibles

Ejemplo.

Investigar las posibles diferencias en la produccin de dos mquinas, cada una de las cuales debe ser manejada por un operario.

Aleatorizar: seleccionar al azar dos grupos de operarios y asignar, al azar, cada grupo de operarios a las mquinas y evaluar la produccin de las mismas.

Bloquear: introducir el factor bloque operario. Se elige un grupo de operarios y todos ellos utilizan las dos mquinas.

Diseo Factorial: Estrategia experimental que consiste en cruzar los niveles de todos los factores tratamiento en todas las combinaciones posibles.

Ventajas de los diseos factoriales: Permiten detectar la existencia de efectos interaccin entre los niveles de factores tratamiento distintos.

Es una estrategia ms eficiente que la estrategia clsica de examinar la influencia de un factor manteniendo constantes los dems.

2.5 Algunos diseos experimentales clsicos.Un diseo experimental es una regla que determina la asignacin de las unidades experimentales a los tratamientos. Aunque los experimentos difieren unos de otros en muchos aspectos, existen diseos estndar que se utilizan con mucha frecuencia.

2.5.1 Diseo completamente aleatorizados.El experimentador asigna las unidades experimentales a los tratamientos al azar, con la nica restriccin del nmero de observaciones que se tomarn en cada tratamiento.

Sea ni el nmero de observaciones en el i-simo tratamiento, i = 1,...,I. Entonces, los valores n1,n2,...,nI, determinan por completo las propiedades estadsticas del diseo.

Naturalmente, este tipo de diseo se utiliza en experimentos que no incluyen factores bloque.

El modelo matemtico es de la forma:

2.5.2 Diseo en bloques o con un factor bloque.El experimentador agrupa las unidades experimentales en bloques, a continuacin determina la distribucin de los tratamientos en cada bloque y, por ltimo, asigna al azar las unidades experimentales a los tratamientos dentro de cada bloque.

En el anlisis estadstico de un diseo en bloques, stos se tratan como los niveles de un nico factor de bloqueo, aunque en realidad puedan venir definidos por la combinacin de niveles de ms de un factor nuisance.

El modelo matemtico es:

El diseo en bloques ms simple es el llamado Diseo en Bloques Completos en el que cada tratamiento se observa el mismo nmero de veces en cada bloque.

Un diseo en bloques completos con una nica observacin por cada tratamiento se denomina Diseo en Bloques Completamente Aleatorizado o, simplemente, Diseo en Bloques Aleatorizado.

Cuando el tamao del bloque es inferior al nmero de tratamientos no es posible observar la totalidad de tratamientos en cada bloque y se habla entonces de Diseo en Bloques Incompletos.

2.5.3 Diseos con dos o ms factores bloque.En ocasiones hay dos (o ms) fuentes de variacin lo suficientemente importantes como para ser designadas factores de bloqueo. En tal caso, ambos factores bloque pueden ser cruzados o anidados.

Los factores bloque estn cruzados cuando existen unidades experimentales en todas las combinaciones posibles de los niveles de los factores bloques.

Los factores bloque estn anidados si cada nivel particular de uno de los factores bloque ocurre en un nico nivel del otro factor bloque.

En la siguiente tabla puede observarse la diferencia entre ambos tipos de bloqueo.

Bloques CruzadosBloques Anidados

Bloque 1Bloque 1

1 2 3 1 2 3

1***1*Bloque 22***2*3***3*Bloque 24*5*6*7*

8*

9*

Tabla2.1:Plan esquemtico de experimentos con dos factores bloque

Diseo con Factores Bloque Cruzados. Tambin se denomina diseo fila-columna y se caracteriza porque existen unidades experimentales en todas las celdas (intersecciones de fila y columna).

El modelo matemtico es:

Diseo con Factores Bloque Anidados o Jerarquizados. Dos factores bloque se dicen anidados cuando observaciones pertenecientes a dos niveles distintos de un factor bloque estn automticamente en dos niveles distintos del segundo factor bloque.

2.6 Ejemplos Reales.1. El proceso de obtencin del algodn.

A continuacin se describe un experimento real descrito por Robert Peake en el Journal of Applied Statistics en noviembre de 1953. Es relativo al proceso de obtencin del algodn.

Contexto: En un paso intermedio del proceso de obtencin de algodn se obtiene un hilo ms grueso que el producto final llamado roving. Con unas guas rotatorias denominadas flyers, el roving se retuerce justo antes de enrollarlo a unas bobinas que tienen las mquinas. Cuanto ms se retuerce, ms fuerte resulta ser el algodn, pero ms se ralentiza y encarece el proceso.

1.- Objetivos. Fundamentalmente dos:

(1) Investigar el modo en que los diferentes grados de tensin sobre el roving (medidos en vueltas por pulgadas) afecta a la tasa de roturas del roving.

(2) Comparar el flyer tradicional con uno de reciente introduccin en el mercado.

2.- Identificar fuentes de variacin.

Factores tratamiento y Niveles:

Factor 1: Tipo de flyer, con dos niveles codificados como 1 y 2.

Factor 2: Grado de trabajo sobre el roving. Para elegir los niveles de este factor se pens en un rango admisible y se ejecut un experimento piloto para determinar los niveles ms adecuados, optando por: 1'63, 1'69, 1'78 y 1'90 vueltas por pulgadas, que fueron codificados mediante 1, 2, 3 y 4 respectivamente.

Grado

Flyer1'631'691'781'90

Estndar(11)121314

Nuevo212223(24)

Los tratamientos (11) y (24) se omitieron porque el experimento piloto permiti comprobar que no daban lugar a resultados apropiados.

Unidades Experimentales: Una unidad experiemental consisti en el hilo de algodn de un conjunto de bobinas de una mquina en un determinado da.

En este punto fu importante advertir tres hechos destacados.

1. No era posible asignar bobinas distintas a tratamientos distintos en una misma mquina.

2. Las bobinas deberan enrollarse completamente dado que la tensin, y consiguientemente la tasa de roturas, cambiara a medida que se llenaba la bobina.

3. Llevaba cerca de un da acabar de enrollar todas las bobinas de una mquina.

Factores nuisance: Adems de los factores tratamiento, se identificaron como otras posibles fuentes de variacin: las mquinas, los operarios, el material experimental (el algodn) y las condiciones atmosfricas.

Hubo algn debate entre los experimentadores para determinar los factores de bloqueo. Algunos pensaban que, aunque el material sera lo ms similar posible y las condiciones de humedad de la fbrica estaban supercontroladas, podan originar importantes cambios en la respuesta a lo largo del tiempo, de modo que sera aconsejable considerar el da del experimento como un factor bloque. Sin embargo, finalmente se opt por ignorar la variabilidad del da-a-da y controlar nicamente a los operarios y las mquinas. As se consider un factor bloque cuyos niveles seran cada mquina con un nico operario.

3.- Elegir una regla de asignacin de las unidades experimentales a los tratamientos. Buscando mantener lo ms homogneas posibles las condiciones experimentales dentro de cada bloque, se limit a seis el nmero de unidades experimentales por cada bloque.

En particular se eligi un diseo en bloques completamente aleatorizados. Las seis unidades experimentales de cada bloque se asignaron al azar a los seis tratamientos.

Orden

Bloque123456

I221214211323

II211412132223

III232114121322

IV232112

4.- Especificar las medidas que se realizarn, el procedimiento experimental y anticiparse a las posibles dificultades. La respuesta consistira en medir el nmero de roturas por cada cien libras de material.

Esta respuesta era muy apropiada porque el trabajo del operario inclua reparar las roturas, de modo que sera muy sencillo llevar un registro.

El experimento se realizara durante la jornada rutinaria y las mayores dificultades seran: el tiempo perdido en tomar cada observacin, la prdida de produccin causada por el cambio de flyers y el hecho de no saber por anticipado el nmero de mquinas precisas.

5.- Ejecutar un experimento piloto. Permiti identificar los niveles del factor 2. En este caso no se utiliz para estimar el tamao de la variabilidad no planificada.

6.- Especificar el modelo. Se consider el modelo

Tasa de Rotura = Constante + Efecto del Tratamiento + Efecto del Bloque + Error

7.- Esquematizar los pasos del anlisis. El anlisis se orient a evaluar las diferencias entre la tasa de roturas debidas a cada combinacin de flyer/tensin. Tambin se orient a examinar la tendencia de la tasa de roturas cuando se incrementaba la tensin en cada flyer por separado.

8.- Determinar el tamao muestral. En base a experiencias previas semejantes, aunque de otra naturaleza, se estim la variabilidad experimental. Tal estimacin implicaba que sera necesario examinar 56 bloques (336 observaciones) para detectar, con alta probabilidad, una diferencia real de al menos 2 roturas por 100 pulgadas.

9.- Revisar las decisiones anteriores. Modificar si es necesario. Dado que cada bloque supona una semana de observacin, se opt por analizar los datos una vez que su hubiesen examinado trece bloques. Por tanto la pretensin de detectar 2 roturas por 100 pulgadas con alta probabilidad fue desestimada.

2. Experimento con Pilas. (Dean Voss, 1999)

1.- Definir los objetivos del experimento. Debido al elevado gasto de una familia en pilas para linternas, el padre de familia desea investigar que tipo de pila no recargable es ms econmica. Le interesa comparar la duracin por unidad de coste de dos marcas: una particular que usa con frecuencia y otra marca estndar del hiper donde acostumbra a realizar la compra diaria. Adems, quiere saber si merece la pena pagar el sobreprecio que las pilas alcalinas tienen con respecto a las pilas de larga duracin.

Un objetivo posterior sera comparar las duraciones de las pilas independientemente del coste.

2.- Identificar las posibles fuentes de variacin. (i) Factores tratamiento y niveles. Existen en este experimento una serie de fuentes de variacin muy fciles de determinar. Adems de los factores tipo de pila y marca, que definirn los tratamientos, se podran incluir: las fechas de fabricacin de las pilas, como controlar la duracin, la temperatura del entorno, la edad y la variabilidad de las lmparas de las linternas, ...

Las pilas que se van a usar en el experimento se compraron en fechas y lugares distintos al objeto de obtener una amplia variedad de fechas de fabricacin. Si se hubiesen apuntado las fechas de los envases, la variabilidad de esta fuente podra haberse planificado a travs de una covariable; al no ser as, su variabilidad aumenta la variabilidad no planificada.

Se fijaron las condiciones de ejecucin del experimento: se encenderan las linternas y se evaluara su duracin. Sin duda este sistema no reproduce las condiciones de uso habituales de las linternas pero permite controlar muy fcilmente las condiciones de experimentacin.

El experimento se ejecutar en una habitacin donde la temperatura ser prcticamente estable durante las horas de funcionamiento de las pilas. Adems, no se espera que pequeas fluctuaciones de la temperatura ambiente tengan una fuerte incidencia en la respuesta.

La variabilidad debida a la edad de las bombillas es ms preocupante y ms difcil de manipular. Hubo que decidir entre usar una nueva bombilla para cada observacin (arriesgndose a confundir los efectos de bombilla y pila) o usar una misma bombilla durante todo el experimento (con el riesgo de sesgar los resultados por la edad de la bombilla). Una tercera posibilidad sera agrupar las observaciones en bloques y usar una nica bombilla para cada bloque pero bombillas distintas para bloques distintos. Al final se opt por la primera de las opciones debido a que el tiempo de vida de una bombilla resultaba considerablemente mayor que el de una pila.

En resumen:

(i) Factores tratamiento y niveles. Dos factores tratamiento, cada uno de ellos con dos niveles de efectos fijos. Se codificaron de dos formas distintas:

Codificacin 1Codificacin 2Tratamientos

111alcalina, marca particular

212alcalina, marca del hiper

321larga duracin, marca particular

422larga duracin, marca del hiper

(ii) Unidades experimentales. Una unidad experimental es el orden temporal en que se obtiene cada observacin. Se asignaron al azar a los cuatro tipos de pilas (tratamientos). (iii) Factores bloque, factores ruido y covariables. No hubo.

3.- Elegir una regla de asignacin de las u.e. a los tratamientos. Dado que no se planificaron otras fuentes de variacin se opt por un diseo completamente aleatorizado.

4.- Especificar las medidas a realizar, el procedimiento experimental y posibles dificultades. La primera dificultad radica en cmo medir la duracin de una pila ya que cada linterna usa dos. Se opt por manipular cada linterna mediante un circuito que conectaba a la bombilla con una nica pila. Una vez ms no se reproducen las condiciones de uso habituales pero, dado que las condiciones de ejecucin se iban a mantener constantes, se consider que la tasa relativa de duracin de la pila por unidad de coste se preservara.

Otra dificultad reside en determinar en qu momento se acaba la pila. Primero porque tardara unas cuantas horas y no todas las observaciones podran ser monitorizadas y, segundo, porque la luz de la bombilla se va atenuando poco a poco a medida que la pila se est terminando. Para evitar estos dos problemas simultneamente se opt por conectar al circuito un pequeo reloj que se parara justo antes de apagarse por completo la bombilla. El tiempo marcado en el reloj se computara como duracin de la bombilla.

Finalmente, el coste de la pila equivaldra a la mitad del valor de un pack doble de pilas y la respuesta: duracin por coste unitario, vendra dada en minutos por dlar.

5.- Ejecutar un experimento piloto. Se ejecut un experimento piloto con pocas observaciones, lo que, de entrada, permiti garantizar que el circuito ideado trabajara adecuadamente. En particular se descubri que bombilla y reloj tenan que estar conectados en paralelo y no en serie (como se proyect en un principio). El experimento piloto tambin permiti tener una idea de la duracin aproximada de cada observacin (al menos cuatro horas) y proporcion una primera estimacin de la variabilidad del error que fue til para determinar (en el paso 8 de la lista) que seran necesarias cuatro observaciones para cada tratamiento.

Dificultades encontradas: __________________________

Slo una: al ejecutar la cuarta observacin se descubri que el reloj continuaba funcionando cuando la bombilla ya no alumbraba. Se haba desconectado el sistema. Se repar y se continu el experimento sin dificultades adicionales.

3.1 Introduccin.El Diseo de Experimentos estudia la forma de realizar comparaciones lo ms homogneas posibles que permitan detectar cambios en el proceso e identificar a los factores ms influyentes.

Un primer mtodo es la comparacin de las medias de dos poblaciones normales (diseo de experimentos con un factor a dos niveles). La generalizacin de este problema es el estudio de la igualdad de las medias de I niveles de un factor y, por tanto, de la influencia del factor en la variable de inters.

En este estudio se utiliza la tcnica del Anlisis DE la VArianza: ADEVA (en ingls, ANalysis Of VAriance: ANOVA), introducida por R. A. Fisher, hacia 1.930, y que es la tcnica fundamental para el estudio de observaciones que dependen de varios factores.

El ANOVA es la herramienta bsica para el anlisis de los modelos estadsticos de Diseo de Experimentos y Regresin Lineal, porque permite descomponer la variablidad de un experimento en componentes independientes que pueden asignarse a diferentes causas.

El Diseo Completamente Aleatorizado es el diseo ms simple y en l se utiliza un nico factor y las unidades experimentales se asignan a los tratamientos completamente al azar. En este modelo los tratamientos son los niveles del factor y no se incluyen factores bloque.

3.2 Modelo matemtico (diseo completamente aleatorizado).Se denota

Yit : la variable aleatoria que representa el valor de la respuesta en la t-sima observacin del i-simo tratamiento. En adelante se utilizar la notacin Y it para referise a la variable e yit para referirse a una observacin concreta.

i: la respuesta real del i-simo tratamiento. Es decir, a la respuesta que se obtendra siempre con el i-simo tratamiento si se ejecutase el experimento en, exactamente, las mismas condiciones.

it : la variable aleatoria que representa la distancia de la t-sima observacin del i-simo tratamiento a su valor real. Por tanto it agrupa la contribucin de las fuentes de variacin menores y no planificadas. Esta variable se denomina error o error experimental.Para cada t = 1,...,ni, i = 1,...,I, el modelo matemtico del diseo es:

(3.1)

Si en este modelo se denota

se obtiene la siguiente forma alternativa del modelo

(3.2)

es una constante que indica la respuesta media y i representa la desviacin, positiva o negativa, de esta constante cuando se observa el nivel i. Los parmetros i suelen llamarse efectos. Si se utiliza el segundo modelo, se exige la condicin:

(3.3)

Si hay el mismo nmero de datos en cada nivel , esta condicin es (3.4)

El modelo (3.1) es un modelo lineal y para estimarlo es necesario establecer una serie de hiptesis acerca de las variables de error:

3.3 Estimacin de los parmetros.En el modelo matemtico (3.1) hay I + 1 parmetros a estimar:

Anlogamente, en el modelo (3.2) hay I + 1 parmetros a estimar:

el parmetro I se deduce de la condicin (3.3).

Los parmetros del modelo se estiman por el mtodo de mxima-verosimilitud que bajo la hiptesis de normalidad es equivalente a obtenerlos por el mtodo de mnimos cuadrados.

3.3.1 Estimadores por mxima-verosimilitud.De la hiptesis de normalidad se sigue que

La funcin de verosimilitud es

Tomando logaritmos neperianos se obtiene la funcin soporte

para obtener el mximo de la funcin L se deriva la misma respecto a i y 2 y se iguala a cero, de donde se obtienen ecuaciones, cuya resolucin proporciona los siguientes estimadores:

(3.5)

(3.6)

3.3.2 Estimadores por mnimo-cuadrticos.Un mtodo alternativo de estimacin de los parmetros es el mtodo de estimacin mnimo cuadrtica, que consiste en seleccionar como estimadores los valores de los parmetros que minimizan la suma de los cuadrados de los errores. Esto es, se trata de seleccionar valores 1,...,I que minimicen la siguiente funcin de I variables:

esto es,

El problema de minimizacin anterior conduce a un sistema de I ecuaciones (denominadas ecuaciones normales) cuyas soluciones nicas son para cada i = + i,

(3.7)

Por tanto, los estimadores que se utilizarn son los siguientes (3.8)

Si se utiliza el modelo (3.2), los estimadores son (3.9)

(3.10)

En base a las hiptesis del modelo es fcil deducir que la distribucin de los estimadores dados (3.8) es la siguiente (3.11)

3.3.3 Estimacin puntual de la varianza.En cualquier modelo estadstico, se denomina residuo a la diferencia entre un valor observado y el valor previsto por el modelo. Esto es,

(3.12)

En el modelo actual, para todo t = 1,...,ni e i = 1,...,I se tiene: (3.13)

con i los estimadores mnimo-cuadrticos dados (3.8). A partir de los residuos se obtiene la suma de residuos al cuadrado, suma de cuadrados residual o variabilidad no explicada (scR), dada por

(3.14)

El valor concreto scR es una realizacin particular de la variable aleatoria SCR (el resultado que se obtiene a partir de la muestra selccionada) Se demuestra que:

siendo i2 la varianza muestral corregida del i-simo tratamiento:

Como i2 es un estimador insesgado de la varianza del error 2, el valor esperado de SCR es:

Por tanto, un estimador insesgado de 2 es:

(3.15)

que se denomina, indistintamente, varianza residual o error cuadrtico medio o varianza dentro de los tratamientos. De las hiptesis del modelo se deduce que

(3.16)

A partir de (3.16) se puede calcular un intervalo de confianza al (1 -) para la varianza 2 del modelo. Los intervalos de confianza de i se obtienen a partir de (3.11) y (3.16). Se deduce que

(3.17)

3.4 Anlisis de la varianza de una va.3.4.1 Idea general.El problema bsico es contrastar la hiptesis nula de que el factor no influye en la variable de inters,

o equivalentemente

frente a la alternativa de que el factor si influye. Esto es, existen diferencias entre los valores medios de los distintos tratamientos,

La idea bsica del test anlisis de la varianza es comparar:

la suma de cuadrados residual bajo el modelo matemtico cuando H1 es cierto, (modelo completo),

con la suma de cuadrados residual del modelo que resulta cuando H0 es cierto (modelo reducido).

Si H0 es cierto, el estimador mnimo-cuadrtico de es la media muestral de todas las observaciones,

Por tanto, la suma de cuadrados residual del modelo reducido (H0) es:

Se verifica que

Si H0 es falsa y al menos dos efectos tratamiento difieren, la suma de cuadrados residual scR bajo el modelo completo es considerablemente ms pequea que la suma de cuadrados residual del modelo reducido scR0. Por el contrario, si H0 es cierta ambas sern muy similares.

El contraste ANOVA se basa en comparar la cantidad

con scR. Si scT es grande en relacin a scR se rechaza H0.

scT se denomina indistintamente variabilidad explicada o suma de cuadrados entre tratamientos o suma de cuadrados explicada (por diferencias entre tratamientos).

3.4.2 Descomposicin de la variabilidad.Teniendo en cuenta que:

puede probarse que,

Siendo n - 1 el nmero de grados de libertad de scG, porque hay n observaciones relacionadas por la ecuacin i = 1I t = 1ni = 0.

I - 1 el nmero de grados de libertad de scT, porque hay I efectos de los tratamientos relacionados por la ecuacin i = 1I nii = 0.

n - I el nmero de grados de libertad de scR, porque hay n residuos relacionados por las ecuaciones t = 1nieit = 0, i = 1,...,I.Dividiendo las sumas de cuadrados por los correspondientes grados de libertad se obtienen tres estimaciones distintas de 2:

Si H0 (igualdad de medias) es cierta, se verifica que

Por tanto,

(3.18)

Utilizando (3.18), como estadstico del contraste puede utilizarse

Se rechaza H0 al nivel de significacin si

Comentarios.

1. Si el test F resulta significativo (se rechaza H0, por tanto, el factor es influyente) se deber estudiar entre qu tratamientos existen diferencias significativas.

2. Una medida relativa de la variabilidad explicada por el factor es el coeficiente de determinacin, definido como

(3.19)

3. Si de desea aumentar la precisin del contraste, puede hacerse de dos formas: a. Reducir 2 (el error experimental) introduciendo nuevos factores.

b. Aumentar el tamao muestral en cada grupo.

4. En algunos textos se utiliza la siguiente notacin: scG = V T (Variabilidad Total), scT = V E (Variabilidad Explicada), scR = V NE (Variabilidad No Explicada).

5. En general, sea cierta o no la hiptesis nula, se verifica que

siendo

(3.20)

CUADRO DEL ANLISIS DE LA VARIANZA

UNA VA FACTOR FIJO

Fuente de Variacin

Suma de Cuadrados

g.l. scm E(SCM)

TratamientosscT = i = 1I t = 1ni2 I - 1scmT =

2 + Q(i)

ResidualscR = i = 1I t = 1nieit2

n - IscmR =

GlobalscG = i = 1I t = 1ni2 n - 1

Rechazar H0 : i = j i,j en base al p-valor

Coeficiente de Determinacin:R2 =

Cuadro 1.1: Cuadro del anlisis de la varianza para un diseo completamente aleatorizado de efectos fijos.

3.5 Inferencia de los parmetros del modelo.3.5.1 Intervalos de confianza de los parmetros.Se acepta H0.

Si se acepta la no influencia del factor los datos provienen de una nica muestra homognea y los parmetros y 2 se estiman segn las tcnicas clsicas.

(3.21)

(3.22)

Se rechaza H0. Si se supone que el factor influye, entonces los parmetros del modelo son: 1,...,I y 2. Sus estimadores son

(3.23)

Para la varianza 2 se utiliza (3.24)

Diferencia entre dos medias. Si se rechaza la hiptesis nula es porque existen medias de tratamientos diferentes y es importante calcular un intervalo de confianza para el parmetro = i -j, con ij, i,j = 1,...,I. Este intervalo se deduce fcilmente del siguiente estadstico pivote

(3.25)

A partir de este estadstico pivote (con distribucin t) se puede hacer el siguiente test de hiptesis

En base a la resolucin de este ejercico se puede plantear la siguiente pregunta:

En lugar de hacer la tabla ANOVA no se pueden hacer todos los contrastes posibles dos a dos?3.5.2 Contrastes.Lo expuesto en el apartado anterior puede generalizarse. Para ello se introduce el siguiente concepto:

Se denomina contraste, , a cualquier combinacin lineal de los efectos de los tratamientos

En un diseo completamente aleatorizado todo contraste es estimable y su estimador mnimo-cuadrtico es

Por la normalidad e independencia de las observaciones, se obtiene la distribucin de (3.26)

En muchos casos es til representar un contraste por la lista de sus coeficientes. Esto es, el contraste se puede representar por cualquiera de las dos formas equivalentes siguientes:

Contrastes importantes sobre los que es interesantehacer inferencia son los siguientes:

Comparar tratamientos a pares (pairwise).

Es decir, estimar contrastes del tipo: = i - j. Existen m = contrastes de comparaciones por pares.

Tratamientos frente a control.

Un subconjunto de contrastes del grupo anterior muy particular es el formado por los I - 1 contrastes 1 - I ([1,0,...,0,-1]), 2 - I ([0,1,...,0,-1]), ... , I-1 - I ([0,0,...,1,-1]). El objetivo es comparar el efecto de cada uno de los tratamientos con un tratamiento concreto, que se suele denominar control.

Diferencia de medias.

Cuando los niveles de los factores tratamiento se dividen de un modo natural en dos o ms grupos, puede ser interesante comparar el efecto medio de un grupo con los efectos medios de otros grupos.

Tendencias

Cuando los niveles del factor tratamiento son cuantitativos y tienen un orden natural, el experimentador podra estar interesado en saber si la respuesta crece o decrece con un incremento del nivel o, ms an, si esa tendencia se mantiene o no constante. Se habla entonces de contrastes de tendencia. En general, si = i = 1Ibii es el estimador mnimo cuadrtico de un contraste individual = i = 1Ibii, con i = 1Ibi = 0. Entonces, de (3.26) se deduce que un intervalo de confianza para , al nivel 1 - , viene dado por:

(3.27)

donde g.l. representa los grados de libertad con que se ha estimado la varianza del error. 3.5.3 Contrastes mltiples.Utilizando la distribucin dada en (3.26) se pueden realizar test de hiptesis del tipo

(3.28)

Si el test de la F de la tabla ANOVA indica rechazo de la hiptesis nula de igualdad de las medias de los niveles, es importante establecer la hiptesis alternativa adecuada y, para ello, son de gran utilidad los contrastes mltiples. En ocasiones se quiere realizar un nmero muy grande de comparaciones, de modo que la probabilidad de que alguna comparacin individual resulte significativa puede ser errneamente muy grande. Si se quieren resolver todas las pruebas de hiptesis siguientes:

Existen m = pruebas (por ejemplo, si I = 6 entonces m = 15). Al resolverlas una a una, con nivel , se denomina Aij al suceso:

Entonces:

Sea el suceso: A = rechazar errneamente alguna H0ij = ijmAij.

Cul es la probabilidad de A?

Suponiendo que los Aij fuesen independientes (obviamente no lo son):

Si = 0'05 y m = 15, entonces P(A) = 1 - 0'9515 = 1 - 0'46 = 0'54.

Por tanto, la probabilidad de concluir errneamente que algn par de tratamientos son significativamente distintos es mayor que 0'54.

Hay distintos mtodos para abordar el problema de la resolucin de pruebas de hiptesis simultneas (es decir, garantizando para todos ellas un nivel de significacin predeterminado). Unos han sido desarrollados con carcter general y otros orientados a problemas concretos como puede ser la comparacin de distintos tratamientos con un tratamiento control.

A continuacin se exponen dos mtodos de resolucin de contrastes mltiples.

Mtodo de Bonferroni.

Se basa en calcular un nivel de significacin, *, para cada una de las m pruebas de hiptesis que garantice un nivel de significacin concreto para todas las pruebas de hiptesis simultneas ( es por tanto el nivel de significacin global).

Supngase que se tienen I niveles y m pruebas de hiptesis individuales. Sean los sucesos:

Ak : aceptar la hiptesis nula del contraste k-simo cuando sta es cierta.

A : rechazar errneamente la hiptesis nula de uno o ms contrastes.

Qu * habr que utilizar en cada prueba de hiptesis individual para garantizar que P(A) no es mayor que ?(3.29)

Por tanto, para el modelo matemtico de un diseo completamente aleatorizado, el mtodo de Bonferroni consiste en resolver cada prueba de hiptesis individual conforme al siguiente criterio: Dado un conjunto demcontrastesj = 1m, rechazar la hiptesisH0j : i = 1Ibiji = 0,a un nivel de significacin global no superior a, siempre que

(3.30)

Ventajas y desventajas de este procedimiento son las siguientes: Si m es muy grande, ser tan pequeo que tn-I no viene en las tablas. Se puede aproximar por:

donde z es el valor de una normal estandar tal que P = .

Es mtodo es excesivamente conservador y slo resulta ms potente que otros procedimientos cuando m es muy pequeo.

Es vlido para cualquier tipo de diseo.

Mtodo de Scheff.

El mtodo de Bonferroni presenta serios inconvenientes, en particular, si m es muy grande la mnima diferencia significativa al nivel global para cada prueba es excesivamente grande.

Por el contrario, el mtodo de Scheff proporciona una mnima diferencia significativa que no depende del nmero de pruebas m a realizar.

El valor crtico de Scheff es

de modo que, para cualquier contraste individual i = 1Ibii se rechaza la hiptesisH0 : i = 1Ibii = 0, a un nivel de significacin global no superior a , siempre que

(3.31)

Sobre el mtodo de Scheff conviene saber que Slo depende de I y de n, pero no de m.

Es especialmente adecuado cuando se precisen comparar otros contrastes adems de las comparaciones a pares.

Si m es muy grande, resulta ms potente (y por ello ms recomendable) que el mtodo de Bonferroni.

Es vlido para cualquier tipo de diseo.

El F-test del ANOVA resulta significativo al nivel si al menos una de las infinitas pruebas de hiptesis simultneas de Scheff lo es.

3.6 Efectos aleatorios.Hasta ahora los niveles de los factores tratamiento eran seleccionados especficamente por el experimentador ya que el inters del experimento se centraba en conocer los efectos sobre la respuesta de esos niveles particulares. En este caso se denominan factores de efectos fijos, indicando as que su representacin en el modelo se corresponde con constantes desconocidas (parmetros). Los modelos conteniendo nicamente efectos fijos se denominan tambin modelos de efectos fijos.

En muchas situaciones le interesa al experimentador un factor que tiene un nmero elevado de posibles niveles, de modo que para realizar el experimento es necesario seleccionar una muestra de ellos al azar. En este caso se habla de efectos aleatorios y, en el correspondiente modelo matemtico, aparecen representados como variables aleatorias idnticamente distribuidas segn la distribucin de la poblacin de niveles. Estos modelos se denominan modelos de efectos aleatorios. En este tipo de modelos el inters radica en medir la variabilidad existente en la totalidad de los efectos de la poblacin de niveles. El objetivo es distinto del caso de efectos fijos y, por consiguiente, la planificacin y anlisis difiere en ambos modelos.

En esta seccin se supone que la poblacin de niveles es infinita o lo suficientemente grande como para ser considerada como tal. En otro caso es necesario aplicar correcciones para poblaciones finitas a toda la formulacin matemtica.

3.6.1 El modelo matemtico de un factor aleatorio.Para un diseo completamente aleatorizado con I niveles seleccionados al azar de un factor tratamiento T, el modelo de un factor aleatorio es

(3.32)

parai = 1,...,I,t = 1,...,ni. Las Ti son variables aleatorias i.i.d. con distribucin N(0,T2), y los it son variables aleatorias i.i.d. con distribucin N(0,2). Siendo las Ti y los it mutuamente independientes. Comparando el modelo de efectos aleatorios con el modelo de efectos fijos, se observa que la forma de ambos modelos y las hiptesis sobre el error son exactamente iguales. La nica diferencia est en la modelizacin del efecto tratamiento. Dado que el i-simo nivel del factor tratamiento T observado en el experimento ha sido seleccionado aleatoriamente de una poblacin infinita, su efecto observado es el resultado de la variable aleatoria Ti. La media de la poblacin de los efectos del tratamiento es la constante y, por tanto, se justifica que la media de las Ti sea cero. El parmetro de inters es ahora T2. Su importancia es fundamental: si todos los efectos de la totalidad de niveles del factor tratamiento son iguales, entonces T2 = 0. Si, por el contrario, existen niveles con efectos muy diferentes, entonces T2 es grande.

La suposicin de independencia asumida implica que el factor tratamiento no tiene incidencia sobre cualquier fuente de variacin que haya sido englobada en el error.

En el modelo con factor aleatorio se tiene:

(3.33)

ya que por la independencia de Ti y it, la Cov = 0. Por tanto

(3.34)

Las dos trminos de la varianza de Y it: T2 y 2 se denominan componentes de la varianza. Estimacin de 2.

Por la similitud entre los modelos de una va de efectos aleatorios y de efectos fijos y realizando un sencillo clculo matemtico puede probarse que la varianza residual obtenida en (3.15) para el modelo de efectos fijos tambin es un estimador insesgado de 2 en el modelo de efectos aleatorios.

donde n = i = 1Ini.

Definiendo la varianza residual como en el modelo de efectos fijos,

(3.35)

se obtiene que la varianza residual R2 es un estimador insesgado de 2 en el modelo de efectos aleatorios. Estimacin de T2.

Se puede utilizar scmT para obtener un estimador de T2. Un sencillo desarrollo matemtico permite obtener

(3.36)

Si todos los ni son iguales (ni = r, para todo i), entonces n = Ir y c = r. Por tanto, (3.37)

De lo anterior se deduce que SCMT es un estimador insesgado de cT2 + 2 (no de T2). Y de (3.35) y (3.36) se deduce que

(3.38)

Finalmente, de (3.33), (3.35) y (3.38) se deduce que un estimador insesgado de la varianza de Y, Y 2, es (3.39)

3.6.2 Contraste de igualdad de los efectos tratamiento.En el modelo de efectos aleatorios tiene inters la siguiente prueba de hiptesis:

Es posible utilizar la misma medida de discrepancia para resolver este test que la utilizda para contrastar si los efectos eran iguales en un modelo de efectos fijos?

En el apartado anterior se obtena que:

Si H0T es cierta, el valor esperado del cociente es 1 y, si H1T es cierta, el cociente anterior toma valores positivos grandes. El resultado es anlogo al caso de efectos fijos, y el clculo matemtico para resolver el problema con efectos aleatorios y con efectos fijos es el mismo aunque el planteamiento de los problemas es muy diferente.

El cuadro de anlisis de la varianza para el modelo de una va de efectos aleatorios es prcticamente igual al de efectos fijos con la diferencia de los valores esperados de las sumas de cuadrados medios.

CUADRO DEL ANLISIS DE LA VARIANZA

UNA VA EFECTOS ALEATORIOS

Fuente de Variacin

Suma de Cuadrados

g.l. scm E(SCM)

TratamientosscT = i = 1I t = 1ni2 I - 1scmT =

cT2+

ResidualscR = i = 1I t = 1ni2

n - IscmR =

2

GlobalscG = i = 1I t = 1ni2 n - 1scmG =

c =

Rechazar H0 : T2 = 0 en base al p-valor p = P

Cuadro 1.2: Cuadro del anlisis de la varianza para un diseo completamente aleatorizado de efectos aleatorios.

Como regla general, los modelos de efectos fijos se utilizan para conocer si deben no aplicarse determinados tratamientos, mientras que los modelos de efectos aleatorios permiten medir el efecto de factores que, se quiera o no, estn presentes en el proceso. En el primer caso, nos interesa conocer el aumento o disminucin de la media de la respuesta segn los niveles de los factores, mientras que con el segundo se busca su efecto sobre la variabilidad.Comparando el modelo de efectos fijos y efectos aleatorios, se tiene:

Efectos Fijos Efectos Aleatorios

Modeloyij = + i + uij yij = + Ti + uij

i = 0 Ti N

Los efectosparmetros desconocidosvariables aleatorias

Influyenen la respuesta media en la variabilidad

Objetivoestimar i estimar T2

Los nivelesse eligen al azar

El contrasteH0 : i = 0, i H0 : T2 = 0

Captulo4Chequeo y validacin del modelo con un factor.4.1 Hiptesis estructurales del modelo.En el estudio de un modelo de Diseo de Experimentos, al igual que en el estudio de cualquier modelo estadstico, se debe contrastar que se verifican las hiptesis bsicas o estructurales del modelo. En el modelo de diseo de experimentos con un factor las hiptesis establecidas a priori sobre los errores del modelo:

(4.1)

son las siguientes: 1. Bondad del ajuste del modelo estadstico propuesto.

2. La normalidad.

3. La homocedasticidad del error.

4. La homogeneidad de la muestra.

5. La independencia de las observaciones.Dado que los errores del modelo son desconocidos, las hiptesis anteriores pueden y deben chequearse a partir de los residuos,

y, en general, es preferible trabajar con los residuos estandarizados, definidos por

Si las suposiciones sobre el modelo son correctas, se verifica que es una muestra aleatoria simple de una distribucin N(0,1) y, por tanto, es razonable suponer un comportamiento similar para rit.

Un estudio descriptivo analtico y grfico de la muestra y de los residuos permite tener una idea aproximada acerca del cumplimiento de las hiptesis bsicas. Es recomendable lo siguiente:

1. Previo al clculo del modelo se deben obtener los estadsticos bsicos de la variable respuesta Y segn el factor.

2. Grficos de inters para un anlisis previo son: el grficos de puntos de Y segn el factor y el grfico de cajas mltiple de Y segn el factor.

3. Una vez ajustado el modelo y calculados los residuos (o los residuos estandarizados) se deben obtener los estadsticos bsicos de los residuos segn el factor.

4. Analizar el grficos de puntos de los residuos segn el factor, el grfico de cajas mltiple de los residuos segn el factor, el histograma de los residuos, el grfico de los residuos frente a las predicciones, el grfico de los residuos frente al ndice.La interpretacin de estos estadsticos y grficos se expone en la secciones siguientes en las que se analiza la metodologa a seguir para chequear las hiptesis bsicas.

4.2 Bondad del ajuste del modelo.El grfico de puntos de los residuos (o de la variable respuesta) frente al factor o el grfico de cajas mltiple de los residuos estandarizados frente al factor proporciona informacin acerca de la si el modelo se ajusta adecuadamente y si el factor es significativo. Ver la Figura 4.2.

Figura 4.2. Grfico de cajas mltiple de los residuos estandarizados frente al factor.Si se observa que el modelo no se ajusta bien, el grfico de los residuos frente a los niveles de un factor no includo puede indicar la necesidad incluir el factor en el experimento. En algunas ocasiones el histograma de los residuos puede indicar la importancia de un factor no introducido en el modelo.

Otro grfico de inters es el grfico de la variable respuesta frente a las predicciones que permite observar la influencia del factor y la forma de esta.

4.3 Normalidad de los errores.Los grficos para estudiar la normalidad de los residuos son los siguientes: El histograma de los residuos, la mayora de los paquetes estadsticos permiten dibujar el histograma conjuntamente con la densidad normal que se ajusta a la muestra. Debe de tenerse en cuenta que el nmero de barras que se elija para el histograma influye en la forma del mismo. En la Figura 4.3. se observa el histograma de los residuos estandarizados y la normal ajustada.

El grfico de normalidad para los datos i = 1n, en el que se representan los pares i = 1n y i = 1n, donde Fn es la frecuencia relativa acumulada de la muestra (distribucin emprica) y F es la distribucin terica (en este caso la distribucin normal). Estas curvas se representan en unos ejes escalados de forma que los puntos i = 1n estn sobre la recta y = x. Por tanto, si los puntos i = 1n estn prximos a esta recta, se aceptar la hiptesis de normalidad. En la Figura 4.4. se representa el grfico de normalidad de los residuos.

Otros grficos que pueden ayudar a estudiar la hiptesis de normalidad son los siguientes: el grfico de cajas, el grfico de tallos y hojas, el grfico de simetra.

Figura 4.3. Histograma de residuos y normal ajustada.

Figura 4.4. Grfico de normalidad para los residuos estandarizados del ejemplo 3.1.Por otra parte, existen muchos contrastes no paramtricos sobre la bondad del ajuste de los errores a una distribucin normal. De hecho, en la mayora de los casos estos contrastes son vlidos para contrastar si una muestra sigue una determinada funcin de distribucin (no solo la normal).

Por su importancia se exponen los ms utilizados: contraste chi-cuadrado, contraste de Kolmogorov-Smirnov (Lilliefors), y el contraste de asimetra y curtosis.

Contraste chi-cuadrado de Pearson.El test chi-cuadrado es un contraste general de bondad de ajuste de una distribucin y, en particular, puede utilizarse para contrastar la normalidad de una muestra. Este estadstico compara las frecuencias observadas (oi) con las frecuencias esperadas (ei), en base a la distribucin de probabilidad especificada. Concretamente, para una variable discreta con k modalidades o una variable continua con k intervalos de clase, el contraste definido por Pearson (1900) es el siguiente,

La distribucin aproximada de este contraste, bajo la hiptesis de que la distribucin especificada sea correcta, es la de una chi-cuadrado con k - 1 grados de libertad (k - 12).

Comentarios

1. Este contraste compara el histograma de frecuencias relativo de la muestra con el que se deduce de la masa de probabilidad terica. Es vlido para distribuciones discretas y continuas.

2. Si la distribucin depende de algn parmetro que debe ser estimado, la distribucin aproximada del test es una k -r- 12, siendo r el nmero de parmetros estimados. As, si se contrasta la hiptesis de normalidad, hay que estimar dos parmetros: y 2. Por tanto, el nmero de grados de libertad es k - 3.

3. Si la variable en estudio es continua se puede utilizar este contraste haciendo intervalos de clase. Esto plantea el problema de la subjetividad en la eleccin de los mismos, as como la dependencia del resultado del test de los intervalos elegidos.Contraste Contraste de Kolmogoroff-SmirnoffEl contraste de Kolmogoroff-Smirnoff es vlido para contrastar la bondad de ajuste de distribuciones continuas. En primer lugar, se define la funcin de distribucin emprica asociada a una muestra La Funcin de Distribucin Emprica (Fn) es una funcin escalonada y no decreciente, construda a partir de la muestra, de forma que en cada observacin muestral da un salto de magnitud igual a la fraccin de datos iguales a ese valor (cuando no hay repeticiones se trata de saltos de amplitud 1/n).

Para calcular Fn, se ordena la muestra de menor a mayor y ahora se define la Funcin de Distribucin Emprica (f.d.e.) como

donde card es el nmero de observaciones muestrales menores o iguales que x.

El contraste de Kolmogoroff-Smirnoff se basa en calcular la distancia (en norma L1) entre la funcin de distribucin emprica y la funcin de distribucin terica. Por tanto, el estadstico del contraste es el siguiente

que representa la mxima discrepancia, en vertical, entre la funcin de distribucin emprica y la terica. Siempre que la distribucin (continua) de partida sea correcta, el estadstico Dn es de distribucin libre (no depende de la poblacin) y est tabulada para tamaos muestrales pequeos (en otro caso, se utilizan aproximaciones asintticas).

El test de Kolmogoroff-Smirnoff-Lilliefors para normalidad (contraste KSL)

En la mayora de los casos al utilizar el estadstico de Kolmogorov-Smirnov es necesario estimar los parmetros desconocidos que caracterizan a la distribucin terica. Si la distribucin que se desea ajustar es una normal, hay que estimar la media y la desviacin tpica. En este caso, los parmetros se estiman por mxima verosimilitud y la distribucin del estadstico cambia.

Ahora el estadstico del contraste es

donde es la funcin de distribucin de una normal estndar.

El estadstico Dn representa la mxima discrepancia, en vertical, entre la funcin de distribucin emprica y la funcin de distribucin de la normal ajustada (esto es, de la normal con media y varianza estimadas). La distribucin de este estadstico fue tabulada por Lilliefors (contraste K-S-L) y, por tanto, es con respecto a esta tabulacin (y no con respecto a la tabla de Kolmogoroff-Smirnoff) como se debe juzgar la significacin del valor obtenido para este estadstico.

El contraste de asimetra.Como la distribucin normal es simtrica, bajo la hiptesis de normalidad el coeficiente de asimetra (CA) poblacional toma el valor cero. Se define el coeficiente de asimetra como sigue,

donde X es la variable aleatoria en estudio, m3 al momento muestral de orden 3 respecto a la media y sX la desviacin tpica de la muestra.

Bajo la hiptesis de normalidad el CA sigue una distribucin asinttica normal con media cero y varianza 6/n. Se define el coeficiente de asimetra estandarizado (CAS)

Para tamaos muestrales grandes ( n > 50) el CAS sigue aproximadamente una distribucin N(0,1) y puede ser utilizado como estadstico para contrastar la hiptesis de que la distribucin de la muestra es simtrica.

El test estadstico a un nivel de significacin de rechaza la hiptesis de que la distribucin es simtrica si

donde Z verifica que P = , siendo una variable aleatoria con distribucin N.

El contraste de apuntamientoEste contraste sirve para contrastar la hiptesis de que el coeficiente de apuntamiento (CAp) es cero. Propiedad que verifica la distribucin normal.

Se define el coeficiente de apuntamiento o curtosis como

donde m4 es el momento muestral de orden 4 respecto a la media.

Bajo la hiptesis de normalidad la distribucin asinttica del CAp es N. Se calcula el coeficiente de apuntamiento estandarizado como

El test estadstico a un nivel de significacin de rechaza la hiptesis de que la distribucin tiene curtosis cero si

en este caso la distribucin no es normal.

Los dos ltimos contrastes se pueden combinar en un contraste conjunto. Para ello, se define el estadstico

que bajo la hiptesis de normalidad se distribuye asintticamente como una chi-cuadrado con dos grados de libertad. Por tanto, si d toma valores positivos grandes (segn una 2 con dos grados de libertad) se rechaza que la distribucin es simtrica y/o que tiene curtosis nula y, en consecuencia, se rechaza la hiptesis de normalidad.

Qu consecuencias tiene la falta de normalidad?

Este problema afecta especialmente a la estimacin de la varianza del modelo y no se obtendrn intervalos de confianza correctos del error experimental . Sin embargo, por el Teorema Central del Lmite, la falta de normalidad tiene poca influencia en el F-test de la tabla ANOVA y en las estimaciones puntuales de las medias y de las diferencias de medias de los tratamientos.

4.4 Homocedasticidad de los errores.Es necesario contrastar la hiptesis de homocedasticidad, sto es, la varianza de los residuos es constante y no vara en los diferentes niveles del factor. La falta de homocedasticidad se denomina heterocedasticidad.

Una primera aproximacin acerca del cumplimiento de esta hiptesis se tiene con un anlisis descriptivo y grfico: Clculo de la varianza (o desviacin tpica) de los residuos segn los niveles del factor.

El grfic