Upload
donhu
View
234
Download
6
Embed Size (px)
Citation preview
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Inferencia Estadística. Estimación
y Contrastes
M Dolores [email protected]
E.U. Arquitectura Técnica
U.P.M.
Curso 2009-2010
1
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Introducción
Identi�cación del comportamiento de una variable
El reconocimiento del comportamiento de una variablealeatoria se puede realizar:
I Por métodos deductivos. (Cálculo de probabilidades).Ejemplos:
I Si z1, . . . , zn son N(0, 1) independientes, la variable:
z21
+ · · ·+ z2n
= χ2n.
I Si z es una N(0, 1) independiente de una χ2n, resulta
que:
z√1
nχ2
n
= tn.
2
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Introducción
I Con la información empírica de una muestra{x1, . . . , xn} de la variable.
I Se supondrá en general que la muestra ha sido obtenida
por m.a.s:
I Todos los individuos de la población tienen la mismaprobabilidad de pertenecer a la muestra.
I Los elementos muestrales son independientes. (Suponereemplazamiento de los individuos muestrales enpoblaciones �nitas.)
3
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Métodos de Muestreo
Llamamos población a un conjunto homogéneo deelementos en los que se estudia una característica dada.
¾Por qué no estudiamos a todos los individuos?
I Ensayos destructivos
I Las muestras sólo existen conceptualmente.
I Es muy caro.
I Requiere mucho tiempo (y puede cambiar lacaracterística de interés.
4
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Métodos de Muestreo
Muestreo Aleatorio Simple m.a.s.
Está caracterizado por
I Cada elemento tiene la misma probabilidad de salir.
I Es con reemplazamiento (la población es siempre lamisma).
5
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Métodos de Muestreo
Muestreo Estrati�cado Se utiliza cuando se sospecha quela característica a estudiar no es homogénea en la muestra(por ejemplo en los sondeos de opinión respecto al sexo o laedad). En estos casos la muestra se toma proporcional a cadauno de los estratos en la pobalción.
Muestreo por Conglomerados Se utiliza cuando no sepuede realizar un m.a.s. o por estratos porque no se disponede una lista de la pobalción aunque si se sabe que existe unacaracterización por estratos como regiones / provincias /municipios / barrios / etc...
Muestreo Sistemático Se utiliza cuando los elementos de lapoblación están ordenados por lista. Si el orden de la lista esal azar, este procedimiento es equivalente al m.a.s. aunque esmás fácil no cometer errores.
6
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Introducción
Obtenida la muestra {x1, . . . , xn} de la variable aleatoria, X ,ajustar un modelo que explique su comportamiento supone:
1. Identi�car su forma: Normal, exponencial, binomial,. . .
2. Estimar los parámetros de la distribución, que dependendel modelo. (En el caso normal, µ y σ).
7
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Introducción
Para conjeturar la forma del modelo que explica elcomportaniento de una variable aleatoria continua, secompara la forma de su histograma con la función dedensidad del modelo teórico.
I Obsérvese que estos dos objetos son comparables.
I Ejemplo: Empleando las utilidades del programaStatgraphics, discuta si el comportamiento del tamañode los élitros de los machos y de las hembras contenidosen el archivo Coleop, se puede atribuir a distribucionesnormales.
8
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Una vez identi�cada la forma genérica de un modelo, queexplica el comportamiento de la variable en estudio, esnecesario concretar el valor de sus parámetros.
I Esta concreción (estimación) siempre será aproximadapuesto que:
1. Los elementos muestrales son variables aleatorias, con la
misma distribución que la variable base.
2. Conjuntamente, la muestra es una variable aleatoria de
dimensión n.
3. Los estadísticos extraídos de una muestra son variables
aleatorias.
9
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Existen diversos métodos para la estimación de losparámetros del modelo, a partir de los datos muestrales.
I El método de los momentos consiste en igualar losmomentos de la muestra con los poblacionales:
x = µ, s2 = σ2, . . .
I Este método no emplea la información relativa a la
forma de la distribución.
10
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
I El método de máxima verosimilitud otorga a losparámetros los valores que maximizan la función dedensidad conjunta:
f (x1, . . . , xn;λ),
siendo λ el vector de parámetros del modelo.
I Este método sí emplea la información relativa a la
forma de la distribución.
I Ejemplo.
11
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Sea X una v.a. Poisson con λ = 2.Calcular la probabilidad de obtener la muestra
X = (x1 = 3, x2 = 1, x3 = 0, x4 = 2, x5 = 0)
P(x) =e−22x
2!
Entonces
P(X ) =e−223
3!
e−221
1!
e−220
0!
e−222
2!
e−220
0!
y en general
P(X ) =e−22x1
x1!
e−22x2
x2!
e−22x3
x3!
e−22x4
x4!
e−22x5
x5!
12
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Lo podemos simpli�car como
P(X ) = e−10261
2!
1
2!
1
0!
1
2!
1
0!
y en general
P(X ) = e−nλ∑
xi1∏xi !
A lo que llamamos función de densidad conjunta.
En general máxima varosimilitud encuentra el λ para el quela muestra máximiza su función de densidad conjunta.
13
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Propiedades de los estimadores
Diremos que un estimador θ de θ es centrado o insesgadopara θ si para cualquier tamaño muestra
E(θ)
= θ
Se de�ne el sesgo como
sesgo(θ)
= E (θ)− θ
14
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Por ejemplo (x1, . . . , xn) m.a.s. con E (xi ) = µ yVar (xi ) = σ2
T (x1, . . . , xn) = x
es un estimador centrado de µ porque
E (x) = µ
15
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Por ejemplo (x1, . . . , xn) m.a.s. con E (xi ) = µ yVar (xi ) = σ2
T (x1, . . . , xn) = s2x =1
n(xi − x)2
no es un estimador centrado de σ2 porque
E(s2x)
=n − 1
nσ2 6= σ2
16
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Propiedades de los estimadores
Llamaremos e�ciencia o precisión de un estimador a lainversa de la varianza
presici on(θ)
=1
Var(θ)
θ2 es más preciso que θ1 si
Var(θ2
)≤ Var
(θ1
)o lo que es lo mismo
presici on(θ2
)≥ presici on
(θ1
)
17
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Una buena medida de los bueno que es un estimador, queademás tiene en cuenta el sesgo y la presisión es el ErrorCuadrático Medio
ECM(θ)
= sesgo(θ)2
+ var(θ)
Diremos que un estimador es consistente si
E(θn
)−→n→∞
θ
Var(θn
)−→n→∞
0
18
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Propiedades de los estimadores de Máxima
Verosimilitud
I Son asintóticamente centrados.
I Tienen distribución asintóticamente normal.
I Tienen asintóticamente mínima varianza.
I Son invariantes: Si θMV es el estimador M.V. de θ, y ges una función cualquiera, entonces g(θMV ) esestimador M.V. de g(θ)
19
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Distribución en el muestreo de una proporción
Observamos la presencia o no de un determinado atributo.Estimamos p como el número de elemento r que hemosobservado con el atributo de una muestra de tamaño n.
p =r
n
X ∼ Bi (n, p)
20
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
P(p =
r
n
)= P (X = r) =
(n
r
)prqn−r
E (p) = E( rn
)=
1
nE (r) =
1
nnp = p
Var (p) = Var( rn
)=
1
n2Var (r) =
1
n2npq =
pq
n
21
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Estimación de los parámetros de una normal
En el caso de normalidad los métodos de los momentos y demáxima verosimilitud arrojan los mismos resultados.
Si una muestra {x1, . . . , xn} permite conjeturar que unavariable aleatoria X se distribuye como una N(µ, σ), losmétodos de los momentos y de máxima verosimilitud tomancomo estimadores de µ y σ, respectivamente:
µ ∼= x y σ2 ∼= s2.
22
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Estimación de los parámetros
Observaciones:
I Tanto x como s2 son variables aleatorias.
I x ≈ N(µ, σ√n
). Consecuentemente:
I E (x) = µ
I La desviación típica de x disminuye con el tamaño
muestral
I ns2
σ2−→ χ2
n−1
I E (s2) 6= σ2 lo que justi�ca que, con frecuencia, se
utilice s2 como estimador de σ2.
23
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Precisión en la estimación
I Una estimación de un parámetro es un valor aproximadodel mismo, por lo que es necesario acotar el error, paralo que se construyen los intervalos de con�anza.
I Un intervalo de con�anza para un parámetro es unintervalo numérico, en el que se encuentra el valorverdadero del parámetro con un nivel de seguridad(con�anza) conocido.
24
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Construcción de intervalos de con�anza para la media
de una normal con σ conocida
Sea X ≈ N(µ, σ), con σ conocida, y x la media muestral deuna muestra cualquiera de X de tamaño n.
Como
x ≈ N
(µ,
σ√n
),
resulta que
x − µσ/√n≈ N(0, 1).
25
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Sea zα/2 el valor que en una N(0, 1), Z , veri�ca que:
P(−zα/2 ≤ Z ≤ zα/2) = 1− α.
Entonces,
P
(−zα/2 ≤
x − µσ/√n≤ zα/2
)= 1− α.
26
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
De donde:
P
(x − zα/2 ×
σ√n≤ µ ≤ x − zα/2 ×
σ√n
)= 1− α,
y el intervalo(x − zα/2 ×
σ√n, x − zα/2 ×
σ√n
)es un intervalo de con�anza al (1− α)× 100% para µ.
27
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Construcción de intervalos de con�anza para la media
de una normal con σ desconocida
Si σ no es conocida no se puede emplear el hecho de que
x − µσ/√n≈ N(0, 1).
Sin embargo, se puede demostrar que
x − µs/√n≈ tn−1.
28
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
De donde, si tα/2 es el valor que en una tn−1:
P(−tα/2 ≤ tn−1 ≤ tα/2) = 1− α,
operando como en el caso anterior se tiene que:(x − tα/2 ×
s√n, x + tα/2 ×
s√n
)es un intervalo de con�anza al (1− α)× 100% para µ.
29
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Construcción de intervalos de con�anza para una
proporción
Utilizando la misma idea y sabiendo que la proporción seaproxima a una normal, podemos obtener el intervalo decon�anza para una proporción:
p − zα/2
√pq
n≤ p ≤ p + zα/2
√pq
n
30
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Construcción de intervalos de con�anza para la
varianza de proporciones normales
Para construir el intervalo de con�anza de la varianza de unanormal, tenemos en cuenta que:
ns2
σ2=
(n − 1) s2
σ2∼ X 2
n−1
Por lo que buscamos valores a y b que veri�quen
P
(X 2n−1,a ≤
ns2
σ2≤ X 2
n−1,b
)= 1− α
31
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Intervalos de confianza
Construcción de intervalos de con�anza para la
varianza de proporciones normales
O lo que es lo mismo
P
(1
X 2n−1,b
≤ σ2
ns2≤ 1
X 2n−1,a
)= 1− α
de donde podemos obtener el intervalo(ns2
X 2n−1,b
,ns2
X 2n−1,a
)
32
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Ejemplo V
Empleando las utilidades del programa Statgraphics genereuna muestra aleatoria de tamaño 100 procedente de unaN(5, 2).
I Emplee esta muestra para analizar el efecto del cambiodel nivel de con�anza sobre la longitud del intervalo.
I Discuta qué relación existe entre la precisión de laestimación y el nivel de con�anza.
Suponiendo normalidad, calcule intervalos de con�anza parala media y la varianza del tamaño de los élitros de los machosy las hembras contenidos en el archivo coleop.
33
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I Realizar un contraste con respecto a un parámetro, λ,consiste en analizar si existe evidencia empíricasu�ciente para admitir que este parámetro puedacumplir alguna condición conocida.
I Contrastes habituales tienen por objeto asegurarse de si
I θ = θ0
I θ > θ0
I θ < θ0
34
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I En general, la realización de un contraste requieredeterminar con precisión:
I Lo que se quiere contrastar, hipótesis nula, representada
por H0.
I Aquello que se aceptaría si se rechaza la hipótesis nula
hipótesis alternativa, representada por H1.
I Un estadístico de distribución conocida, que relacione el
parámetro con los datos muestrales.
I Alguna medida de precisión del contraste.
35
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
El contraste de la t para la media de una normal
Sea X una variable aleatoria N(µ, σ), con σ desconocida.
I Supóngase que se desea realizar el contraste:
H0 : µ = µ0, frente a H1 : µ 6= µ0,
I Elegida una muestra {x1, . . . , xn} se sabe que:
x − µs/√n≈ tn−1
36
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I De donde, si H0 es cierta:
x − µ0s/√n≈ tn−1.
I Por lo tanto, si tα/2 es el valor que en una tn−1:
P(−tα/2 ≤ tn−1 ≤ tα/2) = 1− α.
Es decir:
P
(−tα/2 ≤
x − µ0s/√n≤ tα/2
)= 1− α
37
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
Una vez realizado el cálculo del estadístico
t =x − µ0s/√n,
I Cuando ocurra que
−tα/2 ≤ t ≤ tα/2,
no hay evidencia de la falsedad de H0, por lo que no serechaza dicha hipótesis al (1− α)× 100% de con�anza.
38
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I Si por el contrario
t /∈ (−tα/2, tα/2)
habrá evidencia de que la hipótesis nula es falsa y serechazará al (1− α)× 100% de con�anza.
I Al intervalo (−tα/2, tα/2) se le denomina región deaceptación del contraste, mientras que <− (−tα/2, tα/2)es la región de rechazo.
39
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I Todo contraste se resuelve creando, a través de unestadístico apropiado, estadístico pivote, una zona deaceptación y otra de rechazo.
I Todo contraste lleva asociada una decisión, que puedeser errónea.
I Error de tipo I : Rechazar H0 cuando es cierta.
I Error de tipo II : Aceptar H0 cuando es falsa.
I La metodología habitual construye contrastes en los que
se persigue no cometer error de tipo I .
40
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I Todo contraste lleva asociado un p-valor, que es unamedida de la �abilidad de la decisión tomada.
I Si el estadístico pivote, d , es una medida dediscrepancia entre la hipótesis nula y la muestraobservada, se de�ne el p-valor del contraste como
P(d > d |H0),
siendo d el valor del estadístico pivote en la muestra.
41
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de hipótesis
I Valores altos de p sugieren con�anza en la decisión deaceptación de la hipótesis.
I Valores bajos de p sugieren con�anza en la decisión derechazo de la hipótetsis.
I Cuando se realiza un contraste al (1− α)× 100%:
I p < α implica rechazar la hipótesis nula.
I p > α supone aceptar la hipótesis nula.
42
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Ejemplo VI
Con la muestra generada en el ejemplo V ,
I Analice el efecto del cambio del nivel de con�anza en larealización del contraste:
H0 : µ = 5, frente a H1 : µ 6= 5.
I Modi�que la hipótesis nula y discuta qué relación existeentre la discrepancia entre la hipótesis nula con lamuestra, y el p-valor obtenido en los distintos contrastes.
Suponiendo normalidad, realice contrastes de hipótesis parala media y la varianza del tamaño de los élitros de los machosy las hembras contenidos en el archivo coleop.
43
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Contrastes de ajuste
I En ocasiones la hipótesis que se desea contrastar sere�ere a si una muestra con�rma el comportamiento deuna variable, según un modelo de probabilidaddeterminado:Normal, Poisson, exponencial, . . .
I De estos contrastes (de ajuste), el más común es el testde la Chi cuadrado, que analiza la concordancia entre elhistograma de los datos y la función de densidad (o deprobabilidad) del modelo.
44
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
El test de la Chi cuadrado I
El test de la chi cuadradocontrasta la hipótesis de quela variable sigue un modelo deprobabilidad concreto.
El estadístico empleado es unamedida de la discrepanciaentre los datos, el histograma,y el modelo, su función dedensidad.
-2 1 4 7 10 130
10
20
30
40
45
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
El test de la Chi cuadrado II
I Cuando la hipótesis nula es cierta, la variable sigue elmodelo previsto, el estadístico:
d =k∑
i=1
(Oi − Ei )2
Ei−→ χ2
k−r−1,
donde:
I k es el número de clases en que se divide a los datos.
I Oi es la frecuencia observada en cada clase.
I Ei es la frecuencia esperada en cada clase.
I r es el número de parámetros estimados con la muestra.
I El análisis del valor de d permite discutir el contraste.
46
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Otros Contrastes
I Contraste de Kolmogorov-Smirnov
Dn = |Fn(x)− F (x)|
Sólo es válido para funciones continuas, pero funcionabien con muestras pequeñas.
I Contraste de Sa�ro-WilksDibuja los datos en papel probabilístico normal. Labondad de ajuste la da lo bien que se aproximan losdatos a la recta.Sólo funciona bien para normalidad, pero lo hace conmuestras muy pequeñas.
47
InferenciaEstadística.Estimación yContrastes
Loly Redondas
Introducción.Métodos demuestreo
EstimaciónPuntual
Intervalos decon�anza
Contrastes deHipótesis
Contrastes deAjuste
Ejemplo VII
Con la muestra generada en el ejemplo V ,
I Analice la normalidad de la población a la querepresenta la muestra.
I Estudie la normalidad del tamaño de los élitros de losmachos y las hembras contenidos en el archivo coleop.
I Discuta si la realización de transformaciones mejora losresultados obtenidos.
48