Distribuciones continuas

Preview:

Citation preview

Distribuciones continuas

Al calcular las probabilidades de variables aleatorias continuas, no se puede hablar de que tome un valor en particular.

Sino de la probabilidad de que la variable tome valores en n intervalo P(a≤ x ≤b).

A las funciones de probabilidad de las variables continuas se les llama funciones de densidad y se integran para obtener la propiedades buscadas.

DISTRIBUCIONES CONTINUAS: UNIFORME

D. UNIFORME La distribución

uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad.

Es una distribución continua porque puede tomar cualquier valor y no únicamente un número determinado (como ocurre en las distribuciones discretas).

Función de distribución de probabilidad

Varianza=

Ejemplo:Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

El precio medio del litro de gasolina durante el próximo año se estima que puede oscilar entre 11 y 15 pesos. Podría ser, por tanto, de $ 11 , o de $ 11,40 o de $ 11.455, 14.5 etc.

Hay infinitas posibilidades, todas ellas con la misma probabilidad.

Donde:b: es el extremo superior (en el ejemplo, 15 pesos)a: es el extremo inferior (en el ejemplo, 11 pesos)

El valor medio de esta distribución se calcula:

Por lo tanto, el precio medio esperado de la gasolina para el próximo año es de 13.00 pesos.

Ejemplo El volumen de

precipitaciones estimado para el próximo año en la ciudad de Durango va a oscilar entre 400 y 500 litros por metro cuadrado.

Calcular la función de distribución y la precipitación

media esperada:

Es decir, que el volumen de precipitaciones esté entre 400 y 401 litros tiene un 1% de probabilidades; que esté entre 401 y 402 litros, otro 1%, etc.

El valor medio esperado es:

Es decir, la precipitación media estimada en Durango para el próximo año es de 450 litros. 

Distribuciones continuas: normal

Distribución NormalDescubierta en 1733 por el

francés Moiure, descrita también por Laplace y Gauss (sinónimo de la forma gráfica de esta distribución).

Importancia práctica de esta distribución teórica: Distribución de promedios. Distribución de errores. Mide en forma muy aproximada

fenómenos naturales, industria e investigación

Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal.

Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución:

Un 50% de los valores están a la derecha de este valor central y otro 50% a la izquierda

Características D. Normal Área bajo la curva entre

2 puntos representa probabilidad que ocurra un hecho entre esos dos puntos

Su dominio va de menos infinito a más infinito;

Es simétrica con respecto a su media;

Tiene dos colas.

El valor del área debajo de toda la curva es igual a 1;El centro de la curva está representado por la media poblacional ().Para cualquier curva normal, el área de - a + es igual a 0.6827; de -2 a +2 de 0,9545 y de -3 a +3 de 0,9973;

Esta distribución viene definida por dos parámetros:

μ : es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).

σ² : es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.

Cuando la media de la distribución es 0 y la varianza es 1 se denomina "normal tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

 !toda distribución normal se puede transformar en una normal tipificada!

Ejemplo  Una variable aleatoria sigue el modelo de una distribución normal con media 10 y varianza 4. Transformarla en una normal tipificada.

X: N (10, 4)

Para transformarla en una normal tipificada se crea una nueva variable (Z) que será igual a la anterior (X) menos su media y dividida por su desviación típica (que es la raíz cuadrada de la varianza)

Calcular la P(Z<1.35)

Ejemplo Para la distribución normal tipificada, calcular : a) Percentil 21

21 % del área total (1)

Del otro lado quedaría .79, lo buscamos en tablas.

Z=.81

Ejemplo Las calificaciones de los 500 aspirantes

presentados a un examen para contratación laboral, se distribuye normalmente con media 6.5 y varianza 4.

a) Calcule la probabilidad de que un aspirante obtenga más de 8 puntos.

N(6.5, 4 )

Consultando z=0.75P=0.2266

b) ¿ Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7.5 puntos ?.

P(5<X<7.5)= P(-0.75<Z<0.5)P(Z=-.75)==0.2266 P(Z=0.5)=0.6914

P(5<X<7.5)=0.6914-0.2266=0.4648

(0.4648)(500 aspirantes)=232.41

Las distribuciones “t” de Student, Chi cuadrado (Chi²) y F, se derivan de la distribución Normal y están relacionadas con la teoría del muestreo pequeño n< 30.

Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos de Confianza y Pruebas de Hipótesis.

T de student

En muchos casos se seleccionan de una población normal, muestras de tamaño pequeño n < 30 y desviación estandar desconocido

Condiciones: n≤ 30 Desviación estándar pob.=?

Características:La distribución t-Student es menor en la media y más alta en los extremos que una distribución normal.Tiene mayor parte de su área en los extremos que la distribución normal.

Distribución “t” de Student

Se puede probar que siendo x el promedio de una muestra tomada de una población normal con media y varianza 2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.

ns/

-x=t

Características Distribución “t”

Su dominio va de - a +;

El área bajo la curva desde - a +es igual a 1

0, 2 depende parámetro (grados libertad)

Varianza > 1, pero se aproxima a 1 cuando n

Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación

Aplicaciones:• Estimación de

intervalos de confianza para medias a partir de muestras pequeñas

• Pruebas de hipótesis basadas en muestras < 30

Nivel de Significación

= (A+B)

Región de aceptación

95%

Se rechaza la hipótesis nula

Se rechaza la hipótesis nula

- Valor critico Valor teórico de la diferencia

+ Valor critico

Área A Área B

α/2=0,025 α/2=0,025Certeza

Deseada

Ejemplo Se desea obtener el

tiempo medio requerido para desarrollar una prueba de matemática, con un intervalo de confianza del 99%

Para ello se elige una muestra aleatoria de 16 estudiantes, la que produce una media de 13 y una desviación estándar de 5.6 minutos.

n=16 =13 min.S= 5.6 mint=?

X

Calculo de t Confianza= 99% Grados de libertad= n-1= 16-1=15 α = 1% = 0.01 α/2= 0.005

α=0,005 α=0,00599%

Sustituyendo …

16

)6.5)(947.2(13

16

)6.5)(947.2(-13

12,17 88.8

Tiempo medio requerido para desarrollar la prueba de matemática será entre 8.88 y 17.12 minutos con una certeza del 99%

Prueba de hipótesis t de student

G.l. = n-1

Ho : 1 = 2

H1: 1 ≠ 2

n

SX

t obtenidoObtenido

n: tamaño de la muestra

X: Media muestral

: Media poblacional

S: Desviación estándar

Críticot t tabulado

Si |tObtenido | |crítico|, entonces se rechaza la hipótesis nula (Ho); y por lo tanto, se acepta la hipótesis alterna H1.

Ejemplo

Suponga que usted tiene una técnica que puede modificar la edad a la cual los niños comienzan a hablar. El promedio de edad, en la cual un niño emite su primera palabra, es de 13,0 meses. No se conoce la desviación estándar poblacional. Usted aplica dicha técnica a una muestra aleatoria de 15 niños. Los resultados arrojan que la edad media muestral en la que se pronuncia la primera palabra es de 11.0 meses, con una desviación estándar de 3,34.

H0: = 13 La técnica no afecta la edad en que los niños comienzan a hablar.

H1: ≠ 13,0 La técnica afecta la edad en que los niños comienzan a hablar.

32,2862,8

2

15

34,30,130,11

n

SX

tcalculado

145,2tabuladot

μ= 13n=15g.l.=14X=11S=3.34

Se rechaza la HoentoncesttSitabulado

calculado ,

145,2tabuladot32,2calculadotLa técnica afecta la edad en que los niños comienzan a hablar”.

Distribución gamma

Es una distribución de probabilidad continua con dos parámetros (β y ά).

Función de densidad x>0

Donde e=  2,71828 Г= función gamma Para ά=1,2…n Г(ά)=(ά-1)!

Se utiliza para modelar datos asimétricos cuando las variables >0.

Esta puede describir el tiempo que transcurre para que un componente eléctrico falle.

Ejemplo Suponga que cierta

pieza metálica se romperá después de sufrir dos ciclos de esfuerzo.

Si estos ciclos ocurren de manera independiente a una frecuencia de dos por cada 100 horas.Obtener la probabilidad de que el intervalo de tiempo se encuentre hasta que ocurre el segundo ciclo.

X= tiempo que pasa hasta que la pieza sufre el segundo ciclo

ά= 2 Β= 1/50 =0.02

σ=100

Una desviación con respecto al tiempo promedio

Distribución exponencial

Si un evento ocurre en el contexto de Poisson, entonces la extensión temporal o espacial entre dos eventos sucesivos sigue una distribución exponencial de probabilidad.

Se emplea para determinar la probabilidad de ocurrencia de un evento dado en un intervalo de tiempo dato, en un área o volumen especifico

Y la probabilidad exponencial de que el primer evento ocurra en el intervalo temporal determinado es:

Ejemplo Un promedio de seis personas por hora

hacen uso de un cajero automático de un banco durante una hora pico.

Cual es la probabilidad que pasen al menos diez minutos entre la llegada de dos clientes?

Cual es la probabilidad de que tras la salida de un cliente, llegue otro en al menos 20 minutos?

Chi- cuadrada

Chi-cuadradaDistribución Ji-cuadrado es una

función de densidad de probabilidad que representa la distribución muestral de la varianza.

Definimos el estadístico Ji-cuadrado (2) como:

2

22 s1)-(n=

Características Ji-cuadradoAsimétrica y

asintótica al eje x por la derecha;

Su dominio va de 0 a +

Área bajo la curva desde 0 a + =1

Tiene parámetro = n-1 (g.d.l.)

Al aumentar n se aproxima a la normal

Representa distribución muestral de varianza.

Entre las aplicaciones:• Determinación intervalos

confianza para varianzas• Pruebas de hipótesis para

una varianza• Tablas de contingencia• El ajuste de datos a una

distribución dada conocida • Las pruebas de

independencia.

Ejemplo

Suponga que los tiempos requeridos por un autobús para alcanzar uno de sus destinos en una ciudad grande forman una distribución normal con una desviación estándar de 1 minuto.

Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea >2.

Valor de Chi-cuadrada, para S²=2

P=0.01

Distribución F de fisher Prueba igualdad de varianzas

Distribución "F” de Fisher También llamada "F”

de Fisher – Schnedecor

Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadrado.

Definimos el estadístico F como:

s

s=F22

21

El cual es el valor de una variable aleatoria que tiene distribución F con parámetros 1=n1-1 y 2=n2-1.

Propiedades de Distribución F Asimétrica, y asintótica al eje x por el

lado derecho Su dominio va de 0 a + Área bajo curva desde 0 a + =1 Tiene parámetros 1=n1-1 y 2=n2-1. Entre sus aplicaciones:

Pruebas de hipótesis entre 2 varianzas Análisis de varianza Análisis de covarianza.

Ejemplo

Si s12 y s2

2 son las varianzas muéstrales de muestras aleatorias independientes de tamaños n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s1

2/s22 ≤ 2.42).

Grados de libertadn1=10 gl= 10-1=9n2=20 gl=20-1=19

0.9497

P(s12/s2

2 ≤ 2.42=0.9497

Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales

Dos poblaciones sobre las que una determinada variable sigue una distribución Normal.

Sobre la población 1 la variable sigue una distribución N(µ1, σ1) y sobre la población 2 sigue una distribución N(µ2, σ2).

Igualmente supondremos que disponemos de dos muestras aleatorias independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente.

Intervalo de confianza

Ejemplo

Método 1 Método 2

n1 = 31 n2 = 25

s12 = 50 s2

2 = 24

Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran el la tabla:

Construya un intervalo de confianza del 90% para σ1²/ σ2²

Nivel de confianza=90%

Con un nivel de confianza del 90% se sabe que la relación de varianzas σ1

2/ σ

22 esta entre 1.07 y 3.93.