Distribuciones de probabilidad

Embed Size (px)

Citation preview

Variable discreta Una variable discreta es una variable cuantitativa que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua Una variable continua es una variable cuantitativa que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. Un atributo esencial de una variable continua es que, a diferencia de una variable discreta, nunca se la puede medir exactamente. Con una variable continua debe haber inevitablemente un error de medida.

Distribuciones de probabilidad

Una distribucin de probabilidad es un conjunto de valores o medidas que describen la frecuencia relativa con que un evento ocurre. Pueden ser de variables discretas o de variables continuas.

Simulacin Los modelos de simulacin estocsticos utilizan distribuciones de probabilidad para representar una multitud de eventos de ocurrencia aleatoria.

Ejemplos: Los tiempos de llegada de los clientes que entran a un sistema Defectos en maquinaria Cualquier proceso que se producen repetitiva, procesos que varan por iteracin se pueden representar con una distribucin de probabilidad.

Distribuciones discreta Son distribuciones de variable discreta, las ms importantes son: Distribucin binomial Distribucin binomial negativa Distribucin Poisson Distribucin geomtrica Distribucin hipergeomtrica Distribucin de Bernoulli Distribucin Rademacher Distribucin uniforme discreta,

Distribuciones continuas Son distribuciones de variable continuas, las ms importantes son: Distribucin Beta Distribucin exponencial Distribucin F Distribucin Gamma Distribucin chi-cuadrada Distribucin normal Distribucin t de Student

Creando una distribucin de probabilidad

El primer paso al crear una distribucin de probabilidad es obtener datos empricos (datos brutos ) Los datos empricos es informacin registrada, conteos o medidas directamente del evento original.

Cadenas de nmeros aleatorios y Semillas Una Cadenas de nmeros aleatorios es una sucesin de nmeros al azar en el que cada nmero generado es calculado del valor anteriormente generado. El nmero inicial es llamado como la semilla del nmero aleatorio y determine el punto de partida del generador de nmeros aleatorios. Nmeros al azar con valores entre cero y uno ejecuta un papel importante al extraer los valores de las distribuciones de probabilidad usadas para generar comportamiento estocstico en simulacin. (Generador de variables aleatorias)

semilla

cadena

0 0.340458 0.960446 0.42781 0.746406 0.344936 0.903609 0.621724 0.37929 0.97423 0.40057

18 1 20 15 15 3 1 5 12 4

13 17 5 8 2 24 5 12 5 4

Datos empricos 3 29 8 1 1 14 6 2 46 2 40 2 6 23 1 24 10 14 18 19 9 22 10 29 40 8 54 12 2 1 29 1 3 9 8 14 12 1 2 25 10 22 1 34 6 28 13 33 6 12

3 1 11 17 6 12 1 23 2 3

8 4 13 10 8 18 22 7 39 5

10 32 2 4 1 7 45 5 7 1

Tabla de datos 100 lecturas de tiempos entre llegadas para paquetes a un muelle de entrega (en minutos).

Creando una distribucin de probabilidad

El segundo paso es crear un histograma de frecuencia relativa de datos Esto se realiza agrupando los datos en intervalos o clases. El nmero de intervalos es normalmente entre cinco y veinte, depende de la cantidad de los datos recabados. Con pocos datos, los intervalos son menos.

La tabla de clases muestra diez intervalos de clase seleccionados de la tabla de datos

Clasifique el intervalo 0-5 06-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 >50

La frecuencia 36 21 15 7 8 4 3 3 1 1 1 100

La probabilidad 0.36 0.21 0.15 0.07 0.08 0.04 0.03 0.03 0.01 0.01 0.01

La tabla de clases muestra diez intervalos de clase seleccionados de la tabla de datos

la cantidad de El campo de frecuencia describe0-5 06-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 >50 36 21 15 7 8 4 3 3 1 1 1 100 0.36 0.21 0.15 0.07 0.08 0.04 0.03 0.03 0.01 0.01 0.01

observaciones que caen en cada intervalo. La frecuencia relativa o probabilidad son calculadas al dividir el nmero de frecuencia por el nmero total de Clasifique el intervalo La frecuencia La probabilidad datos

Funciones de densidad de probabilidad El histograma simplemente refleja el porcentaje de todos los puntos de datos encontrado en cada intervalo.Histograma de frecuencia relativa40% 36%

Porcentajes del total de observaciones

35% 30% 25% 20% 15% 10% 5% 0% 21% 15%

7%

8% 4% 3% 3% 1% 1% 1%

Intervalo de clases

probabilidad relata las Una funcin de densidad de

Funciones de densidad de probabilidad

probabilidades correspondiendo a valores individuales de x asociados con una variable aleatoria X. Un histograma de probabilidad asocia probabilidades con grupos de valores de x.

Funciones de densidad de probabilidad

Las funciones asocian pares de nmeros que son descritos por una ecuacin matemtica. Pueden expresarse grficamente los valores en pares. Un eje horizontal para los valores de x y un eje vertical para valores de y. Los valores de y de una funcin de densidad de probabilidad se asocian con las probabilidades vinculadas con valores individuales de x. Es por este motivo que una funcin de densidad de probabilidad es normalmente denotada por y=f(x)

de frecuencia relativa La forma de un histograma

Funciones de densidad de probabilidad

proporciona pistas para encontrar una distribucin estndar representativa. La forma del histograma indica que una distribucin exponencial es un candidato probable para representar la distribucin de probabilidad de los datos observados.PISTA

describe una funcin de La ecuacin matemtica quedensidad es a menudo difcil para establecer. Frecuentemente se puede aproximar encontrando una distribucin de probabilidad estndar Normal Gamma Exponencial

Funciones de densidad de probabilidad

Que representan exactamente la distribucin de frecuencia relativa de los datos reales.

Distribucin exponencial

Una distribucin exponencial tiene una funcin de densidad de probabilidad que represente matemticamente como sigue donde la (beta) es un parmetro de escala para la distribucin. El valor para la (beta) en una distribucin exponencial el la media de la distribucin. El promedio calculado para los datos de tiempo entre llegadas es de 12.41 minutos. La siguiente grfica muestra una distribucin exponencial con un parmetro de (beta) igual a 12.41.

Media Una media es el promedio La media de una distribucin de probabilidad puede ser vista como su masa La masa representa la densidad de la probabilidad. El valor de la media es el punto en que la distribucin se balancee se cuando la ponemos en un punto de soporte

Varianza La varianza de una distribucin de probabilidad mide la distancia entre los valores de variable aleatoria y la media de la distribucin

Desviacin estndar Es una medida de dispersin, que nos indica cunto pueden alejarse los valores respecto al promedio (media), por lo tanto es til para buscar probabilidades de que un evento ocurra.

Por qu utilizar distribuciones de probabilidad estndar?

Las distribuciones estndares son usadas para representar distribuciones de datos empricos porque ayudan a eliminar las irregularidades que pueden existir debido a la omisin de algunos datos durante el perodo de recopilacin de datos.

Por qu utilizar distribuciones de probabilidad estndar?

Los datos empricos son frecuentemente recogidos sobre intervalos de tiempo cortos. Valores extremos quizs no ocurran durante estos intervalos. Por ejemplo, el tiempo entre llegadas de clientes a un banco son entre 0 y 60 los minutos. Las llegadas de cliente son registradas sobre un perodo de dos das, pero ningn tiempo de llegada supera los veinte minutos.

Por qu utilizar distribuciones de probabilidad estndar?

Valores generados aleatoriamente sobre los datos observados, no producirn valores sobre veinte minutos. Excluir estos valores de un anlisis puede influir significativamente en las respuestas de desempeo.

Distribuciones estndar

La curva acampanada, por ejemplo, es la figura tpicamente asociado con una distribucin normal. Muchas funciones de densidad de probabilidad tienen parmetros que controlan sus caractersticas de escala y de forma. Dos de los ms comunes son (alfa) el parmetro que define la forma de la distribucin y (beta) el parmetro que describe los valores de rango de la distribucin. Los medias y varianzas de estas distribuciones son definidos como (alfa) y (beta).

Distribuciones de probabilidad ms utilizadas Continuas

Uniforme: Para cantidades que varan "aleatoriamente" entre valores a y b, y que no se conocen ms datos. Exponencial: Tiempos entre llegadas de "clientes" a un sistema, y que ocurren a una tasa constante. Tiempos de falla de mquinas. Gamma, Weibull: Tiempo de servicio, tiempos de reparacin. Normal: Errores. Sumas grandes! Teorema central del lmite.

Distribuciones de probabilidad ms utilizadas Discretas

Binomial. Uniforme discreta. Geomtrica: nmero de observaciones error. Binomial negativa: nmero n-simo error. Poisson: Nmero de eventos que ocurren a una tasa constante.

Distribucin Exponencial

Normalmente se utiliza para generar valores aleatorios del tiempo entre llegadas de clientes a un sistema. Utilizado en sistemas de colas. Otras posibles aplicaciones el tiempo para completar una tarea y el tiempo de falla de componentes electrnicos. Ejemplos: Paquetes llegando a un puerto

Parmetros: media y semilla.

Distribucin Exponencial

Funcin de densidad de probabilidad:Para x 0, si no 0

Funcin de distribucin acumulativa:

Distribucin Exponencial

Distribucin Gamma

Se utiliza para representar el tiempo que se necesita para terminar una tarea o un grupo de tareas. Puede usarse para generar valores que representen el tiempo total requerido para completar n tareas diferentes. Alfa es igual a n. Parmetros: alfa, beta y semilla aleatoria. (cuando alfa =1 dist. Exponencial)

Distribucin Gamma

Funcin de densidad de probabilidad: a > 0 (forma)b > 0 (escala)

Funcin de distribucin acumulativa:

Distribucin Gamma

Distribucin Normal

Se utiliza para medir varios tipos de error. Operaciones de recepcin/inspeccin frecuentemente requieren el uso de instrumentos calibrados para medir las dimensiones de varios componentes.

Las mediciones reveladas por el instrumento se asume que se distribuyen normalmente con respecto a las dimensiones reales del componente. Parmetros: media, desviacin estndar y semilla.

Funcin de densidad de probabilidad:

Distribucin Normal

Distribucin Uniforme.

Una distribucin uniforme con valores entre cero y uno son las bases para generar valores para distribuciones de probabilidad estndar (Generacin de Nmeros aleatorios). Otra aplicacin comn es para representar la duracin de una tarea cuando se tiene poca informacin de los tiempos de la tarea. Parmetros: media, rango medio y semilla.

Distribucin Uniforme.

Distribucin Uniforme.

0.340458 0.42781 0.746406 0.344936 0.903609 0.621724 0.37929 0.773438 0.447081 0.945824 0.350002 0.167789

Distribucin Weibull

Se utiliza para generar valores del tiempo de falla de una pieza en un equipo o el tiempo promedio de vida de un componente electrnico. Parmetros: alfa, beta y semilla

Distribucin Triangular Se usa en situaciones donde nicamente se conocen tres piezas de la informacin acerca de la tarea. Si le preguntamos a operadores en una lnea de ensamble cuanto tiempo tarda una operacin ellos pueden responder por lo regular y pero puede tener un rango de x a z Parmetros: Valor mnimo (x), Moda (y), Valor mximo (z) y semilla.

Distribucin Lognormal

Puede ser usada para representar el tiempo utilizado para ejecutar una tarea. Parmetros: Media, desviacin estndar y semilla.

Distribucin Earlang

Es un caso especial de la distribucin gamma que es frecuentemente utilizada en sistemas de colas para representar las distribuciones del tiempo de servicio para varias tareas. Parmetros: Media, k y semilla (k est restringida a valores enteros mayores que cero. Para k = 1 dist. Exponencial).

Ejemplo: Por ejemplo supongamos que una tarea se debe repetir 10 veces, y el tiempo para terminar la actividad es descrita por una distribucin exponencial con media 2. El tiempo para llevar acabo las 10 operaciones puede ser representada por una distribucin Erlang con media 20 (calculada 2 * 10) y k = 10.

k

Distribucin Beta

Se utiliza para representar fenmenos pertenecientes a proporciones. Dos valores se necesitan para representar a la distribucin beta y producir diferentes formas. Tambin es usada para representar el tiempo de una actividad cuando no se tiene informacin disponible de la duracin de la misma. Parmetros: alfa1, alfa2 y semilla

Distribucin Poisson Usualmente asociada con tasas de llegada. La distribucin de Poisson es una distribucin discreta limitada en la parte inferior con 0 y sin limite en la parte superior . La distribucin de Poisson refleja la probabilidad asociada con un numero finito de xitos (llegadas) durante un determinado intervalo de tiempo de llegada. Esto incluye muchos eventos en el tiempo o espacio tales como llamadas de telfono, llegadas, defectos en semiconductores manufacturandos. La distribucin de Poisson alcanza el mximo cercana de lambda y cae rpidamente del otro lado. Parmetros: media (lamda) y semilla

Distribucin Binomial

Se utiliza en sistemas donde se producen dos posibles resultados: xito o fracaso. El parmetro p representa la probabilidad de xito del evento. Se utiliza para representar el numero de productos defectuosos en un lote de tamao n. Parmetros: p y semilla

Distribucin Uniforme Discreta.

Distribucin discreta que nos proporciona valores enteros entre el mnimo y el mximo. Parmetros: Valor mnimo (a), Valor mximo (b) y semilla.

Bibliografa: Simulacin Un enfoque prctico Ral Coss Bu Simulacin de Sistemas para Administracin e Ingeniera Francisco Garca, Jorge Sierra, Virginia Guzmn