53
1 *

TPE

Embed Size (px)

DESCRIPTION

cursos de probabilidad y estadistica

Citation preview

  • 1*

  • PUBLICACIONES SIASW - MEXICO 2015

  • Indice general

    1. Introduccion 11.1. Que es estadstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. La poblacion y la muestra . . . . . . . . . . . . . . . . . . . . . . . 11.3. Estadstica descriptiva e inferencial . . . . . . . . . . . . . . . . . . 2

    2. Estadstica descriptiva 52.1. Variables y Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2.1.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . 62.2. Descripcion de datos con graficas . . . . . . . . . . . . . . . . . . . 7

    2.2.1. Graficas para datos cualitativos . . . . . . . . . . . . . . . . 72.2.2. Graficas para datos cuantitativos . . . . . . . . . . . . . . . 9

    2.3. Descripcion de datos con medidas numericas . . . . . . . . . . . . 152.3.1. Media, mediana y moda . . . . . . . . . . . . . . . . . . . . 152.3.2. Varianza y desviacion estandar . . . . . . . . . . . . . . . . 17

    3. Probabilidad 233.1. Espacio muestral y eventos . . . . . . . . . . . . . . . . . . . . . . . 233.2. Algebra de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.3. Axiomas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 263.4. Espacios de probabilidad discreta . . . . . . . . . . . . . . . . . . . 283.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.6. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . 30

    4. Variables aleatorias y esperanza 354.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.2. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . 394.3. Valor esperado de una variable aleatoria . . . . . . . . . . . . . . . 40

    5. Distribuciones especiales 435.1. Distribuciones de probabilidad discretas . . . . . . . . . . . . . . . 43

    5.1.1. La distribucion de probabilidad binomial . . . . . . . . . . 435.1.2. La distribucion de probabilidad de Poisson . . . . . . . . . 465.1.3. La distribucion de probabilidad Hipergeometrica . . . . . . 47

    5.2. Distribuciones de probabilidad continuas . . . . . . . . . . . . . . 485.2.1. La distribucion de probabilidad uniforme continua . . . . . 485.2.2. La distribucion de probabilidad exponencial . . . . . . . . 485.2.3. La distribucion de probabilidad normal . . . . . . . . . . . 48

    III

  • 1. Introduccion

    Contenido1.1. Que es estadstica? . . . . . . . . . . . . . . . . . . . . . . . . . 1

    1.2. La poblacion y la muestra . . . . . . . . . . . . . . . . . . . . . 1

    1.3. Estadstica descriptiva e inferencial . . . . . . . . . . . . . . . 2

    Objetivo: Comprender el concepto de estadstica y conocer cual es su objetivo.

    Panorama general: Se define estadstica, poblacion y muestra. Se mencionaranlos procedimientos usados en estadstica descriptiva y estadstica inferencial.

    1.1. Que es estadstica?

    En algun momento, la gran mayora de la gente emplea tecnicas estadsti-cas. Esto se puede observar, por ejemplo, en la cantidad de dinero que se asignapara el consumo diario, en los procesos de ingeniera y negocios, y en los re-sultados de las elecciones presidenciales. Las tecnicas estadsticas son de granimportancia en las situaciones practicas de este tipo. El desarrollo teorico paracomprender estas tecnicas es tratado en este texto.

    La estadstica se define como una rama de las matematicas que trata conla coleccion, analisis, interpretacion y presentacion de masas de datos numeri-cos(Webster New Collegiate Dictionary). Stuard y Ord (1991) declaran: La es-tadstica es una rama del metodo cientfico que se ocupa de los datos obtenidoscontando o midiendo las propiedades de poblaciones. Rice (1995), comentan-do sobre experimentacion y aplicaciones estadsticas, declara que la estadsticaesta esencialmente interesada de procedimientos para el analisis de datos, es-pecialmente datos que en algun sentido vago tengan un caracter aleatorio.

    1.2. La poblacion y la muestra

    La poblacion es el cuerpo grande de medidas o datos y es el interes princi-pal, y la muestra es un subconjunto seleccionado de este. Por ejemplo, podemostener todos los habitantes de un estado dado, o todas las televisiones produ-cidas en el ano pasado por un fabricante en particular, o todos los hogares enuna comunidad dada. En tales casos, tratamos de conocer acerca de la poblacionmediante la eleccion y de examinar un subgrupo de sus elementos.

    1

  • 2 CAPITULO 1. INTRODUCCION

    Aunque en la mayora de los casos estamos interesados ante todo en la po-blacion, esta puede ser difcil o imposible de enumerar. Por ejemplo, imagnesepoder registrar la preferencia presidencial de cada uno de los votantes registra-dos en Mexico ! En su lugar, tratamos de describir o predecir el comportamientode la poblacion en base de la informacion obtenida de una muestra representativa apartir de la poblacion.

    Las palabras muestra y poblacion tienen dos significados para la mayora delas personas. Por ejemplo, al leer en los periodicos que cierta encuesta esta ba-sada en una muestra de 1823 personas. Presumiblemente, a cada persona en-trevistada se le hace una pregunta en particular, y la respuesta de esa personasrepresentan una medicion en la muestra. Es la muestra el conjunto de 1823personas o lo es las 1823 respuestas que dan?

    Cuando usamos el lenguaje estadstico, distinguimos entre entre el conjun-to de objetos en los cuales las mediciones son tomadas y las propias mediciones.Para el experimentador, los objetos en los cuales son tomadas las medicionesson llamados unidades experimentales. El estadstico llama a la muestra de estu-dio elementos de la muestra.

    1.3. Estadstica descriptiva e inferencial

    Cuando se presenta un conjunto de medidas por primera vez, ya sea de unamuestra o una poblacion, se necesita encontrar una manera de organizar y resu-mirlas. La rama de la estadstica que ordena, analiza y representa un conjunto demedidas o datos es llamada estadstica descriptiva. El analisis consta de calcular,a partir de los datos, medidas de tendencia central con el objetivo de observarel comportamiento de los datos respecto a estos valores centrales. La represen-tacion de los datos es mediante tablas y graficas. As, la estadstica descriptivaconsiste en procedimiento usados para resumir y describir caractersticas im-portantes de un conjunto de medidas.

    Si el conjunto de medidas es de la poblacion entera, solo se necesita sacarconclusiones basada en la estadstica descriptiva. Sin embargo, podra ser de-masiado costoso o demasiado tiempo para enumerar a la poblacion completa.Por esta u otras razones, se puede tener solo una muestra de la poblacion. Al

  • 1.3. ESTADISTICA DESCRIPTIVA E INFERENCIAL 3

    observar la muestra, se desea responder cuestiones de la poblacion en general.La rama de la estadstica que trata con estos problemas es llamada estadsticainferencial.

    La estadstica inferencial consiste en procedimientos usados para hacer infe-rencias sobre caractersticas de la poblacion a partir de la informacion contenidaen una muestra de esta poblacion.

    El objetivo de la estadstica inferencial es realizar inferencias (esto es, sacarconclusiones, hacer predicciones, tomar decisiones) sobre caractersticas de lapoblacion mediante la informacion contenida en una muestra.

    En general, el estudio de la estadstica se ocupa del diseno de experimentoo encuestas por muestreo para obtener una cantidad especfica de informaciona un costo mnimo y el uso optimo de esta informacion en hacer una inferenciaacerca de una poblacion. El objetivo de la estadstica es hacer una inferencia acercade una poblacion basada en informacion contenida en una muestra de esa poblaciony proporcionar una medida de bondad asociada a la inferencia.

  • 4 CAPITULO 1. INTRODUCCION

    EjerciciosTecnicas basicas

    1.1 Poblacion o muestra? Para ca-da una de las siguientes situaciones,identificar la poblacion de interes, elobjetivo inferencial

    a Se quiere estimar la propor-cion de neumaticos de automovi-les con la banda de rodadurasin proteccion entre todos losneumaticos fabricados por una

    compana especfica durante elano de produccion actual.

    b Un cientfico medico quiere es-timar la duracion promedio detiempo hasta la recurrencia deuna enfermedad determinada.

    c Un ingeniero electrico quiere de-terminar si la duracion promediode vida de transistores de ciertotipo es mayor a 500 horas.

  • 2. Estadstica descriptiva

    Contenido2.1. Variables y Datos . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2.1.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . 62.2. Descripcion de datos con graficas . . . . . . . . . . . . . . . . 7

    2.2.1. Graficas para datos cualitativos . . . . . . . . . . . . . . 72.2.2. Graficas para datos cuantitativos . . . . . . . . . . . . . 9

    2.3. Descripcion de datos con medidas numericas . . . . . . . . . 152.3.1. Media, mediana y moda . . . . . . . . . . . . . . . . . . 152.3.2. Varianza y desviacion estandar . . . . . . . . . . . . . . 17

    Objetivo: Describir un conjunto de datos mediante tablas de frecuencias, grafi-cas y medidas numericas, dependiendo el tipo de variable que es medida.

    Panorama general: Se da la definicion de una variable y unidad experimental.Se hace uso de tablas de frecuencias, graficos y medidas numericas para descri-bir los resultados al medir una variable de interes en una unidad experimental.

    2.1. Variables y Datos

    Presentaremos algunas tecnicas para poder realizar estadstica descriptiva,es decir, se presentan tecnicas para la descripcion de un conjunto de medicionestanto de muestras como de poblaciones. Primero, debemos definir que se entien-de por mediciones o datos y categorizarlos. Describiremos los datos mediantegraficas, que nos ayudaran a describir la forma de la distribucion de los datos, ycantidades numericas. Iniciamos introduciendo algunos conceptos importantes.

    Una variable es una caracterstica que cambia o vara con el tiempo paradiferentes individuos u objetos bajo consideracion. Por ejemplo, la edad de unapersona cambia con el tiempo y cambia de persona a persona. Otros ejemplosson la estatura y el peso.

    Una unidad experimental es el individuo u objeto sobre el cual una variablees medida. Cuando una variable es medida sobre un conjunto de unidades ex-perimentales resulta un conjunto de mediciones o datos. Aqu, por unidad expe-rimental resulta una unica medicion o un unico valor de los datos. Por ejemplo,el tiempo en realizar un proyecto o la inversion en este.Si una medicion (o dato) es generada por cada unidad experimental en la colec-cion completa (todos los individuos u objetos en las cuales se miden las varia-bles), el conjunto de datos resultante constituye la poblacion de interes. As, lapoblacion es el conjunto de medidas interes para el investigador y la muestra esun subconjunto de medidas seleccionadas de la poblacion.

    5

  • 6 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    Un dato univariado resulta cuando una variable es medida en una unicaunidad de experimental. Por ejemplo, si medimos la temperatura corporal de100 personas.

    Un dato bivariado resulta cuando dos variables son medidas en una unicaunidad experimenta. Por ejemplo, si se mide la inversion y duracion de 15 pro-yectos.

    Un dato multivariado resulta cuando tres o mas variables son medidas enuna unica unidad experimental. Por ejemplo, si medimos la profesion, la esta-tura, edad y el sexo de una persona resulta un medida multivariada.

    2.1.1. Tipos de variables

    Las variables se puede clasificar en una de dos categoras: cualitativas ocuantitativas.

    Las variables cualitativas miden una cualidad o caracterstica en cada uni-dad experimental. Las variables cuantitativas miden una cantidad o un montonumerico en una unidad experimental.

    Las variables cualitativas con frecuencia son llamadas datos categoricos de-bido a que se pueden categorizar conforme a clases similares o diferentes. Porejemplo:

    Color de los ojos.

    Profesion.

    Las variables cuantitativas producen datos numerico, las cuales las repre-sentaremos por la letra X. Por ejemplo:

    X = Numero de habitantes.

    X = Volumen de agua en una botella.

    Las variables cuantitativas se clasifican en discretas o continuas. Una variablediscreta solo puede adquirir un numero finito o contable (correspondientes alos numeros naturales, X = 0,1,2, ...) de valores y una variable continua puedeadquirir muchos valores de manera infinita correspondientes a los puntos deun intervalo (por ejemplo, 0 < X

  • 2.2. DESCRIPCION DE DATOS CON GRAFICAS 7

    Cualitativas

    ContinuosDiscretos

    Cuantitativas

    Datos

    Figura 2.1: Tipos de datos

    2.2. Descripcion de datos con graficas

    La descripcion de los datos dependera del tipo de variable, cualitativa ocuantitativa.

    2.2.1. Graficas para datos cualitativos

    Supongamos que se han recolectado los datos. Podemos resumir los da-tos mostrando los valores de variables medidas y la frecuencia con la que hanocurrido construyendo tablas estadsticas, que pueden ser usadas para mostrargraficamente los datos como una distribucion de datos.

    Cuando la variable es cualitativa, la tabla estadstica es una lista de las ca-tegoras consideradas con una medida de con que frecuencia ha ocurrido cadavalor.

    Tablas de frecuencias y graficas

    Se denomina frecuencia al numero de datos de cada categora, es decir, elnumero de veces que aparece un determinado valor de la variable. Considere-mos un conjunto de datos que consiste de n valores. Si f es la frecuencia de unvalor en particular, entonces la razon f /n es llamada su frecuencia relativa. Estoes, la frecuencia relativa de un conjunto de valores es la proporcion de los datosque tienen ese valor,

    Frecuencia relativa =frecuencia

    n.

    La lista de las categoras con la frecuencia o frecuencia relativa correspon-diente es llamada tabla de frecuencias o tabla de frecuencias relativas, respectiva-mente; ambas son tablas estadsticas.

  • 8 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    Los datos de un tabla de frecuencias los podemos representar de maneragrafica mediante un grafico de lneas, que grafica las distintas categoras en el ejehorizontal e indica su frecuencia por las alturas de las lneas verticales. Si en laslneas en un grafico de lneas se agrega un espesor, la grafica es llamada graficade barras (ver Figura 2.2).

    Ejemplo 2-1Se tiene una lista de 11 proyectos, donde cada proyecto tiene ciertas especifica-ciones tales como: descripcion de lo que se hara, plazo estimado, inversion, etc.Podemos categorizar cada proyecto en: Servicio, Rescate, Seguimiento y Taller.

    La Tabla 2.1 muestra la frecuencia de cada tipo de proyecto en una comunidaddel Pas, de donde se observa que, el tipo de proyecto con menor frecuenciason de Seguimiento y Taller mientras que el de mayor frecuencia es de Res-cate. La Tabla 2.2 muestra frecuencia relativa de cada categora de los proyectos.

    Tipo de proyecto Frecuencia

    Rescate 5

    Seguimiento 1

    Servicio 4

    Taller 1

    Tabla 2.1: Tipos de proyectos

    La Figura 2.2 muestra la representacion grafica para la tabla de frecuencias.

    Rescate Seguimiento Servicio TallerTipos de proyectos

    frecu

    encia

    01

    23

    45

    6

    Figura 2.2: Frecuencias de la Tabla 1

  • 2.2. DESCRIPCION DE DATOS CON GRAFICAS 9

    Tipo de proyecto Frecuencia Relativa

    Rescate 0.45454545

    Seguimiento 0.09090909

    Servicio 0.36363636

    Taller 0.09090909

    Tabla 2.2: Frecuencias Relativas

    Tambien se puede realizar una representacion grafica de las categoras me-diante un grafico de pastel, un grafico circular que muestra el porcentaje de lasmediciones de cada categora, donde

    porcentaje = 100 frecuencia relativa.

    Categoras Frecuencia Frecuencia Relativa Porcentaje

    Rescate 5 0.45454545 45.454545%

    Seguimiento 1 0.09090909 9.090909%

    Servicio 4 0.36363636 36.363636%

    Taller 1 0.09090909 9.090909%

    Tabla 2.3: Tabla estadstica para la grafica de pastel del ejemplo 2-1.

    Rescate 45%

    Seguimiento 9%

    Servicio 36%

    Taller 9%

    Figura 2.3: Grafica de pastel de la Tabla 2.3.

    2.2.2. Graficas para datos cuantitativos

    Las variables cuantitativas miden un monto o cantidad en cada unidad ex-perimental. La variable es discreta si solo puede tomar un numero finito o nu-

  • 10 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    merable de valores. La variable es continua si puede asumir un numero infinitode valores correspondientes a puntos en un intervalo.

    Para los datos cuantitativos tambien podemos utilizar graficas de barras ygraficas circulares. La grafica de barras usa la altura de la barra para mostrarla cantidad en una categora particular, y el grafico circular muestra como lacantidad total esta distribuida entre las categoras.

    Graficas de lneas

    Cuando una variable cuantitativa es registrada con el tiempo en interva-los de tiempo igualmente espaciados (tales como diariamente, semanalmente,mensualmente o de manera anual), el conjunto de datos forma un serie de tiem-po. Los datos de series de tiempo son presentados con mayor eficiencia en unagrafica de lneas con el tiempo como eje horizontal. Estos graficos son utilizadospara mostrar una patron o tendencia.

    Ejemplo 2-2Realizar una grafica de lneas de la tabla de registro del numero de habitantesen Mexico en los anos de 1950 a 1990.

    Ano 1950 1960 1970 1980 1990Habitantes (millones) 25.7 34.5 48.2 66.8 81.2

    Tabla 2.4: Numero de habitantes en Mexico.

    Solucion. La variable cuantitativa habitantes es medida en cinco intervalosde tiempo, creando una serie de tiempo que podemos graficar con una grafica delneas. Los intervalos de tiempo son marcados en el eje horizontal y el numero dehabitantes es marcado en el eje vertical, Los puntos de los datos son resaltadosy estan conectados por segmentos de lneas para formar el grafico de lneas dela Figura 2.4.

    1950 1960 1970 1980 1990

    30

    40

    50

    60

    70

    80

    Aos

    Hab

    itant

    es (m

    illone

    s)

    Figura 2.4: Grafico de lneas de la Tabla 2.4

  • 2.2. DESCRIPCION DE DATOS CON GRAFICAS 11

    Polgono de frecuencias

    Si el conjunto de datos tienen un numero relativamente pequeno de distin-tos valores es conveniente presentarlos en una tabla de frecuencias. Por ejemplo,la Tabla 2.5 es una tabla de frecuencias para datos que consiste del salario men-sual de 40 estudiantes graduados recientemente de ingeniera electrica. La Tabla2.5 nos dice, entre otras cosas, que el salio mas bajo de $5,000 es recibido porcuatro de los graduados, mientras que el salio mas alto de $15,000 es recibidopor un unico estudiante. El salario inicial mas comun fue $9,000 y es recibidopor 10 de los estudiantes.

    Salario inicial Frecuencia

    5 4

    6 3

    7 6

    8 0

    9 10

    10 8

    11 3

    12 1

    13 3

    14 1

    15 1

    Tabla 2.5: Tabla de frecuencias del salario inicial mensual

    Otro tipo de grafico usado para representar una tabla de frecuencias es elpolgono de frecuencias, el cual grafica las frecuencias de las diferentes categorasen el eje vertical, y entonces conecta los puntos graficados con lneas rectas.

    6 8 10 12 1402468

    10

    Salario inicial

    Frec

    uenc

    ia

    5 6 7 8 9 10 11 12 13 14 15

    Figura 2.5: Polgono de frecuencias de la Tabla 2.5

  • 12 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    Histogramas y ojivas

    Para algunos conjuntos de datos el numero de valores distintos es tambiengrande. Para tales casos, es util dividir los valores en grupos o intervalos de clase,y entonces graficar el numero de valores de los datos que caen en cada interva-lo de clase. El numero de intervalos de clase debe ser una compensacion entre(1) elegir pocas clases a un costo de perder informacion acerca de los valoresreales en una clase y (2) elegir muchas clases, que se traducira en las frecuenciasde cada clase siendo demasiado pequenas para un patron que sea discernible.Aunque de 5 a 10 intervalos de clase son tpicos, el numero aproximado es sub-jetivo, y por supuesto , podemos probar numeros diferentes de intervalos declase para ver cuales de las graficas resultantes parece ser mas revelador de losdatos. Es comun, aunque no esencial, elegir intervalos de clase de igual longitud.

    3997 49 419 980 3111 3061 2203 426

    4999 74 19 1249 2650 4597 2254 54

    234 119 99 2979 3771 4507 2250 79

    349 59 899 3314 2524 4857 2203 53

    444 89 999 399 1285 4543 2203 282

    321 74 1249 2000 2491 4579 4133 40

    199 709 2979 179 1606 4819 2964 74

    149 989 3314 299 4905 4579 450 51

    589 39 579 499 2507 1685 4904 39

    299 74 199 1497 1666 4293 2595 41

    Tabla 2.6: La compra en pesos de 80 personas en un supermercado

    Los puntos finales de un intervalo de clase son llamados lmites de clase.Adoptaremos la convencion de inclusion de extremo izquierdo, la cual estipula queun intervalo de clase su extremo izquierdo pero no su punto lmite en el extremoderecho. As, por ejemplo, el intervalo de clase 10-20 contiene todos los valoresque son mayores que o igual a 10 y menores que 20.

    La Tabla 2.6 presenta la compra de 80 personas. Una tabla de frecuenciasde clase para los datos de la Tabla 2.6 es presentada en la Tabla ??. Los intervalosde clase son de longitud 500, con el primero iniciando en 0.

    Una grafica de barras de los datos de la clase, con las barras colocadas adya-centes entre s, es llamado un histograma. El eje vertical de un histograma puederepresentarse la frecuencia de clase o la frecuencia de clase relativa; en el pri-mer caso el grafico es llamado un histograma de frecuencia y en este ultimoun histograma de frecuencia relativa. La Figura 2.6 presenta un histograma defrecuencia de los datos en Tabla 2.7.

  • 2.2. DESCRIPCION DE DATOS CON GRAFICAS 13

    Frecuencia

    (Numero de valores de los datos en

    Intervalo de Clase el intervalo)

    0-500 34

    500-1000 7

    1000-1500 4

    1500-2000 3

    2000-2500 7

    2500-3000 7

    3000-3500 4

    3500-4000 2

    4000-4500 2

    4500-5000 10

    Tabla 2.7: Una Tabla de Frecuencia de Clase

    Compras en unidades de 100 pesos

    Nm

    ero

    de o

    curre

    ncia

    0 10 20 30 40 50

    05

    1525

    35

    0 5 15 25 35 45

    Figura 2.6: Un histograma de frecuencia de la Tabla 2.7

    Algunas veces estamos interesados en el trazo de un grafico de una frecuen-cia acumulada (o frecuencia relativa acumulada). Un punto en el eje horizontalde tal grafico representa un valor posible de los datos; su trazo vertical corres-pondiente proporciona el numero (o proporcion) de los datos cuyos valores sonmenores que o iguales a este. Una grafica de frecuencia relativa acumulada delos datos de la Tabla 2.7 esta dada en la Figura 2.7. Podemos concluir de la fi-gura que 100 por ciento de los datos son menores a 5000, aproximadamente 50por ciento son menores o iguales a 1000, aproximadamente un poco mas del 80por ciento son menores que o iguales a 4000 y as sucesivamente. Un grafico defrecuencias acumuladas es llamado una Ojiva, esto es que, permite ver cuantasobservaciones se encuentran por encima o debajo de ciertos valores, en lugar desolo exhibir los numeros asignados a cada intervalo.

  • 14 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    0 1000 2000 3000 4000 50000.0

    0.2

    0.4

    0.6

    0.8

    1.0

    Compras

    Figura 2.7: Un grafico de frecuencia acumulada

    Grafico de tallo y hoja

    Una manera eficiente de organizar un conjunto de datos pequeno, y de ta-mano moderado, es utilizar un grafico de tallo y hoja. Tal grafico se obtiene alldividir cada valor de los datos en dos partes. su hoja y su tallo. Por ejemplo,si los datos son todos numeros de dos dgitos, entones podramos dejar que laparte del tallo de un valor de los datos sea su dgito de las decenas y dejar quela hoja sea su dgito de las unidades. As, por ejemplo, el valor 59 es expresadocomo

    Tallo Hoja5 9

    y los dos valores de datos 57 y 59 pueden ser representados como

    Tallo Hoja5 7,9

    Ejemplo 2-3La Tabla 2.8 da 35 cantidades de temperaturas medidas en grados Celsius endiferentes localidades del pas. Estos datos son representadas en la siguientegrafica de tallo y hoja.

    1 9.0, 9.82 3.1, 4.1, 5.3, 5.8, 6.2, 9.0, 9.53 0.0, 1.0, 2.4, 3.6, 3.7, 4.8, 5.0, 5.2, 6.04 0.0, 0.3, 1.0, 1.5, 2.1, 2.4

  • 2.3. DESCRIPCION DE DATOS CON MEDIDAS NUMERICAS 15

    Localidad Grados Celsius Localidad Grados Celsius

    1 19.0 13 23.1

    2 24.1 14 30.0

    3 40.0 15 19.8

    4 25.3 16 40.3

    5 32.4 17 41.0

    6 25.8 18 29.0

    7 26.2 19 31.0

    8 33.6 20 29.5

    9 34.8 21 33.7

    10 35.2 22 42.4

    11 41.5 23 36.0

    12 35.0 24 42.1

    Tabla 2.8: Tabla de frecuencias del salario inicial mensual

    2.3. Descripcion de datos con medidas numericas

    Utilizaremos medidas numericas calculadas por una muestra o una pobla-cion de datos. Estas medidas son llamadas parametros cuando son asociados a lapoblacion de datos y son llamados estadsticos cuando son calculados a partir dedatos muestrales.

    2.3.1. Media, mediana y moda

    Introducimos algunos estadsticos usados para describir la parte central deun conjunto de datos. Estos estadsticos son llamados medidas centrales o medidasde centro.

    La media o media aritmetica es el promedio aritmetico de un conjunto dedatos. As, la media o promedio aritmetico de un conjunto de n datos es la sumade todos estos datos dividida por n.

    Usaremos la letra griega minuscula (mu) para referirnos a la media po-blacional y el smbolo x (x barra) para referirnos a la media muestral.

    Supongamos que tenemos un conjunto de datos que consisten de n valoresnumericos, x1,x2, ...,xn, de la variable X. La media de estos datos es

    x =x1 + x2 + + xn

    n

  • 16 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    o en notacion corta como

    x =ni=1

    xi /n.

    Ejemplo 2-4Las siguientes cantidades son los registros de una evaluacion de 10 aspirantes auna gerencia:

    84,80,77,82,79,85,81,83,78,76.

    Encontrar la media muestral de estos registros.

    Solucion. La media de los registros es:

    x =84 + 80 + 77 + 82 + 79 + 85 + 81 + 83 + 78 + 76

    10= 80.5

    La media muestral x es usada como un estimador de la media poblacional des-conocida .

    Una segunda medida de tendencia central es la mediana. Ordenamos losvalores de un conjunto de n datos del mas pequeno al mas grande. Si n es impar,entonces la mediana muestral es el valor en la posicion (n+ 1)/2, y si n es par, esel promedio de los valore en las posicione n/2 y n/2 + 1.

    Ejemplo 2-5Consideremos la siguiente tabla de frecuencia de edades de miembros de unaorquesta sinfonica de jovenes adultos.

    Edad Frecuencia

    15 2

    16 5

    17 11

    18 9

    19 14

    20 13

    Encontrar la mediana muestral.

  • 2.3. DESCRIPCION DE DATOS CON MEDIDAS NUMERICAS 17

    Solucion. Puesto que hay 54 valores de los datos, se sigue que cuando los datosse colocan en un orden creciente, la mediana es el promedio de los valores enlas posiciones 27 y 28. As, la mediana muestral es 18.5

    La media muestral y la mediana muestral son estadsticos utiles para describirla tendencia central de un conjunto de datos, grandes y pequenos.

    La moda muestral es la categora que ocurre con la mayor frecuencia o valorde X de mayor frecuencia. Si no hay un solo valor que ocurra con mas frecuen-cia, entonces todos los valores que se producen con la mas alta frecuencia sonllamados valores modales. Cuando los datos en una variable continua tienen queser agrupados como en un histograma de frecuencias o histogramas de frecuen-cias relativas, la clase de mayor frecuencia es llamada la clase modal y el puntomedio es la moda.

    Ejemplo 2-6La siguiente tabla de frecuencias da los valores obtenidos en 40 lanzamientosde un dado.

    Valor del dado Frecuencia

    1 9

    2 8

    3 5

    4 5

    5 6

    6 7

    Encontrar la moda muestral.

    Solucion. La moda muestral es 1, el valor de mayor ocurrencia.

    2.3.2. Varianza y desviacion estandar

    Podemos observar que los conjuntos de datos pueden tener el mismos cen-tro con distinto aspecto, debido a la distribucion o propagacion de los datos des-de el centro. Presentaremos algunos estadsticos que describan la propagaciono variabilidad de los valores de los datos.

  • 18 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    El rango R de un conjunto de n datos es definido como la diferencia entre eldato mas grande y el dato mas pequeno. Por ejemplo, el rango de los valores dela Tabla 2.8 es 42.4 19.0 = 23.4.

    Mediremos la variabilidad mediante la distancia entre cada dato (medi-cion) y la media x. Si las distancias son grandes, la variabilidad o propagacionsera mayor que si las distancias sean mas pequena. La desviacion de un dato,digamos xi , respecto de la media x es (xi x). Los datos a la derecha de la mediaproducen desviaciones positivas y los datos a la izquierda de la media producendesviaciones negativas.

    Las desviaciones de un conjunto de datos contienen informacion sobre lavariabilidad de los datos. Es natural considerar el promedio de las desviacionescomo una medida numerica de la variabilidad de los datos, el problema es quela suma de las desviaciones es cero. Una alternativa es considerar el promediodel valor absoluto de las desviaciones. Sin embargo, vamos a considerar la sumade los cuadrados, de donde surgira una medida llamada varianza.

    Usaremos el smbolo s2 para una varianza muestral y el smbolo 2 parauna varianza poblacional.

    La varianza de una poblacion de N datos es el promedio de los cuadradosde las desviaciones de los datos respecto a la media y es denotada por 2. Estoes, si x1,x2, ...,xN son los valores de un conjunto de N datos, entonces

    2 =ni=1

    (xi )2/(N ).

    La varianza de una muestra de n datos es la suma de los cuadrados de lasdesviaciones de los datos respecto a la media x y es dividida por (n 1), y esdenotada por 2. Esto es, si x1,x2, ...,xn son los valores de un conjunto de n datos,entonces

    s2 =ni=1

    (xi x)2/(n 1).

    Por razones tecnicas divide la suma de los cuadrados de las desviaciones porn 1, en lugar de n.

    Ejemplo 2-7Encontrar la varianza muestral de los conjuntos de datos A y B dados abajo.

    A : 3,4,6,7,10 B : 20,5,15,24Solucion. Como la media muestral para el conjunto de datos A es x = (3 + 4 + 6 +7 + 10)/5 = 6, se sigue que su varianza muestral es

    s2 = [(3)2 + (2)2 + (1)2 + 02 + 12 + 42]/4 = 7.5

  • 2.3. DESCRIPCION DE DATOS CON MEDIDAS NUMERICAS 19

    La media muestral para el conjunto de datos B es tambien 6; su varianza mues-tral es

    s2 = [(26)2 + (1)2 + 92 + (18)2]/3 360.67As, ambos conjuntos de datos tienen la misma media muestral, existe una ma-yor variabilidad en los valores del conjunto B que en el conjunto A.

    Una alternativa para el calculo de la varianza muestral s2 es mediante la siguien-te formula

    s2 =

    x2i

    (xi)2

    nn 1

    dondex2i es la suma de los cuadrados de los datos y (

    xi)2 es el cuadrado

    de la suma de los datos. Para encontrar (xi)2 necesitamos el cuadrado de cada

    dato y entonces sumarlos todos juntos.

    La desviacion estandar muestral, s, de un conjunto de datos es igual a la razcuadrada positiva de la varianza, s2. La desviacion estandar es medida con lasmismas unidades como los datos.

    Ejemplo 2-8Calcular la desviacion estandar de los conjuntos A y B del Ejemplo 2-7.

    Solucion. Los conjuntos A y B tienen varianzas iguales a 7.5 y 360.67, respec-tivamente. As, la desviacion estandar para el conjunto A es s 2.74, para elconjunto B es s 19.

  • 20 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    Ejercicios

    Comprension de los conceptos

    2.1 Unidades experimentales Identifi-car las unidades experimentales en lascuales las siguientes variables son me-didas:

    a. Genero de un estudiante.

    b. Numero de errores en un examenparcial.

    c. Edad de un paciente con cancer.

    d. Color de un carro entrando a unestacionamiento.

    2.2 Cualitativas o cuantitativas Iden-tificar cada una de las variables comocuantitativa o cualitativa:

    a. Cantidad de tiempo que se nece-sita para armar un rompecabezassencillo.

    b. Numero de estudiantes en unsalon de clases de primer grado.

    c. Clasificacion de un poltico re-cien elegido (excelente, bueno,regular, malo).

    d. Estado en el que una persona vi-ve.

    2.3 Discreto o continuo? Identificarlas siguientes variables cuantitativascomo discretas o continuas:

    a. Poblacion en una area particularde Mexico.

    b. Peso del periodico recuperadopor reciclaje en un unico da.

    c. Tiempo para completar un exa-men de sociologa.

    d. Numero de consumidores en unaencuesta de 1000 que consideranimportante el etiquetado nutri-cional de los productos.

    Tecnicas basicas

    2.4 Cincuenta personas estanagrupadas en cuatro categoras A, B, Cy D. El numero de personas que caenen cada categora se muestra en la si-guiente tabla:

    Categora FrecuenciaA 11B 14C 20D 5

    a. Cual es la unidad experimenta?

    b. Quel esta midiendo la variable?

    c. Construir una grafica de pastelpara describir los datos.

    d. Construir una grafica de barraspara describir los datos.

    e. Cual es la proporcion de las per-sonas que estan en las categorasB, C o D?

    f. Cual es el porcentaje de las per-sonas que no estan en la cate-gora B?

    2.5 Construir una grafica de tallo y ho-ja para estas 50 mediciones:

  • 2.3. DESCRIPCION DE DATOS CON MEDIDAS NUMERICAS 21

    3.1 4.9 2.8 3.6 2.54.5 3.5 3.7 4.1 4.92.9 2.1 3.5 4.0 3.72.7 4.0 4.4 3.7 4.23.8 6.2 2.5 2.9 2.85.1 1.8 5.6 2.2 3.42.5 3.6 5.1 4.8 1.63.6 6.1 4.7 3.9 3.94.3 5.7 3.7 4.6 4.05.6 4.9 4.2 3.1 3.9

    a. Describir la forma de la distribu-cion de los datos. Se puede veralgun valor atpico?

    b. Usar el grafico de tallo y hojapara encontrar las observacionesmas pequenas.

    c. Encuentra las octava y novenaobservaciones mas grandes.

    2.6 En referencia al Ejercicio 2.5. Cons-truir un histograma de frecuencias re-lativas para los datos.

    a. Aproximadamente, cuantos in-tervalos de clase se deben usar?

    b. Suponer que se decide usar inter-valos que inician en 1.6 con lon-gitud de clase igual a .5 (es decir,de 1.6 a 2.1, 2.1 a 2.6) Construirun histograma de frecuencias re-lativas para los datos.

    c. Que fraccion de las medicionesson menores que 5.1?

    d. Que fraccion de las medicionesson mayores que 3.6?

    e. Comparar el histograma de fre-cuencias relativas con el graficode tallo y hoja del Ejercicio 2.5.las formas son similares?

    2.7 Una variable discreta solo puedetomar los valores 0,1 o 2. Un conjuntode 20 mediciones en esta variable semuestra aqu:

    1 2 1 0 22 1 1 0 02 2 1 1 00 1 2 1 1

    a. Construir un histograma de fre-cuencias relativas para los datos.

    b. Que proporcion de las medicio-nes son mayores que 1?

    c. Que proporcion de las medicio-nes son menores que 2?

    d. Si una medicion es seleccionadaal azar de las 20 mediciones mos-tradas, cual es la probabilidad deque sea un 2?

    2.8 Resultados de los examenesLos resultados de los examenes en unaprueba de 100 puntos se registraronpara 20 estudiantes:

    61 93 91 86 5563 86 82 76 5794 89 67 62 7287 68 65 75 84

    a. Usar una grafica apropiada paradescribir los datos.

    b. Describir la forma y la localiza-cion de los resultados.

    c. La forma de la distribucion esinusual? Hay alguna razon paraque la distribucion de los resul-tados tenga tal forma?

    2.9 Se tiene n = 5 mediciones;0,5,1,1,3. Calcular la media, la media-na y la moda.

    2.10 Se tiene n = 10 mediciones;3,5,4,6,10,5,6,9,2,8.

    a. Calcular x.

    b. Encontrar m.

  • 22 CAPITULO 2. ESTADISTICA DESCRIPTIVA

    c. Encontrar la moda.

    2.11 Starbucks El numero de tiendasde cafe Starbucks en 18 ciudades a me-nos de 20 millas de la Universidad Ri-verside de California se muestran en lasiguiente tabla (www.starbucks.com).

    16 7 2 6 41 7 1 1 13 2 11 15 1 4 12

    a. Encontrar la media, la mediana yla moda.

    b. Comparar la media y la mediana.Que se puede decir acerca de la

    forma de esta distribucion?

    2.12 Se tiene n = 5 mediciones:2,1,1,3,5.

    a. Calcular la media, x.

    b. Calcular la varianza, s2, usandola formula dada por la defini-cion.

    c. Encontrar la desviacion estandars.

    d. Encontrar s2 y s, usando laformula para calcularlas. Com-parar los resultados con aquellosencontrados en la parte b y c.

    e. Encontrar en rango.

  • 3. Probabilidad

    Contenido3.1. Espacio muestral y eventos . . . . . . . . . . . . . . . . . . . . 233.2. Algebra de eventos . . . . . . . . . . . . . . . . . . . . . . . . . 263.3. Axiomas de probabilidad . . . . . . . . . . . . . . . . . . . . . 263.4. Espacios de probabilidad discreta . . . . . . . . . . . . . . . . 283.5. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.6. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . 30

    Objetivo: Comprender los conceptos basicos de probabilidad y asignar la pro-babilidad de un evento.

    Panorama general: Se dan los conceptos de espacio muestral, evento y probabi-lidad. Se da un conjunto de tecnicas para la asignacion de la probabilidad a unevento.

    El termino probabilidad es utilizado como medida para la ocurrencia de unevento futuro y es muy importante en distintas areas de trabajo, donde se gene-ran observaciones que no se pueden predecir con certeza.

    Es claro que el concepto de probabilidad es utilizado en distintas areas delconocimiento como fsica, biologa, sociologa o ingeniera.

    Nuestro interes principal es acerca de experimentos cuyos posibles resul-tados no son predecibles con certeza. El fin es sacar conclusiones acerca de unapoblacion de objetos mediante la realizacion de un experimento.

    3.1. Espacio muestral y eventos

    Iniciamos definiendo un experimento como un proceso mediante el cual seobtiene un observacion (o medicion), las cuales pueden o no ser valores numeri-cos. Por ejemplo,

    Mediciones diariamente de lluvia.

    Lanzar una moneda y observar la cara que aparece.

    Registro de la calificacion de un examen.

    El resultado de un experimento realizado es llamado evento simple, denota-do por la letra A con un subindice.

    El conjunto de todos los posibles resultados de un experimento aleatorio esllamado el espacio muestral del experimento y es denota por S.

    23

  • 24 CAPITULO 3. PROBABILIDAD

    Se llama espacio muestral discreto si consiste de un numero finito o infinitocontable de resultados posibles.

    Un evento es una coleccion de posibles resultados de un experimento, estoes, cualquier subconjunto del espacio muestral S ( incluyendo S mismo). Si elevento consiste de un unico resultado se llama evento simple.

    Sea A un evento. Si el resultado s del experimento esta contenido en A, en-tonces decimos que A ha ocurrido.

    Ejemplo 3-1Supongamos que se lanza una moneda. El espacio muestral para este experi-mento es S = {cara ,sello}, los eventos simples son:

    E1: Cae cara

    E2: Cae sello

    Los resultados de la moneda, cara y sello, se denotaran por las letras c y s,respectivamente. As, se puede escribir S = {c, s}.

    Ejemplo 3-2Supongamos que se lanza un dado y se observa el numero que aparece en lacara superior. El espacio muestral para este experimento es S = {1,2,3,4,5,6} ylos eventos simples son

    E1: Observar un 1 E3: Observar un 3 E5: Observar un 5

    E2: Observar un 2 E4: Observar un 4 E6: Observar un 6

    Sin embargo, se pueden tener otros eventos tales como:

    A: Observar un numero impar

    B: Observar un numero menor o igual que 4

    As, podemos escribir S = {E1,E2,E3,E4,E5,E6}, A = {E1,E3,E5} y B ={E1,E2,E3,E4}.

    Para cualesquiera dos eventos A y B de un espacio muestral S, definimosnuevos eventos:

    union: La union de A y B, escrita AB, consiste de todos los resultados quese encuentran en A o en B o en ambos A y B:

    AB = {s S |s A o s B}.Esto es, el evento AB ocurrira si cualquiera de los dos A o B ocurren.

  • 3.1. ESPACIO MUESTRAL Y EVENTOS 25

    interseccion: La interseccion de A y B, escrita A B, consiste de todos losresultados que estan en ambos A y B:

    AB = {s S |s A y s B}.Esto es, el evento AB ocurrira si A y B ocurren.

    Ejemplo 3-3Consideremos el Ejemplo 3-2. Entonces,

    AB = {E1,E2,E3,E4,E5}.AB = {E1,E3}.

    El complemento de un evento A, escrito Ac, consiste de todos los resultadosen el espacio muestral S que no estan en A:

    Ac = {s S |s < A}.Esto es, Ac ocurrira si y solo si A no ocurre.

    Nos referimos a un evento que no puede ocurrir como el evento nulo y lodenostamos por . As, se refiere al evento de ningun resultado. Luego, AB =, implica que los eventos A y B no pueden ambos ocurrir, entonces A y B sedicen ser mutuamente excluyentes.

    Puesto que el experimento debe suceder algun resultado, se sigue que Sc = .

    La definicion de union e interseccion de eventos definidos en un mismoespacio muestral se puede extender a mas de dos eventos. Definimos la unionde los eventos A1,A2, ...,An como el evento que consiste de todos los resultadosque existen en Ai , para algun i = 1,2, ...,n, y se denotara por A1 A2,, ...,An oni Ai :

    ni Ai = {s S |s Ai para algun i = 1,2, ...,n}.

    Esto es, la union de los Ai ocurre cuando al menos uno de los eventos Ai ocurre.De manera similar, se define la interseccion de los eventos A1,A2, ...,An como elevento que consiste en los resultados que existen en todos los eventos Ai , coni = 1,2, ...,n, y se denotara por A1 A2, ...,An o ni Ai :

    ni Ai = {s S |s Ai para todo i = 1,2, ...,n}.

    Para cualesquiera dos eventos A y B, si todos los resultados que estan enA tambien estan en B, entonces se dice que A esta contenido en B y se escribeA B. Si A B y B A, entonces se dice que A y B son iguales y se escribe A = B.

  • 26 CAPITULO 3. PROBABILIDAD

    3.2. Algebra de eventos

    Las operaciones de uniones, intersecciones y complementos entre eventosobedecen ciertas reglas. A continuacion damos algunas propiedades entre ope-raciones de eventos.

    Para cualesquiera tres eventos A,B y C, definidos en un espacio muestral S,tenemos:

    1. ConmutatividadAB = BAAB = BA

    2. AsociatividadA (BC) = (AB)CA (BC) = (AB)C

    3. Leyes distributivas

    A (BC) = (AB) (AC)A (BC) = (AB) (AC)

    4. Leyes de DeMorgan(AB)c = Ac Bc(AB)c = Ac Bc

    3.3. Axiomas de probabilidad

    Dado un espacio muestral S, estamos interesados en asignar probabilida-des a eventos, complemento de eventos, uniones de eventos e intersecciones deeventos. As que, debemos considerar una coleccion de eventos que incluya lascombinaciones de estos eventos.

    Continuamos de manera formal con el problema importante de asignaruna probabilidad al resultado de un experimente y, de manera mas general, aun evento. Hablaremos de la probabilidad P (A) asignada a un evento A. Aqu,P (A) corresponde a la frecuencia relativa de A, en un numero muy grande derepeticiones independientes de un experimento.

    Desde un punto de vista matematico, supondremos que para cada evento Ade un experimento que tiene un espacio muestral S, existe un numero, denotadopor P (A), que satisface los siguientes axiomas:

    Axioma 1. Para cualquier evento definido sobre S, P (A) 0.Axioma 2. P (S) = 1.

  • 3.3. AXIOMAS DE PROBABILIDAD 27

    Axioma 3. Para cualquier sucesion de eventos mutuamente excluyentesA1,A2, ... (es decir, eventos para los que Ai Aj =, cuando i , j),

    P (i Ai) =i

    Ai .

    Como consecuencia de estos axiomas se tienen los siguientes resultados.

    R1. P (Ac) = 1 P (A).R2. P () = 0.R3. Si A = A1 A2 An y A1,A2, ...,An son mutuamente excluyentes,

    entonces

    P (A) =ni=1

    P (Ai).

    En particular si A = S, el espacio muestral, entonces

    P (A1) + P (A2) + + P (An) = 1.

    R4. Para dos eventos A y B,

    P (A) = P (AB) + P (ABc).

    R5. Si A B, entonces P (A) P (B).R6. Para cualquier evento A, P (A) 1.

    Ejemplo 3-4Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea (a) roja,(b) blanca, (c) azul, (d) no roja y (e) roja o blanca.

    Solucion. (a) Denotese por R, B y A los eventos a extraer una bola roja, blanca yazul, respectivamente. Entonces

    P(R) =maneras de elegir una bola roja

    maneras de elegir una bola=

    66 + 4 + 5

    =25

    (b) P(B) =4

    6 + 4 + 5=

    415

    (c) P(A) =5

    6 + 4 + 5=

    515

    =13

    (d) P(no roja) = P(R) = 1R = 1 25

    =35

    (e) P(RB) = P(A) = 1P(A) = 1 13

    =23

  • 28 CAPITULO 3. PROBABILIDAD

    3.4. Espacios de probabilidad discreta

    Consideremos que el espacio muestral S es discreto. Tomamos a F comoel conjunto que consiste de todos los subconjunto de S y asignamos las proba-bilidades de la siguiente manera. Sea S = {s1, s2, ...} y sean p1,p2, ..., numeros nonegativos cuya suma es 1. Si A es cualquier subconjunto de S, definimos

    P (A) =siA

    pi .

    En particular,

    P ({si}) = pi .Esto es, la probabilidad de un evento A se calcula mediante la suma de las pro-babilidades de los eventos simples en A.

    En el caso especial, si S = {s1, s2, ..., sn} y pi = 1/n, i = 1,2, ...,n, en este caso,

    P (A) =N (A)N (S)

    .

    En palabras, si asumimos que cada resultado de un experimento es igualmenteprobable de ocurrir, entonces la probabilidad de cada evento A se calcula con-tando el numero de resultados favorables entre el numero total de resultados.

    Ejemplo 3-5Supongamos que se lanzan dos monedas equilibradas y se registran los resulta-dos. Encontrar la probabilidad de observar exactamente un sello.

    Solucion. Realizamos la lista de los eventos simples en el espacio muestral. Lasletras c y s significan que se observa una cara o un sello, respectivamente, enun lanzamiento de una moneda. Debido a que las monedas estan equilibradas,cualquiera de los eventos simples es tan probable como cualquier otro. Puestoque la suma de los cuatro eventos simple debe ser 1, cada uno debe tener pro-babilidad P (Ei) = 1/4. Los eventos simples en el espacio muestral se muestranen la tabla ?? , junto con sus probabilidades igualmente probables. Para encontrarP (A) = P (observar exactamente un sello), necesitamos encontrar todos los even-tos simples que resulten en el evento A; a saber, E2 y E3:

    P (A) = P (E2) + P (E3)

    = 1/4 + 1/4

    = 1/2.

  • 3.5. INDEPENDENCIA 29

    Evento Primer lanzamiento Segundo lanzamiento P (Ei)

    E1 c c 1/4E2 c s 1/4E3 s c 1/4E4 s s 1/4

    Tabla 3.1: Eventos simples y sus probabilidades del Ejemplo 3-5.

    El calculo de la probabilidad de un evento

    1 Lista de todos los eventos simples en el espacio muestral.

    2 Asignar una probabilidad apropiada a cada evento simple.

    3 Determinar cuales eventos simples caen en el evento de interes.

    4 Sumar las probabilidades de los eventos simples que caen en elevento de interes

    3.5. Independencia

    Ahora estamos interesados en asignar probabilidades de ocurrencia de even-tos dada alguna informacion.

    Sean A y B dos eventos. Si se tiene informacion sobre la ocurrencia o noocurrencia de algun evento B y no cambian las posibilidades de ocurrencia delevento A, entonces se dice que los eventos A y B son independientes. As, A esindependiente de B si P (AB) = P (A)P (B) (la ocurrencia de B no cambia las po-sibilidades de la ocurrencia de A) y si P (ABc) = P (A)P (Bc) (si la no ocurrenciade B no cambia las posibilidades de la ocurrencia de A). Sin embargo, la primeracondicion implica la segunda, por lo que llamaremos al evento A independientedel evento B si y solo si P (AB) = P (A)P (B).

    En general, consideramos que mas de dos eventos, digamos los eventos Aicon i I y el conjunto {i1, ..., ir } de indices distintos, son independientes si unadeclaracion relativa a uno o mas de los eventos Ai1 , ...,Air no cambian las posibi-lidades de ocurrencia acerca de cualquiera de los eventos restantes. Esto es, losAi son independientes si y solo si para toda coleccion finita de {i1, ..., ir } de indicesdistintos en I , tenemos

    P (Ai1 Ai2 Air ) = P (Ai1 )P (Ai2 ) P (Air ).En particular, para que los eventos A1,A2 y A3 sean independientes se debetener que

    P (A1 A2 A3 A4) = P (A1)P (A2)P (A3)P (A4)

  • 30 CAPITULO 3. PROBABILIDAD

    y ademas,P (A1 A2) = P (A1)P (A2)P (A1 A3) = P (A1)P (A3)P (A2 A3) = P (A2)P (A3)

    Tambien se puede considerar el complemento de cada evento, por ejemplo, si seconsidera Ac3 se tiene

    P (A1 A2 Ac3) = P (A1)P (A2)P (Ac3)P (A1 Ac3) = P (A1)P (Ac3)P (A2 Ac3) = P (A2)P (Ac3)

    Ejemplo 3-6Se lanzan dos monedas y se observan los resultados. Definir estos eventos:

    A: Cara en la primer moneda

    B: Sello en la segunda moneda

    Los eventos A y B son independientes?

    Solucion. De ejemplos previos se sabe que S = {cc,cs, sc, ss}. Usar estos cuatroeventos simples para encontrar

    P (A) =12, P (B) =

    12

    y P (AB) = 14.

    Puesto que P (A)P (B) =(1

    2

    )(12

    )=

    14

    , tenemos que P (A)P (B) = P (A B) y loseventos deben ser independientes.

    3.6. Probabilidad condicional

    SeanA y B dos eventos. Si se tiene informacion sobre la ocurrencia o no ocu-rrencia de algun evento B y cambian las posibilidades de ocurrencia del eventoA, entonces hay ausencia de independencia en los eventos A y B. El concepto deprobabilidad condicional proporciona una medida cuantitativa de la alteracionde las posibilidades de ocurrencia. Si el evento B ha ocurrido, entonces el restode los eventos del espacio muestral son descartados, y el evento B sera consi-derado como un nuevo espacio muestral. Ahora, con el fin de que el evento Aocurra es necesario que se tenga como ocurrencia un resultado que este en elevento A como en el evento B, es decir, en A B. Por lo tanto, la probabilidadcondicional de un evento A dada la ocurrencia de un evento B sera igual a laprobabilidad del evento AB relativa a la probabilidad del evento B, esto es,

    P (A|B) = P (AB)P (B)

    siempre que P (B) > 0.

  • 3.6. PROBABILIDAD CONDICIONAL 31

    Ejemplo 3-7Supongamos que en la poblacion en general, existe 51% de hombres y 49% demujeres, y que la proporcion de hombres y mujeres daltonicos se muestra en latabla de abajo:

    Hombres (B) Mujeres (Bc) TotalDaltonico (A) .04 .002 .042No daltonico (Ac) .47 .488 .958Total .51 .49 1.00

    Si una persona es sacada al azar de esta poblacion y se encuentra que es un hom-bre (evento B), cual es la probabilidad de que el hombre sea daltonico (eventoA)? Si sabemos que el evento B ha ocurrido, debemos restringir nuestro enfoquea solo el 51% de la poblacion masculina. La probabilidad de ser daltonica, dadoque la persona es masculina, es 4% del 51%, o

    P (A|B) = P (AB)P (B)

    =.04.51

    = .078

    Cual es la probabilidad de que sea daltonica, dado que la persona es femenina?Ahora estamos restringidos a solo el 49% de la poblacion que es femenina, y

    P (A|Bc) = P (ABc)

    P (Bc)=.002.49

    = .004

    Notar que la probabilidad del evento A cambia, dependiendo de si el evento Bocurre. Esto indica que los dos eventos son dependientes.

    Relacionamos los conceptos de independencia y probabilidad condicionalde la siguiente manera:

    a) Si P (B) > 0, los eventos A y B son independientes si y solo si P (A|B) = P (A).b) Si P (A1 A2 An1) > 0, entonces

    P (A1 An) = P (An|A1 A2 An1)es decir, se puede considerar B = A1 A2 An1 en a).

    Sean A y B eventos. Utilizaremos las probabilidades P (A|B) y P (B|A) para calcu-lar la probabilidad de que ambos eventosA y B ocurran, cuando un experimentoes realizado.

    La ley multiplicativa de probabilidad

    La probabilidad de que ambos eventos A y B ocurran cuando un experi-mento es realizado es

    P (AB) = P (A)P (B|A)

  • 32 CAPITULO 3. PROBABILIDAD

    oP (AB) = P (B)P (A|B).

    Si A y B son independientes, entonces

    P (AB) = P (A)P (B).La ley aditiva de probabilidad

    La probabilidad de la union de dos eventos A y B es

    P (AB) = P (A) + P (B) P (AB).Si A y B son eventos mutuamente excluyentes, P (AB) = 0 y P (AB) = P (A) +P (B)

    Ejemplo 3-8Una empresa de prospeccion de petroleo planea perforar dos pozos explorato-rios. La evidencia pasada se utiliza para evaluar los posibles resultados listadosen la Tabla 3.2. Encontrar P (AB) y P (BC).

    Solucion. Por su definicion, los eventos A,B y C son mutuamente excluyentesconjuntamente porque la ocurrencia de un evento imposibilita la ocurrencia decualquiera de los otros dos. Por lo tanto,

    P (AB) = P (A) + P (B) = .80 + .18 = .98y

    P (BC) = P (B) + P (C) = .18 + .02 = .20El evento AB puede ser descrito como el evento que al menos uno de los pozosproduce petroleo o gas, y BC describe el evento que a lo mas uno de los pozosproduce gas o petroleo.

    Evento Descripcion ProbabilidadA Ni un pozo produce petroleo o gas .80B Exactamente uno produce petroleo o gas .18C Ambos pozos producen petroleo o gas .02

    Tabla 3.2: Resultados del experimento para la extraccion de petroleo.

  • 3.6. PROBABILIDAD CONDICIONAL 33

    EjerciciosTecnicas basicas

    3.1 Lanzamiento de un dado Unexperimento involucra lanzar un dado.Estos son los eventos:

    A: Observar un 2.

    B: Observar un numero par.

    C: Observar un numero mayorque 2.

    D: Observar A y B.

    E: Observar A o B o ambos.

    F: Observar A y C.

    a. Listar los eventos simples en elespacio muestral.

    b. Listar los eventos simples en ca-da uno de los eventos del A al F

    c. Que probabilidades se debenasignar a los eventos simple?

    d. Calcular las probabilidades delos seis eventos del A al F me-diante la suma apropiada de pro-babilidades de los eventos sim-ples.

    3.2 Un espacio muestral consta de10 eventos simples: E1,E2, ...,E10. SiP (E1) = 3P (E2) = 0.45 y el resto delos eventos simples son equiprobables,encontrar las probabilidades de estoseventos simples restantes.

    3.3 Cuatro monedas Un frasco contie-ne cuatro monedas: una de 1 peso, unade 2 pesos, una de 5 y una de 10 pesos.Tres monedas son seleccionadas alea-toriamente del frasco:

    a. Listar los eventos simples en S.

    b. Cual es la probabilidad de quela seleccion contenga la monedade 10 pesos?

    c. Cual es la probabilidad de quela cantidad total sea igual a 16pesos o mas?

    3.4 El problema de la urna Un tazoncontienes tres bolas rojas y dos bolasamarillas. Se seleccionan dos bolas demanera aleatoria y sus colores son re-gistrados. Usar un diagrama de arbolpara listar los 20 eventos simples en elexperimento, teniendo en cuenta el or-den en que se extraen las bolas.

    3.5 El problema de la urna, continui-dad En referencia al Ejercicio 3.4. Unabola es seleccionada de forma aleatoriadel tazon que contiene tres rojas y dosamarillas. Su color es anotado, y la bo-la es regresada al tazon antes de selec-cionar una segunda bola. Listar los cin-co eventos simples que deben ser agre-gados al espacio muestral en el Ejerci-cio 3.4.

    3.6 Usar la relacion de eventos para llenar los espacios en blanco en la tabla deabajo.

    P (A) P (B) Condiciones para los eventos A y B P (AB) P (AB) P (A|B).3 .4 .12.3 .4 .7.1 .5 Mutuamente exclusivos.2 .5 Independientes

  • 34 CAPITULO 3. PROBABILIDAD

    3.7 Usar la relacion de eventos para llenar los espacios en blanco en la tabla deabajo.

    P (A) P (B) Condiciones para los eventos A y B P (AB) P (AB) P (A|B).3 .4 Mutuamente exclusivos.3 .4 Independientes.1 .5 .1.2 .5 0

    3.8 Un experimento puede resultar enuno de los cinco eventos simples igual-mente probables, E1,E2,E3,E4,E5. Loseventos A , B y C son definidos como:

    A: E1,E3 P (A = .4)B: E1,E2,E4,E5 P (B) = .8C: E3,E4 P (C) = .4

    Encontrar las probabilidades asocia-das con estos eventos compuestos me-diante el listado de los eventos simplesen cada uno.

    a. Ac b. AB c. BCd. AB e. B|C f. A|Bg. ABC h. (AB)c

    3.9 En referencia al Ejercicio 3.8. Cal-cular las siguientes probabilidades:

    a. P (Ac) b. P ((AB)c)

    3.10 Considerar un problema de selec-cionar dos aplicaciones para un trabajode un grupo de cinco e imaginar quelas aplicaciones son muy competentes,siendo 1 la mejor, 2 la segunda mejor,y as sucesivamente para 3,4 y 5. Estasclasificaciones son desconocidas parael empleador. Definir dos eventos A yB como:

    A: El empleador selecciona la mejory una de las dos peores (las apli-caciones 1 y 4 o 1 y 5).

    B: El empleador selecciona al me-nos una de las dos mejores.

    Encontrar la probabilidad de estoseventos.

  • 4. Variables aleatorias y esperanza

    Contenido4.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . 354.2. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . 394.3. Valor esperado de una variable aleatoria . . . . . . . . . . . . 40

    Objetivo: Identificar una variable aleatoria y obtener su funcion de distribu-cion.

    Panorama general: Se da la definicion de variable aleatoria y su funcion de dis-tribucion.

    Los eventos de mayor interes en la ciencia, ingeniera o persona de negociosson aquellos identificados por numeros, llamados eventos numericos. Por ejem-plo, una persona de negocios esta interesada en el evento de que el siguiente anolas ventas llegaran a 3 millones de cierto producto. Tambien, un ingeniero civilno se ocupa directamente de los levantamientos y descensos diarios del nivel deagua de un reservorio (el cual puede ser considerado como el resultado de unexperimento) pero solo puede preocuparse por el nivel al final de una tempo-rada de lluvia. Estas cantidades de interes que son determinas por el resultadodel experimento son conocidas como variables aleatorias.

    4.1. Variables aleatorias

    Cuando realizamos algun experimento estamos interesados en el resultado,esto nos lleva a estudiar el espacio muestral S. Puesto que las variables cuanti-tativas generan datos numericos y las variables cualitativas generan datos ca-tegoricos, describir el espacio muestral S sera muy tedioso si los elementos de Sno son numeros. La manera de estudiar dicho espacio sera asignando un valornumerico a cada evento A del espacio muestral S.

    Consideremos un experimento aleatorio con un espacio muestral S. Defini-mos una variable aleatoria como una funcion X que asigna a cada elemento A Suno y solo un numero X(A) = x. Aqu, el espacio o rango de la funcion X son losnumeros reales D = {x | X(A) = x,A S} (por lo general es un conjunto contableo un intervalo de numeros reales).

    Algunos ejemplos de variables aleatorias son:

    X:= El numero de defectos en un mueble seleccionado aleatoriamente.

    X:= La suma de las cantidades observadas de las caras superiores en ellanzamiento de dos dados.

    35

  • 36 CAPITULO 4. VARIABLES ALEATORIAS Y ESPERANZA

    Ejemplo 4-1Supongamos que se lanzan dos monedas y se observan los resultados. Sea Xigual al numero de caras obtenidas. Identificar los eventos simples en S, asignarun valor de X a cada evento simple e identificar los eventos simples asociadoscon cada valor de la variable aleatoria X.

    Solucion. Suponer que c y s representan cara y sello, respectivamente. Conside-rar un par ordenado de smbolos para identificar los resultados de la primeray segunda moneda. As, cs implica una cara en la primera moneda y un selloen la segunda moneda. Entonces, los cuatro eventos simples en S son: E1 := cc,E2 := cs, E3 := sc y E4 := ss. Los valores de X asignados a los eventos simplesdependen del numero de caras asociadas con cada evento, por ejemplo, paraE4 =ss la Variable X le asigna el valor x = 0. La Tabla 4.1 muestra los valoresde X asignados a cada evento simple y la Tabla 4.2 muestra los eventos simplesasociados con cada valor de la variable X.

    Ejemplo 4-2Supongamos que se lanzan dos dados y que solo estamos interesados en la sumade los dos dados. Realizamos lo siguiente:

    1. Describimos el espacio muestral S del experimento aleatorio. En este casoes:

    S ={(1,1), (1,2), (1,3), (1,4), (1,5), (1,6, ),(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),

    (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),

    (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),

    (5,1), (5,2), (5,3), (5,4), (5,5), (5,6),

    (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)},el cual consta de los 36 eventos simples A1 = (1,1),A2 = (1,2), ...,A36 =(6,6).

    2. Definimos una funcion que asigne la suma de los resultados de los dosdados, a saber,

    X((d1,d2)) = d1 + d2,

    donde d1 indica el resultado del primer dado y d2 el resultado del segundodado.

    3. Observamos que la funcion X solo toma los valores 2,3,4,5,6,7,8,9,10,11y 12.

    la funcion X asigna a cada resultado (d1,d2) S uno y solo un valor X((d1,d2)) =d1 + d2, , la cual representa la suma de los dos dados, donde d1 es resultadodel primer dado y d2 es el resultado del segundo dado. Entonces la funcion X esuna variable aleatoria con rango {2,3,4,5,6,7,8,9,10,11,12} (que es un conjuntofinito).

  • 4.1. VARIABLES ALEATORIAS 37

    Observemos que se pueden definir otras variables aleatorias en el espacio mues-tral del Ejemplo 5-2 tales como: la diferencia de los resultados (X((d1,d2)) =|d1 d2|) o la suma de los cuadrados de cada resultado (X((d1,d2)) = d21 + d22 ).

    Ejemplo 4-3En un espacio muestral discreto (S,F ) cada funcion con valores numericos esuna variable aleatoria.

    Eventosimple Moneda 1 Moneda 2 P (Ei) x

    E1 c c 1/4 2E2 c s 1/4 1E3 s c 1/4 1E4 s s 1/4 0

    Tabla 4.1: Eventos simples y sus probabilidades al lanzar dos monedas .

    Eventos simplesx en x p(x)

    0 E4 1/41 E2,E3 2/42 E1 1/4

    Tabla 4.2: Distribucion de probabilidad para X (X = Numero de caras).

    Como en el captulo 2, las variables aleatorias cuantitativas se clasificancomo discretas o continuas, de acuerdo a los valores que X pueda asumir. Esimportante distinguir entre variables aleatorias discretas y continuas porqueson usadas diferentes tecnicas para describir sus distribuciones.

    Los eventos de interes frecuentemente son eventos numericos que corres-ponden a valores de una variable aleatoria discreta, tales como: el numero deartculos defectuosos de una produccion o el numero de accidentes en un cru-ce de avenidas. Por lo tanto, es necesario conocer las probabilidades de estoseventos.

    Consideremos una variable aleatoria discreta X con un espacio finito D ={x1,x2, ...,xm}. Estos m subconjuntos, x1,x2, ...,xm, son de interes y estan dadospor

    {A S |X(A) = xi}, para i = 1,2, ...,m.

  • 38 CAPITULO 4. VARIABLES ALEATORIAS Y ESPERANZA

    Ejemplo 4-4Consideremos el espacio muestral S de la variable aleatoria discreta X del Ejem-plo 4-2, definida como la suma de los resultados de los dos dados. Entonces,

    El espacio finito de la variable X es D = {2,3,4,5,6,7,8,9,10,11,12} Los subconjuntos de interes son:

    {A S |X(A) = 2} = {(1,1)}{A S |X(A) = 3} = {(1,2), (2,1)}{A S |X(A) = 4} = {(1,3), (2,2), (3,1)}{A S |X(A) = 5} = {(1,4), (2,3), (3,2), (4,1)}{A S |X(A) = 6} = {(1,5), (2,4), (3,5), (4,2), (5,1)}{A S |X(A) = 7} = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}{A S |X(A) = 8} = {(2,6), (3,5), (4,4), (5,3), (6,2)}{A S |X(A) = 9} = {(3,6), (4,5), (5,4), (6,3)}{A S |X(A) = 10} = {(4,6), (5,5), (6,4)}{A S |X(A) = 11} = {(5,6), (6,5)}{A S |X(A) = 12} = {(6,6)}

    Ejemplo 4-5Del Ejemplo 4-4 se tiene que los subconjuntos B1 = {x1 = 2} {x2 = 3} y B2 ={x8 = 9} {x9 = 10} {x10 = 11} {x12 = 11} pertenecen al conjunto generado porlos eventos simples x1 = 2,x2 = 3,x3 = 4,x4 = 5,x5 = 6,x6 = 7,x7 = 8,x8 = 9,x9 =10,x10 = 11 y x11 = 12, los cuales son:

    B1 = {2,3}= {A S |X(A) 3}= {(1,1), (1,2), (2,1)},

    B2 = {9,10,11,12}= {A S |X(A) 9}= {(3,6), (4,5), (5,4), (6,3), (4,6), (5,5), (6,4), (5,6), (6,5), (6,6)}

    El conjunto de todos los subconjuntos de D, es decir, el generado por la co-leccion de los eventos simples {{x1}, {x2}, ..., {xm}} se denotara por D (ver Seccion3.3 y 3.4).

    Puesto que tenemos un nuevo espacio muestral y una coleccion de eventos,para cualquier conjunto B D definimos

    PX(B) = P [{A S |X(A) B}],

  • 4.2. DISTRIBUCIONES DE PROBABILIDAD 39

    Decimos que PX es la probabilidad inducida sobre D mediante la variable alea-toria X. As, la probabilidad de que X tome el valor x es definida como la sumade las probabilidades de todos los puntos muestrales en S que se les ha asignado elvalor x. Denotamos P (X = x) por p(x).

    Ejemplo 4-6Del ejemplo 4-5 tenemos que B = {2,3} es un subconjunto de F . As,

    PX(B) = P [{A S |X(A) 3}]= P [{(1,1), (1,2), (2,1)}]= 3/36.

    4.2. Distribuciones de probabilidad

    En este captulo vamos a definir la distribucion de probabilidad de una varia-ble aleatoria X como funcion de distribucion relativa construida para poblacionentera de mediciones.

    Usaremos una letra mayuscula, tal como X, para denotar una variable alea-toria y una letra minuscula, tal como x, para denotar un valor particular que unavariable pueda asumir. Por ejemplo, considerar que x denota uno de los seisposibles valores que deben ser observados en la cara superior cuando un da-do es lanzado. Despues de ser lanzado el dado, el numero realmente observadosera denotado por el smbolo x. Notar que X es una variable, pero el valor espe-cifico observado x no es aleatorio.

    La expresion (X = x) puede leerse, el conjunto de todos los puntos en S que seles ha asignado el valor x por la variable X.

    Ahora es significativo hablar de la probabilidad que toma X en el valor x,denotado por P (X = x). Como en la Seccion 3.4, esta probabilidad es definidacomo la suma de las probabilidades de los puntos muestrales apropiados en S.

    La probabilidad de que X tome el valor x, P (X = x), es definida como lasuma de las probabilidades de todos los puntos muestrales en S que les es asignadoel valor x. Algunas veces denotar P (X = x) por p(x).

    La distribucion de probabilidad para una variable aleatoria discreta X puedeser representada por una formula, tabla o grafica que proporciona los valoresposibles de X y la probabilidad p(x) = P (X = x) asociada a cada valor de X.

    Los valores de X representan eventos numericos mutuamente excluyentes.Resumiendo p(x) sobre todos los valores de x es equivalente a sumar todas lasprobabilidades de todos los eventos simples y por lo tanto es igual a 1.

  • 40 CAPITULO 4. VARIABLES ALEATORIAS Y ESPERANZA

    Requisitos para una distribucion de probabilidad discreta

    0 p(x) 1

    p(x) = 1

    Ejemplo 4-7La distribucion de probabilidad para la variable X, definida como la suma delos resultados de los dos dados, es la Tabla 4.3.

    x Numero de eventos simples en x p(x)

    2 1 1/36

    3 2 2/36

    4 3 3/36

    5 4 4/36

    6 5 5/36

    7 6 6/36

    8 5 5/36

    9 4 4/36

    10 3 3/36

    11 2 2/36

    12 1 1/36P (X) = 1

    Tabla 4.3: Distribucion de la variable X:resultado del lanzamiento de dos dados

    4.3. Valor esperado de una variable aleatoria

    En esta seccion intentamos encontrar la media y la varianza de una variablealeatoria y de este modo adquirir medidas descriptivas numericas, parametros,para la distribucion de probabilidad p(x) que son consistentes con los discutidosen el captulo 2.

    Sea X una variable aleatoria discreta con la funcion de probabilidad p(x).

  • 4.3. VALOR ESPERADO DE UNA VARIABLE ALEATORIA 41

    Entonces el valor esperado de X, E(X), es definido a ser

    E(X) =x

    xp(x).

    Si p(x) es una caracterizacion precisa de la distribucion de frecuencia dela poblacion, entonces E(x) = , la media poblacional. Por ejemplo, considerarla variable aleatoria discreta del Ejemplo 4-7 con distribucion de probabilidadp(x) como se muestra en la Tabla 4.3. Una inspeccion visual revelara la mediade la distribucion a ser localizada en x = 7

    Para mostrar que E(X) =x xp(x) es la media de la distribucion de proba-

    bilidad p(x), realizar lo siguiente

    =ni=1 xin

    =(1)(2) + (2)(3) + (3)(4) + + (1)(12)

    36(2)(1/36) + (3)(2/36) + (4)(3/36) + + (12)(1/36)

    12x=2

    xp(x) = 7

    As, E(X) es un promedio y se tiene la consistencia de la definicion de mediadada en el captulo 2.

    Si X es una variable aleatoria con media E(X) = , entonces la varianza deuna variable aleatoria X esta definida a ser el valor esperado de (X)2. Esto es,

    V (X) = E[(X )2].La desviacion estandar de X es la raz cuadrada positiva de V (Y ).

    Si p(x) es una caracterizacion precisa de la distribucion de frecuencia dela poblacion, entonces E(X) = , V (X) = 2 y es la desviacion estandar de lapoblacion.

  • 42 CAPITULO 4. VARIABLES ALEATORIAS Y ESPERANZA

    EjerciciosTecnicas basicas

    4.1 Discretas o continuas? Identi-ficar las siguientes variables aleatoriascomo discretas o continuas:

    a) El numero total de puntos regis-trados en un juego de futbol

    b) Tiempo de vida util de un farma-co

    c) Altura de la mareas de un oceanoen una lugar dado

    d) Longitud de un ballena de 2 anosde edad

    e) El numero de colisiones cercanasen un ano

    4.2 Distribucion de probabili-dad Una variable X tiene es-ta distribucion de probabilidad:x 0 1 2 3 4 5p(x) .1 .3 .4 .1 ? .05

    a. Encontrar p(4)

    b. Construir un histograma de pro-babilidad para describir p(x)

    c. Encontrar , y .

    4.3 Distribucion de probabilidadUna variable X asume 5 valores:

    0,1,2,3,4. una porcion de la distribu-cion de probabilidad es mostrada aqu:x 0 1 2 3 4p(x) .1 .3 .3 ? .1

    a. Encontrar p(3)

    b. Construir un histograma de pro-babilidad para describir p(x)

    c. Calcular la media, la varianza yla desviacion estandar poblacio-nal

    d) Cual es la probabilidad de queX sea menos o igual a 3?

    e) Cual es la probabilidad de queX sea mayor a 2?

    4.4 Jugador profesional Un golfistaprofesional juega mejor en hoyos a dis-tancia corta. Su experiencia muestraque el numero X de disparos reque-ridos para los hoyos par 3, 4 y 5 tie-nen las distribuciones de probabilidadmostradas en la tabla:

    Hoyo par 3 Hoyo par 4 Hoyo par 5x p(x) x p(x) x p(x)2 .12 3 .14 4 .043 .80 4 .80 5 .804 .06 5 .04 6 .125 .02 6 .02 7 .04

  • 5. Distribuciones especiales

    Contenido5.1. Distribuciones de probabilidad discretas . . . . . . . . . . . . 43

    5.1.1. La distribucion de probabilidad binomial . . . . . . . . 43

    5.1.2. La distribucion de probabilidad de Poisson . . . . . . . 46

    5.1.3. La distribucion de probabilidad Hipergeometrica . . . . 47

    5.2. Distribuciones de probabilidad continuas . . . . . . . . . . . 48

    5.2.1. La distribucion de probabilidad uniforme continua . . . 48

    5.2.2. La distribucion de probabilidad exponencial . . . . . . 48

    5.2.3. La distribucion de probabilidad normal . . . . . . . . . 48

    Objetivo: Identificar algunas distribuciones de cierto tipo de variables que ocu-rren una y otra vez en las aplicaciones.

    Panorama general: Se describen algunas distribuciones, as como su media yvarianza.

    5.1. Distribuciones de probabilidad discretas

    5.1.1. La distribucion de probabilidad binomial

    Supongamos que un ensayo, o un experimento, es realizado cuyos resulta-dos pueden ser clasificados ya sea como un exito o como un fracaso. Con-sideramos que X = 1 cuando el resultado es un exito y X = 0 cuando es unfracaso. Una variable aleatoria X se dice ser una variable aleatoria de Bernoullisi la funcion de masa de probabilidad de X esta dada por

    P {X = 0} = 1 pP {X = 1} = p

    donde p, 0 p 1, es la probabilidad de que el ensayo sea un exito.

    43

  • 44 CAPITULO 5. DISTRIBUCIONES ESPECIALES

    Ejemplo 5-1Lanzar un dado y salir un 6.Cuando lanzamos un dado tenemos 6 posibles resultados:

    S = {1,2,3,4,5,6}Estamos realizando un unico experimento (lanzar el dado una sola vez).

    Se considera exito al sacar un 6, por tanto, la probabilidad (casos favorablesdividido entre casos posibles) sera p = 1/6. Se considera fracaso no sacar un 6,por tanto, se considera fracaso sacar cualquier otro resultado; q = 1p = 11/6 =5/6La variable aleatoria X medira numero de veces que sale un 6, y solo existendos valores posibles, 0 (que no salga 6) y 1 (que salga un 6). Por tanto, la variablealeatoria X es una variable Bernoulli de parametro p = 1/6.

    Ahora, supongamos que se realizan n ensayos de manera independiente, enlos cuales cada uno resulta en un exito con probabilidad p y en un fracasocon probabilidad q = 1 p. Si X representa el numero de exitos que ocurren enn ensayos, entonces X se dice ser una variable aleatoria binomial con parame-tros (n,p), es decir, una variable aleatoria binomial es un experimento con lassiguiente caractersticas:

    El experimento consiste de n ensayos identicos.

    El resultado de cada ensayo es uno de dos posibles resultados. Uno de losresultados es llamado exito y el otro fracaso.

    La probabilidad de exito en un unico ensayo es igual a p y sigue siendo elmismo de ensayo a ensayo. La probabilidad de fracaso es igual a 1 p = q.

    Los ensayos son independientes.

    La variable X de interes es el numero de exitos observados durante n en-sayos, para X = 0,1,2, ...,n.

    Ejemplo 5-2Lanzar un dado en dos ocasiones y salir un 6.

    Consideremos la variable aleatoria X: numero de veces que sale un 6, como enel Ejemplo 5-1. En este caso se lanzaran dos dados, y puesto que el resultadoen un dado es independiente del otro, se tiene que X es una variable aleatoriabinomial con parametro p = 1/6.

  • 5.1. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS 45

    La distribucion de probabilidad binomial

    La funcion de masa de probabilidad de una variable aleatoria binomialcon parametros (n,p) esta dada por:

    P {X = k} =(nk

    )pkqnk = n!

    k!(n k)!pkqnk ,

    para valores de k = 0,1,2, ...,n. El valor k es el numero de exitos en los nensayos. El smbolo

    (nk

    )es

    n!k!(n k)! ,

    donde n! = n(n 1)(n 2) (2)(1) y 0! 1.

    Ejemplo 5-3Nuevamente, considerando el Ejemplo 5-1, se tiene que la probabilidad de queobtengamos un 6 viene definida como la probabilidad de que X sea igual a 1.As,

    P (X = 1) =(11

    )(1/6)1 (5/6)0 = (1/6)1 (5/6)0 = 1/6 = 0.1667

    La probabilidad de que NO obtengamos un 6 viene definida como la probabili-dad de que X sea igual a 0.

    P (X = 0) =(11

    )(1/6)0 (5/6)1 = (1/6)0 (5/6)1 = 5/6 = 0.8333

    Ejemplo 5-4Considerar el Ejemplo 5-2, se tiene que la probabilidad de que obtengamos un6 viene definida como la probabilidad de que X sea igual a 1. As,

    P (X = 1) =(21

    )(1/6)1 (5/6)1 = 2

    ((1/6) (5/6)

    )= 10/36 = 0.277

    La probabilidad de que NO obtengamos un 6 viene definida como la probabili-dad de que X sea igual a 0.

    P (X = 0) =(20

    )(1/6)0 (5/6)2 = (1) (25/36) = 25/36 = 0.694

  • 46 CAPITULO 5. DISTRIBUCIONES ESPECIALES

    La media, varianza y desviacion estandar para la distri-bucion de probabilidad binomial

    La variable aleatoria X, el numero de exitos en n ensayos, tiene una dis-tribucion de probabilidad con

    = np

    2 = npq

    =npq

    Ejemplo 5-5La variable X: numero de veces que sale un 6 al lanzar dos dados, del Ejemplo5-2, tiene media y varianza iguales a 0.333 y 0.277, respectivamente.

    Si X1 y X2 son variables aleatorias independientes con parametros respecti-vos (ni ,p), con i = 1,2, entonces su suma es binomial con parametros (n1 +n2,p)Esto puede verse facilmente notando que porque Xi , i = 1,2, representan elnumero de exitos en ni ensayos independientes cada uno de los cuales es un exi-to con probabilidad p, entonces X1+X2 representa el numero de exitos en n1+n2ensayos independientes cada uno de los cuales es un exito con probabilidad p.Por lo tanto, X1 +X2 es binomial con parametros (n1 +n2,p).

    5.1.2. La distribucion de probabilidad de Poisson

    La distribucion de probabilidad de Poisson

    Estamos interesados en saber la probabilidad de ocurrencia de k eventos,en donde se puede esperar un promedio de tales eventos a ocurrir. La dis-tribucion de probabilidad de una variable aleatoria de Poisson proporciona unbuen modelo para datos que representan el numero de ocurrencia de un eventoespecfico en una unidad de tiempo o espacio dado. Lo unico que se necesita esque los eventos ocurran de manera aleatoria e independiente.

  • 5.1. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS 47

    La distribucion de probabilidad Poisson

    Una variable aleatoria X que toma uno de los valores 0,1,2, ..., se diceser una una variable aleatoria de Poisson con parametro , > 0, si sudistribucion de probabilidad esta dada por

    P {X = k} = kek!

    , k = 0,1,2, ...

    El smbolo e representa una constante aproximadamente igual a2.71828.La media, varianza y desviacion estandar de una variable aleatoria Pois-son son:

    =

    2 =

    =

    5.1.3. La distribucion de probabilidad Hipergeometrica

    La distribucion de probabilidad Hipergeometrica

    Supongamos una poblacion con M exitos y N M fracasos. La proba-bilidad de exactamente k exitos en una muestra aleatoria de tamano nes

    P {X = k} =(Mk

    )(NMnk

    )(Nn

    )para valores de k que depende de N,M y n con(

    Nn

    )=

    N !n!(N n)! .

    La media y la varianza de una variable aleatoria hipergeometrica son:

    = n(MN

    )2 = n

    (MN

    )(N MN

    )(N nN 1

    )

  • 48 CAPITULO 5. DISTRIBUCIONES ESPECIALES

    5.2. Distribuciones de probabilidad continuas

    5.2.1. La distribucion de probabilidad uniforme continua

    Si a < b, una variable aleatoria X se dice tener una distribucion de proba-bilidad uniforme continua en el intervalo (a,b) si su funcion de densidades

    f (x) ={

    1/(b a) a x b0 de otra forma

    La funcion de distribucion esta dada por

    F(x) = P (X x) ={

    0 x a(x a)/(b a) a x b1 x b.

    La media y la varianza de la distribucion uniforme son

    =12

    (a+ b) 21

    12(b a)2

    respectivamente.

    5.2.2. La distribucion de probabilidad exponencial

    Una funcion esta distribuida de forma exponencial si su funcion de den-sidad es

    f (x) ={ex x > 0

    0 x 0La media y la varianza de la distribucion exponencial son

    =1

    2 =12

    respectivamente.

    5.2.3. La distribucion de probabilidad normal

    La distribucion de probabilidad de una variable aleatoria normal es comosigue:

  • 5.2. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS 49

    La distribucion de probabilidad Normal

    Una variable aleatoria X se dice que tiene una distribucion de probabili-dad normal si y solo si, para > 0 y <