Medidas de Dispersion.[1]

Embed Size (px)

Citation preview

  • 7/28/2019 Medidas de Dispersion.[1]

    1/41

    BIOESTADSTICA

    Tatiana Burga.Wilver Rodrguez.

    Medidas deDispersin

    FACULTAD DE MEDICINA HUMANA

    FILIAL NORTE

  • 7/28/2019 Medidas de Dispersion.[1]

    2/41

    Las medidas de dispersin o variabilidad

    Son tiles porque:

    Permiten juzgar la confiabilidad de la

    medida de tendencia central.

    Los datos demasiados dispersos tienen

    un comportamiento especial.

    Es posible comparar dispersin de

    diversas muestras.

  • 7/28/2019 Medidas de Dispersion.[1]

    3/41

    AMPLITUD TOTAL: A RANGO: R

    Se obtiene de la diferencia entre el dato mayor yel dato menor.

    Ejemplo:Los siguientes datos representan los pesos de 10pacientes. Calcule el rango.

    60, 58, 80, 70, 75, 55, 76, 60, 68, 70

    Amplitud Total Rango = 80 - 55 = 25

    Interpretacin

    La diferencia entre el paciente con mayor peso y el paciente con

    menor peso es 25 kilos.

  • 7/28/2019 Medidas de Dispersion.[1]

    4/41

    Clculo a partir de datos agrupados

    Se utiliza la siguiente formula:

    Amplitud Total o Rango = ( Ls - Li) + 1

    donde:

    Ls : Limite superior de la ltima clase

    : Limite inferior de la primera clasei

    L

  • 7/28/2019 Medidas de Dispersion.[1]

    5/41

    Ejemplo:

    La distribucin de frecuencias siguiente representa

    las estancia hospitalaria(das) de una muestra de

    pacientes. Calcule e interprete el rango

    Rango = (20 - 1) + 1

    R = 20

    Interpretacin: la diferencia de das entre elpaciente que ms das hospitalarios y el pacientecon menos das hospitalarios es de 20 das.

    N Das N de Pacientes

    1 - 4 4

    5 - 8 89 - 12 15

    13 - 16 23

    17 - 20 10

    Total 60

  • 7/28/2019 Medidas de Dispersion.[1]

    6/41

    Ventajas

    fcil de calcular

    fcil de entender e interpretar

    Desventajas

    slo considera los valores extremos

    no toma en cuenta ni el nmero de datos ni el

    valor de stos

    no es posible de calcular en tablas con

    extremos abiertos.

  • 7/28/2019 Medidas de Dispersion.[1]

    7/41

    LA VARIANZA

    Es una medida de dispersin e indica la desviacinpromedio con respecto a la media aritmtica

    a) Clculos a partir de datos no agrupados.

    para una muestra

    para un poblacin

    1

    1

    2

    )X(2

    n

    n

    iix

    S

    N

    N

    ii

    1

    2

    )X(2

  • 7/28/2019 Medidas de Dispersion.[1]

    8/41

    8 8 - 10 = 2 4

    10 10 - 10 = 0 0

    5 5 - 10 = 5 25

    12 12 - 10 = 2 4

    10 10 - 10 = 0 0

    15 15 - 10 = 5 25

    Ejemplo:La siguiente informacin se refiere a los das de

    hospitalizacin de 6 pacientes en un centro de salud:8, 10, 5, 12, 10, 15. Calcule la varianza.

    Elaboramos un cuadro de la forma siguiente

    x X xi 2X xi

    60X

    0X x

    i

    10

    6

    60

    x

    x

    582 xiX

  • 7/28/2019 Medidas de Dispersion.[1]

    9/41

    58X 2xi

    1

    )(X2

    2

    n

    i

    S

    x

    2das6,11

    16

    582

    S

  • 7/28/2019 Medidas de Dispersion.[1]

    10/41

    LA DESVIACION ESTANDAR

    Es la raz cuadrada de la varianza, seapoblacional o muestral.

    a) Clculos a partir de datos no agrupados

    Para la muestra

    Para la poblacin

    1

    1

    2

    2

    n

    n

    ii x)(X

    S s

    N

    N

    ii

    1

    2

    2

    )X(

  • 7/28/2019 Medidas de Dispersion.[1]

    11/41

    Ejemplo:En relacin al ejemplo anterior. Calcular la desviacin

    estndar de los siguientes das hospitalarios:8, 10, 5, 12, 10, 15

    Ya sabemos por el ejemplo anterior que S2 = 11,6 das2.

    Entonces:

    s2

    S

    das3,4S

    das6,11S 2

  • 7/28/2019 Medidas de Dispersion.[1]

    12/41

    DESVIACIN ESTANDAR

    1

    )( 22

    n

    n

    xfxf

    S

    iiii

    Donde: fi: frecuencias absolutas simples

    Xi: puntos medios de los intervalos de clase

  • 7/28/2019 Medidas de Dispersion.[1]

    13/41

    Ejemplo:Calcular la desviacin estndar de la siguiente

    distribucin de frecuencias:

    N de Das

    Hospitalarios Xi fi Xi*fi Xi2*fi

    2 - 4 3 4 12 36

    5 - 7 6 10 60 360

    8 - 10 9 15 135 1215

    11 - 13 12 30 360 432014 - 16 15 5 75 1125

    17 - 19 18 1 18 324

    Total 65 660 7380

  • 7/28/2019 Medidas de Dispersion.[1]

    14/41

    DESVIACIN ESTANDAR

    165 65

    6607380

    S

    25.3S

  • 7/28/2019 Medidas de Dispersion.[1]

    15/41

    -3 -2 - + +2 +3

    68.3 %

    95.5 %

    99.7 %

    Teorema de Chebyshev

  • 7/28/2019 Medidas de Dispersion.[1]

    16/41

    El coeficiente de variacin

    Es una medida de variabilidad relativa de los

    datos, permite comparar la variabilidad de dos o

    ms conjuntos de datos expresados en unidades

    diferentes (peso; kg. y libras).

    a) Calculos a partir de datos no agrupados

    Para la muestra:

    Para la poblacin:

    100xCV

    s

    100

    CV

  • 7/28/2019 Medidas de Dispersion.[1]

    17/41

    Ejemplo:A continuacin se presentan los pesos en dos grupos de pacientes

    Cul de los grupos tiene un peso ms estable?.

    I grupo II grupo

    40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

    Calculamos la media y desviacin estndar para

    cada uno de los grados

  • 7/28/2019 Medidas de Dispersion.[1]

    18/41

    Grupo I

    40 -16,14 260,50

    70 13,86 192,10

    60 3,86 14,90

    48 -8,14 66,26

    52 -4,14 17,14

    65 8,86 78,50

    58 1,86 3,46

    x X xi 2X xi

    14567

    3931 ,

    n

    x

    n

    i i

    X

    393X 0X xi 86,632X2xi

  • 7/28/2019 Medidas de Dispersion.[1]

    19/41

    866322 ,xiXSi

    271017

    86632

    1

    1

    2

    ,

    ,( )

    n

    n

    ii xX

    S

    100S

    xCV

    2918100 ,56,14

    10,27CV

  • 7/28/2019 Medidas de Dispersion.[1]

    20/41

    Grupo II

    70 -35,87 1286,6569

    35 -70,87 5022,5569

    150 44,13 1947,4569

    140 34,13 1164,8569

    82 -23,87 569,7769

    110 4,13 17,0569

    140 34,13 1164,8569

    120 14,13 199,6569

    x X xi 2

    X xi

    871058

    8471

    ,

    n

    i

    x

    n

    i

    X

    847X

    04,0X xi 88,11372X2

    xi

  • 7/28/2019 Medidas de Dispersion.[1]

    21/41

    88113721

    2,

    n

    i

    ixXSi

    304018

    8811372

    1

    1

    2

    ,

    ,)(

    n

    n

    ii xX

    S

    100S

    xCV 06,30100

    105,87

    40,30CV

    El II grupo presenta una mayor variabilidad en sus

    pesos que el I grupo.

  • 7/28/2019 Medidas de Dispersion.[1]

    22/41

    CONSIDERACIONES

    15/04/2013

    SI:

    C.V 33% La distribucin se puede considerar

    aproximadamente simtrica.

    C.V 33% La distribucin puede ser asimtrica

  • 7/28/2019 Medidas de Dispersion.[1]

    23/41

    Curvas simtricas: Cuandoal trazar una lnea el rea sedivide en dos partes iguales. Curvas asimtricas o

    sesgadas: Concentrados enel extremo inferior o superior

    del eje horizontal.La cola indica el tipo de

    sesgo.

    Medidas Forma:

  • 7/28/2019 Medidas de Dispersion.[1]

    24/41

    p = 3 (X - Me)

    S

    X=Me=Mo Mo

  • 7/28/2019 Medidas de Dispersion.[1]

    25/41

    Refleja el grado de agudeza.

    (a) Leptocrtica (concentracin al centro)

    (b) Mesocrtica (distribuidos simtricamente)

    (c) Platicrtica (aplanada).

    Coeficiente de Curtosis

  • 7/28/2019 Medidas de Dispersion.[1]

    26/41

    USO DE LAS DIFERENTES

    MEDIDAS DE DISPERSION La desviacin estndarse emplea cuando

    tambin es apropiado el uso de la media,es decir, con distribuciones simtricas(no

    sesgadas) de datos numricos. Percentiles y rango intercuartilicos se

    emplean, cuando la distribucin no essimtrica(sesgada) y es apropiado el usode la mediana.

  • 7/28/2019 Medidas de Dispersion.[1]

    27/41

    USO DE LAS DIFERENTES

    MEDIDAS DE DISPERSION El rango es una medida apropiada para

    datos numricos cuando el propsito es

    enfatizar valores extremos.

    El coeficiente de variacin es til cuando

    la intencin es comparar dos

    distribuciones numricas medidas en

    escalas diferentes.

  • 7/28/2019 Medidas de Dispersion.[1]

    28/41

    El Boxplot (Diagrama de Caja)

    Al igual que el histograma y el grfico deTallo y Hoja permite tener una idea visualde la distribucin de los datos (simetra y

    variabilidad) Permite detectar outliers (valores

    extremos).

    Permite comparar la media y lavariabilidad de varios grupos (alternativagrfica a pruebas estadsticas)

  • 7/28/2019 Medidas de Dispersion.[1]

    29/41

    Boxplot: Procedimiento

    1. Dibujar una caja cuyo lmite inferior ser

    Q1 y el superior Q3. Dentro de la caja

    trazar una lnea que localice la mediana.

    2. Calcular el rango intercuartlico:

    R.I. (Q) = RIQ = Q3 Q1

    3. Dibujar un bigote del borde inferior de

    la caja hasta Q1-1.5xRIQ .

  • 7/28/2019 Medidas de Dispersion.[1]

    30/41

    Boxplot: Procedimiento

    5. Dibujar otrobigote del borde

    superior de la caja hasta

    Q3+1.5xRIQ .6. Dibujar cualquier observacin que

    se ubique fueras de los bigotes

    (estos sern los outliers).

  • 7/28/2019 Medidas de Dispersion.[1]

    31/41

    BoxPlot: Ejemplo

    0

    10

    20

    30

    40

    50

    Datos

  • 7/28/2019 Medidas de Dispersion.[1]

    32/41

    OTRA ALTERNATIVA DEANALIZAR LA DISPERSIN DE

    UN CONJUNTO DE DATOS:GRFICO DE TALLO - HOJAS

  • 7/28/2019 Medidas de Dispersion.[1]

    33/41

    Grfico de Tallo - Hoja

    Un diagrama de tallos y hojas consiste en una serie de

    hileras horizontales de nmeros. El nmero utilizado

    para designar una hilera es un tallo y el resto de

    nmeros en la hilera se denominan hojas.

  • 7/28/2019 Medidas de Dispersion.[1]

    34/41

    Se tienen los siguientes datospermetro

    ceflico (cm) de recin nacidos, que

    constituye una muestra obtenida de unapoblacin de recin nacidos:33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.0

    34.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5

  • 7/28/2019 Medidas de Dispersion.[1]

    35/41

    Para la clasificacin de datos, se deben

    identificar los valores entre los cuales se

    encuentra la distribucin, es decir, el dato

    menor y el dato mayor.

    Dato menor: 33.1cm

    Dato mayor: 36.5cm

    33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.034.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5

  • 7/28/2019 Medidas de Dispersion.[1]

    36/41

    Se deben identificar los tallos -los nmeros que

    van a designar las hileras- los cuales deben

    contener a todos los valores de la distribucin (del

    33.1 al 36.5). La eleccin de los tallos depende dela unidad con la que se quiera trabajar: enteros,

    dcimas, centsimas... En el caso del ejemplo, los

    datos estn dados indicando dcimas por lo que

    trabajar con tallos enteros es la opcin ms

    precisa y cmoda.

    Los tallos seran entonces: 33, 34, 35 y 36.

  • 7/28/2019 Medidas de Dispersion.[1]

    37/41

    Sin embargo, no se puede realizar un diagrama de

    tallos y hojas con menos de 5 tallos. Por lo tanto, los

    tallos propuestos se deben dividir (desdoblar) en una

    especie de intervalo, produciendo el doble. La divisindel tallo debe distinguirse visualmente:

    33.1 33.4 33.6 33.7 33.7 33.8 33.9 34.034.1 34.2 34.2 34.2 34.2 34.2 34.3 34.334.5 34.5 34.6 34.6 34.6 34.7 34.7 34.834.9 35.1 35.1 35.2 35.2 35.3 35.6 35.836.0 36.1 36.5

  • 7/28/2019 Medidas de Dispersion.[1]

    38/41

    Seguidamente, se realiza el proceso de clasificacinen s. Todos los datos, dependiendo de su valor, secolocan a lado de su respectivo tallo. En el ejemplo,los datos cuyo valor se encuentre entre 33.0 y 33.4se deben colocar en la hilera del tallo 33*. Se debe

    indicar el valor decimal exacto de cada dato a laderecha del tallo. En el ejemplo hay 2 valores entre33.0 y 33.4. Para clasificar el primero (33.1) seagrega al diagrama de tallos y hojas de la siguientemanera:

    33*1 Para clasificar el segundo dato que corresponde a este

    tallo (33.4): 33*14

  • 7/28/2019 Medidas de Dispersion.[1]

    39/41

    Lo mismo se realiza con cada tallo y lovalores que le correspondan:

    En la hilera del tallo 33. se debe colocar los

    nmeros 67789, correspondientes a losvalores 33.6, 33.7, 33.7, 33.8, 33.8 y 33.9.

    A la hilera del tallo 34*se debe colocar

    012222233 correspondientes a los valoresque se encuentran entre 34.0 y 34.4.

    etc.

  • 7/28/2019 Medidas de Dispersion.[1]

    40/41

    Al clasificar todos los valores en sus tallos

    respectivos, se obtiene el diagrama:

  • 7/28/2019 Medidas de Dispersion.[1]

    41/41

    Anlisis de la distribucin usando Tallos y Hojas

    Las principales caractersticas de ladistribucin que se observan fcilmenteen el diagrama de tallos y hojas son: Hay 35 observaciones. El dato menor es 33.1cm.

    El dato mayor es 36.5cm. El rango de los valores

    observados es de 3.4cm (dato mayor dato menor).

    De los 35 datos, 18 estn alrededor de34cm.

    Los casos mayores a 36cm son pocos. La distribucin de los datos es asimtrica:

    distribucin heterognea.