Upload
miguel-angel-tasayco
View
253
Download
4
Tags:
Embed Size (px)
Citation preview
Medidas de tendencia Medidas de tendencia central y dispersióncentral y dispersión
• La enumeración de los datos representa un avance importante en el análisis de la información
• La distribución de frecuencias organiza los datos en un formato que facilita su análisis e interpretación
• La conversión a frecuencias relativas permite hacer comparaciones valiosas y significativas.
Recordar que
• La utilización de La utilización de distribuciones dedistribuciones de frecuencias en frecuencias en intervalos de clasesintervalos de clases, resume y condensa la , resume y condensa la información presente en los datos; se pierde la información presente en los datos; se pierde la información individual pero se gana en capacidad información individual pero se gana en capacidad de análisis de características globales. de análisis de características globales.
• El uso de distintos El uso de distintos gráficosgráficos permite una rápida permite una rápida visualización de estas características globales. visualización de estas características globales.
• Otra técnica estadística es poder Otra técnica estadística es poder resumir aspectos resumir aspectos presentes en los datos con un único valor ( o presentes en los datos con un único valor ( o algunos valores).algunos valores).
Descripción de los datosDescripción de los datos
• Medidas de Tendencia central Medidas de Tendencia central • Medidas de DispersiónMedidas de Dispersión• Medidas de PosiciónMedidas de Posición• Medidas de AsimetríaMedidas de Asimetría
Medidas de Tendencia centralMedidas de Tendencia central• Intento de resumir la distribución, expresando el valor
que se puede considerar mas típico o representativo de los datos.
• El término tendencia central implica la idea de un “centro” identificable en la distribución. Tanto más útil será ese valor en tanto más identificable sea ese “centro”.
• Veremos: - Modo o moda - Media Geométrica- Mediana - Media aritmética
Modo o modaModo o moda• Es el valor con mayor frecuencia en la distribución de Es el valor con mayor frecuencia en la distribución de
datos.datos.
• Si los datos están agrupados en clases corresponde al Si los datos están agrupados en clases corresponde al punto medio de la clase con mayor frecuencia.punto medio de la clase con mayor frecuencia.
• Se aplica a datos medidos en todas las escalas vistas.Se aplica a datos medidos en todas las escalas vistas.
• Las distribuciones pueden ser unimodales, bimodales, Las distribuciones pueden ser unimodales, bimodales, multimodalesmultimodales
Modo o modaModo o moda• Ej: Variable cualitativa: sexoEj: Variable cualitativa: sexo
F F F F F F M M M M M M M M MF F F F F F M M M M M M M M M
Moda: Moda:
Ej: Variable cuantitativa discretaEj: Variable cuantitativa discreta
12 15 13 12 14 16 12 14 14 12 1412 15 13 12 14 16 12 14 14 12 14
Moda: Moda:
Masculino
12 y 14 (distribución bimodal)
1212 15 13 15 13 1212 1414 16 16 1212 14 1414 14 12 12 1414
Modo o modaModo o moda
0
2
4
6
8
10
12
0 1 2 3 4
Número de consultas
Fre
cuen
cia
abso
luta
Moda: 1
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6
Moda: 0 y 4
Figura 1 Figura 2
Modo o modaModo o moda
Gráfico sectorial para la distribución de los pacientes con anemia según clasificacion morfológica de la misma.
50%
40%
10%
microcítica
normocítica
macrocítica
Moda: Microcítica
MedianaMediana• Corresponde a la observación que se encuentra en el Corresponde a la observación que se encuentra en el
punto medio de la distribución ordenada de los datos.punto medio de la distribución ordenada de los datos.
• El 50% de los datos están por encima o debajo de este El 50% de los datos están por encima o debajo de este valor. (Deja tantos datos con valores menores, como valor. (Deja tantos datos con valores menores, como con valores mayores).con valores mayores).
• A diferencia de la moda, es única para un conjunto A diferencia de la moda, es única para un conjunto dado de datos dado de datos
• Es aplicable cuando trabajamos con una variable Es aplicable cuando trabajamos con una variable medida en escala por lo menos ordinal (ordinal, razón medida en escala por lo menos ordinal (ordinal, razón o intervalo) o intervalo)
MedianaMediana• Ejemplo: Cantidad de observaciones imparEjemplo: Cantidad de observaciones impar
12 15 13 12 14 16 12 14 14 12 1412 15 13 12 14 16 12 14 14 12 14
• Ejemplo: Cantidad de observaciones parEjemplo: Cantidad de observaciones par
55 88 8 5 9 6 8 5 9 6 88 2 9 2 9 66
12 12 12 12 13 14 14 14 14 15 16
2 5 5 6 6 8 8 8 9 9
Mediana=(6+8)/2=7Mediana=(6+8)/2=7
Mediana-CálculoMediana-Cálculo
Se ordenan los n valores en forma creciente:Se ordenan los n valores en forma creciente:
xx11 < x < x2 2 < x< x33 < x < x4 4 < x < x5 5 < x < x66 < …..x < …..xnn
• Si n imparSi n impar
• Si n par Si n par
1
2
nMd X
12 2
2
n nX X
Md
Mediana: Datos agrupadosMediana: Datos agrupados
• Valor de la variable correspondiente al 0.50 en la Valor de la variable correspondiente al 0.50 en la frecuencia relativa acumuladafrecuencia relativa acumulada
0102030405060708090
100
15 20 25 30 35 40
Edad(años)
Fre
cuen
cia
acum
ulad
a%
Mediana: Datos agrupadosMediana: Datos agrupadosEdadEdad Fr. RelativaFr. Relativa Fr. rel. AcumuladaFr. rel. Acumulada
14.5-19.514.5-19.5 0.100.10 0.100.10
19.5-24.519.5-24.5 0.300.30 0.400.40
24.5-29.524.5-29.5 0.200.20 0.600.60
29.5-34.529.5-34.5 0.300.30 0.900.90
34.5-39.534.5-39.5 0.100.10 1.001.00
lli i - l- lss F(lF(lii))
0.27)5(2.0
4.05.05.24
Me
Me = li + ( N/2 – Fi-1 ) * c
fmed
fmed
Fi-1
Mediana: Datos agrupadosMediana: Datos agrupados
2.0
5
1.0
x
0
0.2
0.4
0.6
0.8
1
15 20 25 30 35 40
Edad(años)
Fre
cuen
cia a
cum
ula
da%
5x
0.20.1
2.0
1.05 x 5.2 x
Media AritméticaMedia Aritmética• Ejemplo: Para la serie de datos utilizada anteriormente:Ejemplo: Para la serie de datos utilizada anteriormente:
12 12 15 15 1313 12 14 16 12 14 14 12 14 12 14 16 12 14 14 12 14
= (= (1212++1515++1313++1212++1414++1616++1212++1414++1414++1212++1414)/11=13.45)/11=13.45
o mejor:o mejor:
= (= (121244++113+143+144+15+14+15+166)/11=13.45)/11=13.45
N
xNi
ii
1
Media AritméticaMedia Aritmética• Es el promedio de las observaciones.Es el promedio de las observaciones.• Se puede ver como un punto de equilibrio de la distribución, Se puede ver como un punto de equilibrio de la distribución,
o como un centro de gravedad de la misma o como un centro de gravedad de la misma • Aplicada a datos cuantitativos (medidos en escala de razón o Aplicada a datos cuantitativos (medidos en escala de razón o
de intervalo)de intervalo)• Cálculo (población)Cálculo (población)
N
xNi
ii
1
Media Aritmética - CálculoMedia Aritmética - Cálculo
• Datos no agrupadosDatos no agrupados
• Datos agrupados
dónde mi=marca de clase y k es la cantidad de clases
n
xX
ni
ii
1
ki
iii
ki
iii
frmn
famX
1
1
Media Aritmética - CálculoMedia Aritmética - Cálculo
ki
iii frmX
1
49.10
466.1130
3441
n
famX
ki
iii
Intervalos
Frec. Absoluta (fj)
Frec. Relativa (hj)
Marca de clase (Xj)
Marca de clase x frec. absoluta
Marca de clase x frec. relativa
7 - 8 3 0.10 7.5 22.5 2.25
9 – 10 7 0.23 9.5 66.5
11 – 12 9 0.30 11.5 100.5
13 – 14 8 0.27 13.5 108.0
15 -16 3 0.10 15.5 46.5
Total 30 100.0 344.0
Medidas de Variabilidad-Medidas de Variabilidad-DispersiónDispersión
• Resume la magnitud con la cual los diferentes datos Resume la magnitud con la cual los diferentes datos difieren entre sí.difieren entre sí.
• Sirven como medida de homogeneidad Sirven como medida de homogeneidad
• Nos dan elementos para evaluar la adecuación de la Nos dan elementos para evaluar la adecuación de la medida de tendencia central usada.medida de tendencia central usada.
• Veremos:Veremos: RangoRango VarianzaVarianza Desviación estándarDesviación estándar
Rango o Amplitud totalRango o Amplitud total
• Rango= XRango= Xmaxmax-X-Xminmin
• Se utiliza para variables cuantitativas medidas en Se utiliza para variables cuantitativas medidas en escala de intervalo o razónescala de intervalo o razón
• Inestable (muy afectada por los valores extremos)Inestable (muy afectada por los valores extremos)• No aprovecha los datos, insuficienteNo aprovecha los datos, insuficiente• Fácil de calcularFácil de calcular
Varianza y desviación estándarVarianza y desviación estándar
• Nos informan sobre la magnitud de la variación en Nos informan sobre la magnitud de la variación en los datos, la magnitud con la cual las observaciones los datos, la magnitud con la cual las observaciones se agrupan en torno a la mediase agrupan en torno a la media
• Sólo se aplica a variables cuantitativas (medidas en Sólo se aplica a variables cuantitativas (medidas en escala de razón o intervalo)escala de razón o intervalo)
• Para una población, la varianza es:Para una población, la varianza es:
22
1
( )i ni
i
x
N
Varianza y desviación estándar: Varianza y desviación estándar: cálculocálculo
• PoblacionalPoblacional
• MuestralMuestral
• Muestral con datos agrupadosMuestral con datos agrupados
22
1
( )
1
i ni
i
x xs
n
22
1
( )i ni
i
x
N
22
1
( )
1
i nai i
i
f m xs
n
Varianza y desviación estándarVarianza y desviación estándar
Desvíacion estándarDesvíacion estándar
PoblaciónPoblación
MuestraMuestra 2s s
2
Varianza y desviación estándarVarianza y desviación estándar
Ej: 5Ej: 5 88 8 5 9 8 5 9
Media=(5+Media=(5+8+8+5+9)/5=78+8+5+9)/5=7
22
1
( )
1
i ni
i
x xs
n
87.15,3
5,34
41144
4
)79()78()78()75()75( 222222
s
s
Coeficiente de variaciónCoeficiente de variación
Proporciona los elementos para comparar la Proporciona los elementos para comparar la variabilidad en distintos conjuntos de datos que variabilidad en distintos conjuntos de datos que pueden tener distintas medias.pueden tener distintas medias.
Una desviación estándar de 500 en una distribución Una desviación estándar de 500 en una distribución con una media de 5000, sugiere una variabilidad con una media de 5000, sugiere una variabilidad mayor que una desviación de 500 en una distribución mayor que una desviación de 500 en una distribución de media 50000de media 50000
Coeficiente de variaciónCoeficiente de variación
• CálculoCálculo
• AdimensionadoAdimensionado
sCV
x
Medidas de asimetríaMedidas de asimetría• Se refiere a la simetría respecto a la media.Se refiere a la simetría respecto a la media.
Si f es la función de distribución, diremos que la Si f es la función de distribución, diremos que la distribución es:distribución es:
Distribución simétrica
0
2
4
6
8
10
12
m-a m
m+a
Densidad
Asimetría negativa
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7 8 9
Densidad
Asimetría positiva
( ) ( )f media a f media a Simétrica si para todo a es
( ) ( )f media a f media a Asimetría negativa si para algún a es
( ) ( )f media a f media a Asimetría positiva si para algún a es
Medidas de PosiciónMedidas de Posición
• Cuantil: valor de la variable bajo el cual se encuentra Cuantil: valor de la variable bajo el cual se encuentra una cierta proporción de los valores de la una cierta proporción de los valores de la distribución.distribución.
• Percentiles o centiles - C,100 partes Percentiles o centiles - C,100 partes
• Deciles - D, 10 partesDeciles - D, 10 partes
• Cuartiles - Q, 4 partes: Cuartiles - Q, 4 partes:
• Q1(25%), Q2(50%), Q3(75%)Q1(25%), Q2(50%), Q3(75%)
Mediana: Valor de la variable que deja por debajo al 50% de las observaciones
Percentil k: Valor de la variable que deja por debajo el k% de las observaciones(Ej: P23, P45)
Decil k: Valor de la variable que deja por debajo el (k*10)% de las observaciones (Ej: P10=D1, P20=D2,etc.)
Cuartil k:Valor de la variable que deja por debajo el (k*25)% de las observaciones (Ej: P25=Q1, P75=D3,etc.)
Medidas de PosiciónMedidas de Posición
Medidas de Posición: Medidas de Posición: equivalenciasequivalencias
• DD11=P=P1010
• QQ11=P=P25 25
• QQ22=Md=P=Md=P5050
• Medidas derivadas:Medidas derivadas:
Rango intercuartílico: QRango intercuartílico: Q33-Q-Q11..
Desviacion intercuartil: (QDesviacion intercuartil: (Q33-Q-Q11)/2)/2
Ejemplo de AplicaciónEjemplo de Aplicación
Curvas de crecimientoCurvas de crecimiento
Peso-edadPeso-edad Talla-edadTalla-edad Perímetro cefálico-edadPerímetro cefálico-edad Crecimiento intrauterino,etcCrecimiento intrauterino,etc
Curva de CrecimientoCurva de Crecimiento
Para 12 meses
P50 =46cm(aprox)
P90=48cm(aprox)
Algunas indicaciones respecto Algunas indicaciones respecto a medidas de resumena medidas de resumen
• No siempre es necesario indicar todas las medidas de No siempre es necesario indicar todas las medidas de resumen.resumen.
• Buscar las más significativas y representativas. Buscar las más significativas y representativas.
• En distribuciones sesgadas es mas apropiada la En distribuciones sesgadas es mas apropiada la mediana como medida de tendencia centralmediana como medida de tendencia central
• En distribuciones bimodales o multimodales , esa En distribuciones bimodales o multimodales , esa característica no debe dejar de mencionarse.característica no debe dejar de mencionarse.
Desviación-simetría-rangoDesviación-simetría-rango
Sesgo a izquierda. Asimetría Sesgo a izquierda. Asimetría negativa. Media < Mdnegativa. Media < Md
Sesgo a derecha. Asimetría positivaSesgo a derecha. Asimetría positivaMedia>MdMedia>Md
Medidas para datos nominalesMedidas para datos nominales Proporción:Proporción:
Numero (a) de observaciones con una característica Numero (a) de observaciones con una característica dada (como sano o enfermo) dividido entre el numero dada (como sano o enfermo) dividido entre el numero total de observaciones de los sanos y enfermos (a+b) en total de observaciones de los sanos y enfermos (a+b) en un grupo dado. Esto es:un grupo dado. Esto es:
)( ba
aproporcion
ResultaResultadodo
Trat Trat AA
Trat BTrat B TotalTotal
SanoSano 9090 350350 440440
EnfermEnfermoo
810810 750750 15601560
TotalTotal 900900 11001100 20002000
45.02000
900
)1100900(
900.
ATrat
Razón:Razón: Número (a) de observaciones en un grupo dado con una Número (a) de observaciones en un grupo dado con una
característica dada (como sano) dividido entre el número característica dada (como sano) dividido entre el número (b) de observaciones sin la característica dada (como estar (b) de observaciones sin la característica dada (como estar enfermo). Esto es:enfermo). Esto es:
b
arazon
Tomando los datos de la tabla, la razón de sanos sobre enfermos es:
282.01560
440/ enfsanos