28
UNIVERSIDAD AUSTRAL DE CHILE BIOESTADÍSTICA FACULTAD DE MEDICINA Prof: FRANCISCO MARIN H. INSTITUTO DE SALUD PUBLICA RESUMEN DE DATOS EN SALUD. LOS ESTADÍGRAFOS ¿Recuerda qué es una variable?... pues bien, las variables en la práctica toman valores respecto a los cuales se puede estudiar una o más de las siguientes características: 1. Frecuencia 2. Valores representativos 3. Variabilidad 4. Forma de la distribución de frecuencias. Respecto a frecuencias... se supone que usted ya manejo las medidas de intensidad, por lo tanto nos referiremos ahora a : 1. ESTADIGRAFOS DE POSICION Su objetivo es “resumir” los valores de una variable por medio de un “valor” representativo, es decir, indican cuál es el “centro” de la distribución de frecuencias de la variable. Existen muchos estadígrafos de posición, pero los más utilizados en el área de la salud son media aritmética, media geométrica, media armónica, mediana, moda y percentiles. 1.1 Modo, moda o valor modal. (Md) 1 Moda es el valor de una variable dada, que se repite un mayor número de veces No confunda “lo más frecuente”, es decir, lo que más se repite con “la mayoría¿Queda claro? Pregunte.

UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

UNIVERSIDAD AUSTRAL DE CHILE BIOESTADÍSTICAFACULTAD DE MEDICINA Prof: FRANCISCO MARIN H.INSTITUTO DE SALUD PUBLICA

RESUMEN DE DATOS EN SALUD. LOS ESTADÍGRAFOS

¿Recuerda qué es una variable?... pues bien, las variables en la práctica toman valores respecto a los cuales se puede estudiar una o más de las siguientes características:

1. Frecuencia2. Valores representativos3. Variabilidad4. Forma de la distribución de frecuencias.

Respecto a frecuencias... se supone que usted ya manejo las medidas de intensidad, por lo tanto nos referiremos ahora a :

1. ESTADIGRAFOS DE POSICION

Su objetivo es “resumir” los valores de una variable por medio de un “valor” representativo, es decir, indican cuál es el “centro” de la distribución de frecuencias de la variable.

Existen muchos estadígrafos de posición, pero los más utilizados en el área de la salud son media aritmética, media geométrica, media armónica, mediana, moda y percentiles.

1.1 Modo, moda o valor modal. (Md)

1

Moda es el valor de una variable dada, que se repite un

mayor número de veces

No confunda “lo más frecuente”, es decir, lo que

más se repite con “la mayoría” ¿Queda claro?

Pregunte.

Page 2: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

¿Cómo se calcula la moda?. Depende del tipo de variables (al igual que en las otras medidas de tendencia central)

1.1.1Variables cualitativas

En un estudio se encontró que las motivaciones del adolescentes para beber alcohol eran : curiosidad (40,0%), invitación (30,4%), agrado (17,5%), olvidar problemas (3,8%), imitación (2,8%), obligación (1,7%), y otras motivaciones (3,8%). ¿Cuál es la motivación modal? Interprétela.

1.1.2Variables cuantitativas discretas

En este caso la determinación de la moda se hace igual que en el ejemplo anterior.

Determine e interprete la edad modal en su curso.

1.1.3Variables cuantitativas continuas.

Por definición, en este caso los valores de las variables están agrupadas en intervalos. Por este motivo, lo primero, que se debe hacer es determinar en qué intervalo se encuentra el valor modal. ¿Sospecha cómo se hace esto?

Luego debe hacer una interpolación para determinar qué valor del intervalos es el modo. Para ello existen diversas técnicas, siendo la más utilizada, la que se puede resumir en la siguiente expresión:

2

Límite inferior Amplitud Frecuencia absoluta del intervaloMd = del + del x siguiente al modal. intervalo intervalo modal Suma de frecuencias de los inter- valos anterior y siguiente al modal

Page 3: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

En forma resumida

NOTA: Conviene que Ci sea constante, porque en caso contrario se puede llegar a conclusiones erróneas.

Ejemplo: Los datos siguientes corresponden a la consulta psiquiátrica en un trimestre, clasificada según edad y diagnóstico en un hospital de Concepción.

GRUPO DE EDAD ( años)

D I A G N O S T I C O T O T A L

Esquizofrenias

Neurosis Alcoholism

o

Otros

15 – 24 25 – 34 35 – 44 45 – 54 55 – 64 65 - +

25 65 28 33 11 6

13 30 28 16 7 2

0 5 18 13 5 2

39 67 49 38 21 23

77 167 123 100 44 33

TOTAL

168

96

43

237

544

Para calcular la edad modal del total de la consulta psiquiátrica se puede seguir los siguientes pasos :

a) Encontrar el intervalo modal. La frecuencia máxima es f 2 = 167 por lo tanto el intervalo modal es el segundo.

b) Determinar el límite inferior del intervalo modal Linf = 253

fi + 1 Md = Linf + Ci fi + 1 + fi - 1

Page 4: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

c) Calcular la amplitud del intervalo modal ( Ci ) C2 = 35 – 25 = 10 (OJO)

d) Buscar la frecuencia del intervalo siguiente de aquel que contiene a la moda ( f i + 1 )f3 =123

e) Buscar la frecuencia del intervalos anterior al intervalo modal (f i - 1 ) f1 = 77

f) Calcular la moda.

Md = 25 + 10 123 = 25 + 6,2 123 + 77

Md = 31,2 años.

Esto significa que la edad más frecuente entre las personas que consultaron por problemas psiquiátricos fue 31,2 años.

¿Cuán real le parece este resultado?

Practique calculando e interpretando la moda de la edad en los distintos diagnósticos.

1.1.4 Algo para pensar

¿Qué ocurrirá en el ejemplo sí un paciente tuviera 99 años? ¿Cambiaría la edad modal?

¿Cuántas modas puede tener una distribución? ¿A qué tipo de variable se puede aplicar la moda? ¿En qué unidades se expresa este estadígrafo?

4

Page 5: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

1.2 MEDIANA (Me)

Aunque este estadígrafo se puede determinar en el caso de variables cualitativas ordenables, sólo estudiaremos el caso de variables cuantitativas.

1.2.1Datos No agrupados

Es este caso se ordenan los datos y el que está al centro corresponde a la mediana.

Ejemplo:

7 35 40 27 18 15 13

Ordenando se tiene:

7 13 15 18 27 35 40

¿Cuál es la mediana en este caso?

Si hubiera dos valores centrales ¿Cuál sería el valor de la mediana?

5

MEDIANA es aquel valor de la variable que supera a no más dela mitad de las observaciones y es superada por no más de lamitad de ellas, es decir, es un valor que divide la distribución

en mitades respecto al número de casos

Page 6: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

1.2.2 Datos discretos agrupados.

Suponga que se dispone de la siguiente información:

NUMERO DEHIJOS

NUMERO DEFAMILIAS

NUMERO ACUMULADODE FAMILIAS

Xi fi Fi

01234

812252425

820456994

TOTAL 94

Primero se establece cuántas observaciones hay en cada mitad, o sea, n/2 =94/2 = 47. Luego se busca la frecuencia acumulada (Fi), inmediatamente superior a n/2, que en este caso corresponde a F4 = 69.

El valor de la variable (Xi) que tiene la frecuencia acumulada determinada anteriormente (F4 = 69), es la mediana, o sea, Me = 3.

¿Cómo se interpreta este resultado?

1.2.3 Datos agrupados en intervalos o clases

Al igual que cuando se calcula la moda, en este caso lo primero que se debe hacer, es determinar en que intervalo se encuentra la mediana.

Esto se logra utilizando el procedimiento presentado en el punto anterior. Luego se aplica la siguiente fórmula de interpolación:

donde:

Linf : Límite real inferior de la clase de la mediana6

n2

- F i - 1

Me = L inf + Ci

fi

Page 7: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

n : Número total de observaciones. Fi-l : Suma de todas las frecuencias que preceden a la clase de la

mediana. fi : Frecuencia de la clase de la mediana Ci : Amplitud de la clase de la mediana.

Para aclarar lo expuesto, utilizaremos los datos del punto 1.1.3, con que se ejemplificó el cálculo de la moda.

GRUPO DEEDAD(años)

CASOSfi

Fi

15 – 2425 – 3435 – 4445 – 5455 – 6465 y +

771671231004433

77-----367-----511544

TOTAL 544

En primer lugar, se debe determinar en qué intervalo se encuentra la mediana, para ello calculamos n/2 = 544/2 = 272. Luego se calcula la frecuencia acumulada ( Fi ). ¡HAGALO¡ A continuación se busca la Fi inmediatamente superior a n/2 = 272. En este caso dicha frecuencia toma el valor , lo cual nos indica que la mediana se encuentra en el intervalo. Finalmente se aplica la fórmula de interpolación.

Me = 35 + 10 272 – 244 = 35 + 2,3 = 37,3 años 123

¡” Interprete el resultado obtenido”!

7

Page 8: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

1.2.4Otro momento para pensar.

¿Qué ocurriría con el valor de la mediana, si una de las edades fuera 99?

¿Puede tomar valores negativos? ¿En qué unidades se expresa? ¿Cuántas medianas puede tener una distribución? ¿Cuándo conviene utilizarla?

1.3 PERCENTILES ( Pp)

No siempre interesa conocer “el Valor central” de una distribución de frecuencias; a veces es necesario saber cuáles son los valores de la variable que “dividen” la distribución en cuartos (CUARTILES), décimos (DECILES) o quinto (QUINTILAS). Pero en el área de la salud, es frecuente que se necesite conocer valores que dividen la distribución en cien partes iguales en cuanto a frecuencia. Dichos valores reciben el nombre de PERCENTILES.

Ejemplos:

Percentil 75 ( P75 ): es un valor de la variable que deja el 75% de las observaciones bajo él y al restante 25% sobre él

Percentil 33 ( P33 ): supera a 1/3 de las observaciones y es superado por los 2/3 de ellas.

Percentil 50 ( P50 ): ¿A qué corresponde?

Aunque se pueden calcular en las mismas situaciones que la mediana, sólo son útiles para datos agrupados.

Se calculan igual que la mediana, pero reemplazando n/2 por np/100 donde n es el número de datos y p corresponde al número del percentil.

8

Page 9: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

Ejemplo:

Los datos siguientes corresponden a defunciones ocurridas en la ciudad de Santiago durante un mes, de hace tres décadas.

EDAD(años)

DEFUNCIONESFiNº %

15 – 2425 – 3435 – 4445 – 5455 – 6465 – 74

4067143180270275

4,16,914,718,527,728,2

40107250430700975

TOTAL 975 100,1

Calcularemos : P 25, P50 y P75

* P 25 np/100 = 975 25/100 = 243,75

P 25 = 35 + 10 243, 75 – 107 = 35 + 9,6 = 44,6 años 143

* P50 np/100 = 975 50/100 = 487,5

P50 55 + 10 487,5 – 430 = 55 + 2,1 = 57,1 años 270

P 75 np/100 = 975 75/100 = 731,25

P 75 = 65 + 10 731,25 – 700 = 65 + 1,1 = 66,1 años 275

9

Page 10: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

En resumen:

P25 = 44,6 años: P50 = 57,1 años y P75 = 66,1 años. Lo cual significa que del total de fallecidos estudiados el :

25% no superó los 44,6 años.

50% no superó los 57,1 años.

75% no superó los 66,1 años.

Por supuesto que esto mismo usted lo puede decir de muchas otras formas. ¡Usted elige!

1.4 MEDIA ARITMÉTICA O PROMEDIO (X ó )

1.4.1 Datos no agrupados

Este procedimiento usted lo ha aplicado muchas veces. Primero se suman los datos (lo cual se simboliza Xi). Luego se determina el número de datos (n) y finalmente se hace la división correspondiente. En símbolos.

10

MEDIA ARITMECA es el valor que tendría una variable si nohubiera variabilidad entre sus distintos valores, es decir, es el

centro de gravedad de la distribución de frecuencias de variable.

Xi n

X =

Page 11: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

Ejemplo:

Se desea calcular el promedio de los siguientes valores de hemoglobina (gr/100 c.c.):

10,8; 15,6; 14,9; 13,0; 13,5; 14,0; 13,6; 13,2; 12,5; 11,2

x = 132,3/10 = 13,2 gr/100 c.c.

Interprete el resultado obtenido.

1.4.1Variable discretas

Es similar al caso anterior, pero como cada valor de la variable se repite un cierto número de veces ( frecuencia ), en vez de sumar varias veces el mismo número o dato, se multiplica por la frecuencia del valor correspondiente.

NOTA: siempre se debe efectuar primero los productos (Xifi) y luego la suma de ellos. NUNCA OPERAR AL REVES

11

xi fi

fi X =

Donde:

fi = n = número de datos fi = número de veces que se

repite el dato i.

Page 12: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

Ejemplo:

CANTIDAD DE VITAMINA(mg/100 ml)

Nº DE MUESTRAS CONUNA DETERMINADA

CANTIDAD DE VITAMINA

TOTAL DE VITAMINAA EN UN DETERMINADO

NIVEL

Xi fi Xi fi

545556575859

9152015101

486825112085558059

TOTAL fi = 70 Xifi = 3.925

X = Xi fi = 3925 = 56 mg/100 ml ƒ 70

¿Qué significa este valor?

1.4.3Variable continuas

En este caso se puede operar igual que en el caso anterior, si se utiliza un valor que represente a cada intervalo; dicho valor se llama “marca (o centro) de clase” y es el promedio entre los límites reales del intervalo. El hecho de utilizar el centro del intervalo como valor de las observaciones del grupo o clase, se basa en la suposición que los valores individuales se distribuye en forma simétrica alrededor del promedio, de modo que las subestimaciones que se producen se compensan con las sobreestimaciones. Mientras mayor es el numero de observaciones, mejor será la compensación cuando esta suposición es correcta.

Ejemplo:

12

Page 13: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

HEMOGLOBINAgr/100 c.c.

Xi ( 1 )

NUMERODE OBSERVACIONES

fi ( 2 )

MARCADE CLASEXci ( 3 )

TOTAL HEMOGLO-BINA A UN NIVEL

DADOXci fi ( 4 )

11 – 12,913 – 14,915 – 16,917 – 18,919 – 20,921 – 22,9

2578

226807

121416182022

2470

124840681600154

TOTAL n = 398 TOTAL 7164

Los datos aparecen en las columnas (1) y (2)

El procedimiento es el siguiente:

a) Determinar el centro de clase Xci para cada intervalo (columna 3)b) Multiplicar cada centro de clase por la frecuencia correspondiente.

(col4)c) Sumar los productos obtenidos en columna 4.d) Dividir la suma anterior por el total de datos.

X = 7164/398 = 18 gr/100 c.c.

1.4.4Más para pensar

¿Qué ocurrirá con el promedio si el primer y último intervalo no están bien definidos?

13

Xci fi

fiX =

Page 14: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

¿Se puede calcular en variables cualitativas?

¿Qué ocurriría en el ejemplo anterior si hubiera un valor igual a 50?

Para que tenga sentido práctico, debe utilizarse en distribuciones simétricas. ¿Qué se puede hacer en caso contrario?

Cuando los datos son promedios, su media aritmética NO es la suma de los datos dividida por el número de datos. Cada promedio debe ser multiplicado por el número de datos que le dio origen ( y se divide por el número de datos originales).

Si los datos se distribuyen exponencialmente se debe utilizar la media geométrica.

Si los datos son cuocientes se debe utilizar la media armónica.

La media geométrica de un conjunto de n valores positivos se calcula como la raíz de índice “n” del producto de los valores dados.

La media armónica se calcula como el valor recíproco de la media aritmética de los valores recíprocos de la variable.

1.4.5Criterios para elegir estadígrafos de posición.

a) Según tipo de variable:- Cualitativa no ordenable:- Cualitativa ordenable- Cuantitativa discreta:- Cuantitativa continua:

b) Según forma de la distribución:- Simétrica:- Exponencial:- Cuocientes:- Otros casos:

2. ESTADIGRAFOS DE DISPERSION

Intensidad, tendencia central, posición, medias... de distintos tipos, etc., son términos que usted ya deglutió y está digiriendo (¿?). Entonces puede que esté en condiciones de responder algunas interrogantes : ¿Es usted una persona promedio ¿ ¿cuál es la duración más frecuente de un beso? ¿Cuál es la mediana de su tiempo de estudio semanal? ¿Su PGP refleja

14

Page 15: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

su esfuerzo? ¡Responda! ¡Tiene toda la razón! Falta precisión .... ¡depende! ....

No basta resumir información de acuerdo a lo ya revisado, para tener una idea completa acerca de un hecho. Falta considerar otros aspectos entre los cuales está la variabilidad. ¿Qué es la variabilidad?

Observe los tríos siguientes:

9 8 7 6 5 4 3 2 1 9 9 9 9 9 9 9 9 9 9 10 11 12 13 14 15 16 17

¿En qué se parecen estos tríos de números?

¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte dudas!

NOTA: En este curso respetamos su desviación respecto al promedio.

A continuación revisaremos los estadígrafos de dispersión más utilizados en el áreas de la salud.

2.1 Amplitud. (llamada erróneamente rango)

Se calcula mediante la diferencia entre los valores máximo y mínimo de un conjunto de datos.

15

Page 16: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

Ejemplo:

Número de hijos por familia:

5, 7, 9, 10, 10, 11, 11, 13, 15

Amplitud : 15 – 5 = 10

Se usa cuando se trata de pocos datos o si interesa conocer la dispersión total.

No se basa en todas las observaciones

Debe utilizarse en combinación con otros indicadores.

2.2 Desviación estándar

Es el promedio de las desviaciones respecto a la media aritmética y se simboliza por “s” cuando se trabaja con una muestra y por cuando se dispone de información poblacional.

2.2.1 Datos no agrupados

Ejemplo:

4, 8, 10,11,17

16

= X i N

s = Xi - ( Xi) 2 n – 1 n (n-1)

2 22

Page 17: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

Supongamos que se trata de una población

Xi Xi2

48101117

166410121289

50 590

= 590 50 = 118 - 100 = 5 5

Supongamos ahora que se trata de una muestra

S = 590 ( 50)2 = 147,5 - 125 = 22,5 = 4,7

4 5 * 4

Datos agrupados

Si se trata de variables discretas bastará multiplicar los valores de la variable por su respectiva frecuencia, o sea reemplazar

Xi2 y Xi por Xi2 fi y Xi fi respectivamente

En el caso de variables continuas, se reemplaza Xi por la marca de clase Xci.

2.2.3 Consideraciones17

2

18 = 4,2

Page 18: UNIVERSIDAD AUSTRAL DE CHILE GUIA : 192  · Web view¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que puede ser resumida por medio ¿De qué cree usted? ¡Consulte

El cuadrado de la desviación estándar se llama varianza La desviación estándar se basa en todas las observaciones El resultado es siempre positivo Está relacionada con la curva normal. No conviene utilizarla en distribuciones en que no corresponde aplicar

la media aritmética. En ese caso se puede utilizar un conjunto de percentiles.

2.3 Coeficiente de variación (C V)

Muestra de variabilidad en forma adimensional

Permite comparar la variabilidad relativa de dos distribuciones. En su cálculo participan todos los datos.

SUFICIENTE

LO ULTIMO. Las medidas de dispersión presentadas ¿A qué tipo de variables son aplicables? ¿Correcto! Pero conviene tener presente que también existen estadigrafos de dispersión para los otros tipos de variables, pero no son de uso frecuente.

18

C V = Desviación estándarMedia aritmética x 100