11
1 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN

3 medidas de tendencia central y de dispersion

Embed Size (px)

Citation preview

Page 1: 3 medidas de tendencia central y de dispersion

1

MEDIDAS DE TENDENCIA

CENTRAL Y DE DISPERSIÓN

Page 2: 3 medidas de tendencia central y de dispersion

2

MÉTODOS ANALÍTICOS

MEDIDAS DE TENDENCIA CENTRAL

• Moda

• Media

• Mediana

• Cuantiles: cuartiles, deciles y percentiles

MEDIDAS DE DISPERSIÓN

• Rango o recorrido

• Recorrido intercuartílico

• Varianza y desviación típica

• Desviación media

• Coeficientes de variación

Page 3: 3 medidas de tendencia central y de dispersion

3

MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMÉTICA:n

nx

xn

x

x

k

j

jj

n

i

i11

Por ejemplo, con los datos muestrales: 2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 se

tienen dos modas: 4 y 6.

515

2827365342322

515

887766654443322

x

x

MODA, Mo: Es el dato que más se repite. Puede haber más de

una moda.

Con los datos anteriores, se tiene:

Page 4: 3 medidas de tendencia central y de dispersion

4

CUANTIL DE ORDEN , C : Es un valor tal que, ordenados en

magnitud los datos, el 100 % es menor que él y el resto mayor.

Utilizaremos los cuartiles Q1, Q2, Q3 , los deciles D1,...,D9 y los

percentiles P1,...,P99 que corresponden a cuantiles con = 0.25,

0.5,0.75, = 0.1,...,0.9 y = 0.01,...,0.99 respectivamente.

MEDIANA Me: Es un valor tal que, ordenados en magnitud los

datos, el 50% es menor que él y el 50% mayor.

2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

Page 5: 3 medidas de tendencia central y de dispersion

5

Cálculo de cuantiles: (mediana, cuartiles y percentiles)

• Se ordenan los datos de menor a mayor.

• Se determina el valor n .

Donde n es el numero de datos

el orden del cuantil que queremos calcular

• Si n no es entero, se redondea al siguiente entero y el dato que ocupe ese lugar es el cuantil buscado.

• Si n = k es entero el cuantil buscado es la media entre xk y xk+1.

2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 en este ejemplo n=15

La mediana será: Me = C0.5, es decir n =15*0.5 = 7.5, luego la mediana

ocupa el lugar 8, x8 =Me=5

El segundo decil D2 = C0.2, es decir n =15*0.2=3, luego D2 es la media

entre x3 y x4, D2=3

Page 6: 3 medidas de tendencia central y de dispersion

6

ROBUSTEZ DE LA MEDIANA

Consideremos los datos del ejemplo anterior:

2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

Si añadimos un nuevo dato x16 = 34 y calculamos de nuevo la media y

la mediana, obtenemos:

• Nueva media: = 6.8

• Nueva mediana: Me = 5.5

x

Page 7: 3 medidas de tendencia central y de dispersion

7

COMPARACIÓN MEDIA-MEDIANA

• La media contiene más información porque usa los valores de

todos los datos.

• La mediana es más robusta frente a los cambios en los datos.

• La media es más sencilla de calcular y se presta mejor a los

cálculos algebraicos.

• Deben calcularse ambas pues proporcionan información

complementaria.

Page 8: 3 medidas de tendencia central y de dispersion

8

MEDIDAS DE DISPERSIÓN

Las medidas de centralización proporcionan una información incompleta

del conjunto de datos.

Ejemplo: sean X e Y las notas de dos grupos de cuarenta

alumnos, con distribuciones de frecuencias:

xi ni

0 20

10 20

yi ni

4.5 3

5 34

5.5 3

Para ambas variables la media es

5, pero en el segundo caso 5 es un

valor más representativo de los

datos que en el primero.

Las medidas de dispersión nos permiten valorar si el valor de la medida

de tendencia central es , o no es , representativo.

Page 9: 3 medidas de tendencia central y de dispersion

9

MEDIDAS DE DISPERSIÓN

Partimos de una muestra de tamaño n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

• RANGO O RECORRIDO: R = Max-Min =

7

1j

j2

j

n

1i

2i nxx

15

1xx

n

1 V

7

1j

j2

j

n

1i

2i

2 nxx14

1xx

1-n

1 s

Dt V

2ss

8 - 2 = 6

7 -3 = 4

3.87

4.14

= 1.97

= 2.04

• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 =

• VARIANZA:

• CUASIVARIANZA:

• DESVIACIÓN TÍPICA:

• CUASIDESVIACIÓN TÍPICA:

Page 10: 3 medidas de tendencia central y de dispersion

10

• DESVIACIÓN MEDIA:

j

7

1j

j

n

1i

i nMex15

1Mex

n

1Dm

• COEFICIENTE DE VARIACIÓN DE PEARSON:

DtCV

x

• COEFICIENTE DE VARIACIÓN MEDIA:

DmCVm

Me

= 1.73

= 0.394

= 0.347

Page 11: 3 medidas de tendencia central y de dispersion

11

Ejemplo de cómo la varianza no sirve para comparar

la dispersión de dos variables distintas:

Sea X el peso en Kg de una población de lagartos

Sea Y el peso en Kg de una población de tiburones

xi ni

0.4 3

0.45 4

0.5 6

0.55 2

yi ni

400 3

403 4

405 4

410 2

0.34CV

0.026V,473.0x

0.0076CV

9.846V404,y