17
3.1 - 1 Estadísticas Elemental Tema 3: Describir, Explorar, y Comparar Data

Estadísticas Elemental Tema 3: Describir, Explorar, y ... · 3.1 - 2 Variables comunes ... Tome una muestra aleatoria simple de n = 3 empleados. Calcule . ... Michael Sullivan Created

Embed Size (px)

Citation preview

3.1 - 1

Estadísticas Elemental Tema 3: Describir, Explorar, y

Comparar Data

3.1 - 2

Variables comunes

• N = total de individuos en la población

• n = total de elementos en la muestra

• 𝒙𝒊 = un valor observado

3-2

3.1 - 3

Medidas de tendencia central

• Una medida de tendencia central describe numéricamente el valor promedio o el dato típico de un conjunto de datos.

• Es un dato representativo de un grupo de datos.

• Las medidas de tendencia central más utilizadas:

– la moda

– la media aritmética

– la mediana

3-3

3.1 - 4

Una medida de tendencia central es la moda.

La moda de una variable es la observación que se produce

con mayor frecuencia.

Si no hay ninguna observación que se produce con la mayor

frecuencia, o si más de dos observaciones se producen con

la misma frecuencia decimos que el conjunto de datos NO

tiene moda.

El conjunto de datos puede tener más de un modo. En este

caso, decimos que el conjunto es bimodal.

3-4 © 2010 Pearson Prentice Hall. All rights reserved

Medidas de tendencia central (cont.)

3.1 - 5

EJEMPLO Identificar la Moda de un conjunto de datos

Los datos que siguen muestran los gobernadores

electos de Puerto Rico y el pueblo donde nacieron.

Identificar la moda.

3-5

# Nombre Pueblo de nacimiento

1 Luis Muñoz Marín San Juan

2 Roberto Sánchez Vilella Mayaguez

3 Luis A. Ferré Ponce

4 Rafael Hernández Colón Ponce

5 Carlos Romero Barceló Santurce

6 Pedro Rosselló González San Juan

7 Sila M. Calderón San Juan

8 Aníbal Acevedo Vilá Hato Rey

9 Luis Fortuño Santurce

10 Alejandro Garcia Padilla Coamo

3.1 - 6

La media aritmética de una variable (comúnmente

como el promedio)

se calcula sumando todos los valores de la variable en

el conjunto de datos y dividiendo la suma entre el

número total de observaciones.

3-6

Media Aritmética

La media aritmética poblacional se calcula utilizando todos los

individuos de la población.

La media aritmética poblacional es un parámetro y se denota 𝝁

(se pronuncia miu).

La media aritmética muestral se calcula utilizando los datos de la

muestra.

La media aritmética muestral es una estadístico y se denota

𝒙 . (𝑠𝑒 𝑙𝑒𝑒 𝑥 𝑏𝑎𝑟𝑟𝑎)

3.1 - 7

Si x1, x2, …, xN son las N observaciones de una

variable de la población, entonces la media de la

población, µ, esta dada por

1 2 Nx x x

N

3-7

Si x1, x2, …, xn son las n observaciones de la muestra,

entonces la media de la muestra, 𝒙 , esta dada por

1 2 nx x x

xn

ó

ó 𝑥 = 𝑥𝑖𝑛

Fórmulas para la Media

3.1 - 8

ACTIVIDAD Calcular la media poblacional y la media

muestral

Los siguientes datos representan la duración del viaje al

trabajo (en minutos) para los diez empleados de una

empresa.

23, 36, 23, 18, 5, 26, 43, 45, 65, 75

(a) Calcule la 𝜇 para estos datos.

(b)Tome una muestra aleatoria simple de n = 3

empleados. Calcule 𝑥 .

3-8 © 2010 Pearson Prentice Hall. All rights reserved

3.1 - 9

La mediana de una variable es el valor que se

encuentra en el medio de los datos cuando

éstos se han ordenado de forma ascendente.

Utilizamos M para representar a la mediana.

3-9 © 2010 Pearson Prentice Hall. All rights reserved

Determinar la Mediana

3.1 - 10 3-10

Pasos para determinar la mediana de un

conjunto de datos

Paso 1: Organizar los datos en orden ascendente.

Paso 2: Determinar el número de observaciones, n.

Paso 3: Determinar la observación en el centro del

conjunto de datos.

• Si el número de observaciones es impar, la mediana

es el valor que está exactamente en el medio del

conjunto.

Valor que se encuentra en la posición 𝑛+1

2

• Si el número de observaciones es par, entonces la

mediana es la media de la

dos observaciones intermedias del conjunto.

Hallar la media de los valores en posiciones

𝑛

2 𝑦

𝑛

2+ 1

3.1 - 11

EJEMPLO Calcular la mediana de un conjunto de datos

con número impar de observaciones

Los siguientes datos representan los pulsos (latidos por

minuto) de nueve estudiantes matriculados en una

sección de Estadística de alguna universidad.

76, 60, 60, 81, 72, 89, 89, 68, 73

Determine la mediana del conjunto.

Paso 1: 60, 60, 68, 72, 73, 76, 81, 89, 89

Paso 2: Hay n = 9 observaciones.

Paso 3: La mediana está en la posición, ______________,

3-11

3.1 - 12

EJEMPLO Calcular la mediana de un conjunto de datos

con número par de observaciones

Supongamos que llega un estudiante tarde a la clase. El

pulso de este estudiante es 80. Determine la mediana

del conjunto “nuevo”.

76, 60, 60, 81, 72, 89, 89, 68, 73, 80

Paso 1: 60, 60, 68, 72, 73, 76, 80, 81, 89, 89

Paso 2: Hay n = 10 observaciones.

Paso 3:

3-12

𝑛

2=

60, 60, 68, 72, 73, 76, 80, 81, 89, 89

𝑀 =

𝑛

2+ 1 =

3.1 - 13

EJEMPLO Medidas resistentes o robustas

Datos sobre la duración del viaje al trabajo (en minutos) para los

diez empleados de una empresa.

5, 18, 23, 23, 26, 36, 43, 45, 65, 75

Supongamos que se contrata a un nuevo empleado y este tiene

que hacer un viaje de 180 minutos. ¿Cuál es el impacto

sobre el valor de la media y la mediana de este nuevo

conjunto?

Media antes: 35.9 minutos

Mediana antes: 31 minutos

Media después:

Mediana después: 3-13

____ minutos

____ minutos

11 datos

3.1 - 14

Un resumen numérico de un conjunto de datos

se dice que es resistente si los valores extremos

(muy grandes o muy pequeños) relativos a los

datos, no afecta, sustancialmente, a su valor.

La mediana es una medida más robusta o

resistente que la media.

3-14

Medidas resistentes o robustas

3.1 - 15 3-15 © 2010 Pearson Prentice Hall. All rights reserved

Benjamin es dueño de una pequeña empresa de

Internet. Además de sí mismo, se emplea a otras doce

personas. Los salarios que reciben por los empleados

se ofrecen a continuación en miles de dólares (el salario

de Benjamin es el más grande, por supuesto):

Determine la moda, la media y la mediana.

30, 60,30, 75, 50, 60, 50, 55, 45, 50, 55, 30, 70

Solución:

Podríamos comenzar por ordenar los datos.

30, 30,30, 45, 50, 50, 50, 55, 55, 60, 60, 70, 75

EJEMPLO Identificar la moda, media y mediana

3.1 - 16

Calcular la media de tablas de frecuencias agrupadas

• Cuando en vez de un conjunto de datos observados sólo tenemos datos agrupados en una tabla de frecuencia, no podemos calcular una media exacta para el conjunto de datos.

• En ese caso, debemos estimar la media aritmética real usando tabla de frecuencias y la siguiente fórmula:

𝒙 𝒈 = 𝒇 ∙ 𝒎

𝒇

donde f = la frecuencia del intervalo y

m = el punto medio del intervalo.

3.1 - 17

Ejemplo

La Tabla 1 muestra los resultados agrupados de 19 estudiantes en un examen de una clase de Estadística Elemental.

Encuentre la mejor estimación de la media aritmética.

𝝁 = 𝒇 ∙ 𝒎

𝒇

1. Encontrar los puntos medios de

los intervalos.

Solución:

2. Calcular 𝒇 .

3. Calcular la media.