38
Sesión 01 Estadística Descriptiva

Sesión 01

Embed Size (px)

Citation preview

Page 1: Sesión 01

Sesión 01Estadística Descriptiva

Page 2: Sesión 01

Dr. Jorge Ramírez Medina

Distribuciones de frecuencia

Histograma

0

10

20

30

40

50

60

70

< 249

250-3

99

400-5

49

550-6

99

700-8

49

850-9

99

1000

-114

9

1150

-129

9

1300

-144

9

1450

-159

9

Clase

Frec

uenc

ia

Page 3: Sesión 01

Dr. Jorge Ramírez Medina

Definición de Estadística

Es la ciencia pura y aplicada que trata de la recolección, organización,

presentación y análisis de conjuntos de datos con el fin de obtener conclusiones o inferencias y

establecer su grado de incertidumbreFuente: Estadística para Administración y Economía. Anderson, Sweeney y Williams

Page 4: Sesión 01

Dr. Jorge Ramírez Medina

Tiene que ver con la toma de decisiones

Fuente: Field Andy. Discovering Statistics using IBM SPSS Statistics 2013.

Page 5: Sesión 01

Dr. Jorge Ramírez Medina

Escalas de medición

Cualitativos

Cuantitativos

Numéricos Numéricos

No numéricos

Datos

Nominal

Ordinal

Nominal

Ordinal

Intervalo

Razón

Page 6: Sesión 01

Dr. Jorge Ramírez Medina

Tablas de frecuencia

Cualitativos

No numéricos

Datos

Nominal Ordinal

FrecuenciaFrecuencia

relativaPorcentaje

de frecuenciamalo 3 0.15 15%regular 4 0.2 20%bueno 2 0.1 10%muy bueno 6 0.3 30%excelente 5 0.25 25%Total 20 1 100%

Page 7: Sesión 01

Dr. Jorge Ramírez Medina

Modelos estadísticos simples• Medidas de tendencia Central

• Media, Moda, Mediana• Medidas de dispersión

• Varianza, Desviación estándar

Page 8: Sesión 01

Dr. Jorge Ramírez Medina

Moda

Rela

tive

Freq

uenc

y

.05

.10

.15

.20

.25

.30

.35

0

corresponde al punto más alto de la gráfica

Page 9: Sesión 01

Dr. Jorge Ramírez Medina

Mediana

Rela

tive

Freq

uenc

y

.05

.10

.15

.20

.25

.30

.35

0

Divide la gráfica en dos áreas iguales

50% de los datos

50% de los datos

Page 10: Sesión 01

Dr. Jorge Ramírez Medina

Ejemplo Salarios

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460 465 465465 470 470 472 475 475 475 480 480 480480 485 490 490 490 500 500 500 500 510510 515 525 525 525 535 549 550 570 570575 575 580 590 600 600 600 600 615 615

Page 11: Sesión 01

Dr. Jorge Ramírez Medina

Cálculo en el ejemplo

54.74100 % 100 % 11.15%490.80sx

2 2996.47 54.74s s La desviación

estándard es cerca del

11% de la media

• Varianza

• Desviación estándar

• Coeficiente de Variación

22 ( ) 2,996.161

ix xs

n

Page 12: Sesión 01

Dr. Jorge Ramírez Medina

Estadística Descriptiva

Son los métodos tabulares , gráficos y numéricos utilizados para sumarizar datos.

Page 13: Sesión 01

Dr. Jorge Ramírez Medina

5 números que definen una población o fenómeno

425 430 430 435 435 435 435 435 440 440440 440 440 445 445 445 445 445 450 450450 450 450 450 450 460 460 460 465 465465 470 470 472 475 475 475 480 480 480480 485 490 490 490 500 500 500 500 510510 515 525 525 525 535 549 550 570 570575 575 580 590 600 600 600 600 615 615

Valor más bajo = 425 1er Cuartil = 445Mediana = 475

3er Cuartil = 525 Mayor valor = 615

Page 14: Sesión 01

Dr. Jorge Ramírez Medina

Diagrama de Caja

325 400 425 450 475 500 525 550 575 600 645

Q1 = 445 Q3 = 525Q2 = 475

Los bigotes (líneas punteadas) se dibujan del final de la caja a los valores más grandes y pequeños dentro de los límites

Valor más bajo= 425Mayor valor= 615

Page 15: Sesión 01

Dr. Jorge Ramírez Medina

Diagrama de Caja

Sentida Falsa Miserable

Neutra

Page 16: Sesión 01

Dr. Jorge Ramírez Medina

Diagrama de Caja

Page 17: Sesión 01

Dr. Jorge Ramírez Medina

Estadística InferencialEl propósito de esta rama es obtener predicciones de una población con base en información obtenida de una muestra.

Page 18: Sesión 01

Dr. Jorge Ramírez Medina

X representa lo desconocido

Page 19: Sesión 01

Dr. Jorge Ramírez Medina

Variable aleatoria Una variable aleatoria es una descripción numérica

del resultado de un experimento.

Una variable aleatoria discreta puede asumir unnúmero finito de valores o una secuencia infinita de

Valores.

Una variable aleatoria continua puede asumir cualquier valor numérico en una intervalo o un

conjunto de intervalos.

Page 20: Sesión 01

Dr. Jorge Ramírez Medina

Tome x = número de TVs vendidas en la tiendaen un día. x puede tomar 5 valores (0, 1, 2, 3, 4)

Ejemplo: Tiendas de Todo

Variable aleatoria discreta con un númerofinito de valores.

Page 21: Sesión 01

Dr. Jorge Ramírez Medina

Ejemplo: Tiendas de Todo

Variable aleatoria discreta con un númeroinfinito de valores.

Podemos contar los clientes pero no hay un límite finito de los que puedan llegar.

Tome x = número de clientes que llegan a la tiendaen un día. x puede tomar 5 valores 0, 1, 2, 3, 4…..

Page 22: Sesión 01

Dr. Jorge Ramírez Medina

Variable AleatoriaPregunta Random Variable x TypeTamaño deLa familia

x = Número of dependientes reportados para el censo

Discreta

Distancia de la casa a la escuela

x = Distancia en kms. de la casa a la escuela

Continua

Tener mascotaperros y/ogatos

x = 1 si no tiene mascota; = 2 si tiene perro(s) únicamente; = 3 si tiene gato(s) únicamente; = 4 si tiene perro(s) y gatos(s)

Discreta

Page 23: Sesión 01

Dr. Jorge Ramírez Medina

Distribuciones de probabilidad discretas

La distribución de probabilidad de una variable aleatoria describe como las probabilidades están

distribuidas sobre los valores de la variable.

Podemos representar la distribución discreta de probabilidad con una tabla, una gráfica o una ecuación.

Page 24: Sesión 01

Dr. Jorge Ramírez Medina

Distribuciones de probabilidad discretas

La distribución de probabilidad está definida por una función de probabilidad, f(x), la cuál provee la probabilidad para

cada valor de la variable aleatoria.

Las condiciones requeridas para una función de Probabilidad discreta son;

f(x) > 0

f(x) = 1

Page 25: Sesión 01

Dr. Jorge Ramírez Medina

Utilizando los datos de ventas de TV’s desarrolle una representación tabular de la distribución de probabilidad de las ventas de TVs

Unidades Número Vendidas de días

0 80 1 50 2 40 3 10 4 20

200

x f(x) 0 .40 1 .25 2 .20 3 .05 4 .10 1.00

80/200

Distribuciones de probabilidad discretas

.10.20

.30

.40.50

0 1 2 3 4Valores de la Variable Aleatoria x (ventas de

TV)

Prob

abilid

ad

Page 26: Sesión 01

Dr. Jorge Ramírez Medina

Valor Esperado y Varianza El valor esperado, o media, de una variable aleatoria

es una media de su localización.

La varianza resume la variabilidad en los valores de la variable aleatoria.

La desviación estándar, , está definida como la raíz cuadrada positiva de la varianza.

Var(x) = 2 = (x - )2f(x)

E(x) = = xf(x)

Page 27: Sesión 01

Dr. Jorge Ramírez Medina

Varianza y Desviación estándar

01234

-1.2-0.2 0.8 1.8 2.8

1.440.040.643.247.84

.40

.25

.20

.05

.10

.576

.010

.128

.162

.784

x - (x - )2 f(x) (x - )2f(x)

Varianza de las ventas diarias = 2 = 1.660

x

TVsal

cuadrado

Desviación estándar de las ventas diarias = 1.2884 TVs

Valor esperado y varianza

Page 28: Sesión 01

Dr. Jorge Ramírez Medina

Nos interesa el contorno de la distribución

Page 29: Sesión 01

Dr. Jorge Ramírez Medina

Nuestro interés es el número de éxitos que ocurren en los n intentos.

Tomamos x como el número de éxitos que ocurren en los n intentos.

Distribución Binomial

Page 30: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial

donde: f(x) = La probabilidad de x éxitos en n intentos n = el número de intentos p = la probabilidad de éxito de cualquier intento

Función de probabilidad binomial

)()1()!(!

!)( xnx ppxnx

nxf

Probabilidad de una secuencia particular de resultados

con x éxitos en n intentos

Número de resultados experimentales que dan

x éxitos en intentos

Page 31: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial Ejemplo

Una empresa está preocupada por la alta rotación de sus empleados. Para un empleado seleccionado al azar, se estima una probabilidad de 0.1 de que la persona no esté el próximo semestre trabajando. Si se seleccionan 3 empleados al azar ¿cuál es la probabilidad de que uno de ellos no esté trabajando el próximo semestre en la empresa?

Page 32: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial

Diagrama de árbol

1st Worker 2nd Worker 3rd Worker x Prob.

Leaves (.1)

Stays (.9)

3

2

0

22

Leaves (.1)

Leaves (.1)S (.9)

Stays (.9)

Stays (.9)

S (.9)

S (.9)

S (.9)

L (.1)

L (.1)

L (.1)

L (.1) .0010

.0090

.0090

.7290

.0090

11

.0810

.0810

.0810

1

Page 33: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial Utilizando la función de probabilidad Binomial

tome: p = .10, n = 3, x = 1

)()1()!(!

!)( xnx ppxnx

nxf

243.0)81)(.1(.3)1.01(1.0)!13(!1

!3)1( )13(1

f

Page 34: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial utilizando Tablas de Probabilidad Binomial

n x .05 .10 .15 .20 .25 .30 .35 .40 .45 .503 0 .8574 .7290 .6141 .2430 .4219 .3430 .2746 .2160 .1664 .1250

1 .1354 .2430 .3251 .3840 .4219 .4410 .4436 .4320 .4084 .37502 .0071 .0270 .0574 .0960 .1406 .1890 .2389 .2880 .3341 .37503 .0001 .0010 .0034 .0080 .0156 .0270 .0429 .0640 .0911 .1250

p

X P(X)0 0.7291 0.2432 0.0273 0.001

Utilizando excelBinomial

Page 35: Sesión 01

Dr. Jorge Ramírez Medina

Distribución Binomial

El valor esperado;

La varianza;

= 3(.1)(.9) = .27

La desviación estándar, =

Var(x) = 2 = np(1-p)

E(x) = = np

)1( pnp

= 3(.1) = .3 empleados de 3

Page 36: Sesión 01

Dr. Jorge Ramírez MedinaDr Jorge Ramírez MedinaEGADE Business School

Distribución Poisson y exponencial

!)(

xexfx

Para x ≥0, μ≥0

x

exf

1)(

ox

exxP 1)( 0

Page 37: Sesión 01

Dr. Jorge Ramírez Medina

Reflexión en clase

• Cuidado con lo que asume.• Sea claro acerca quiere descubrir.• No tome la causalidad por sentado.• Con estadística no se puede probar cosas con el 100%

de certeza• Un resultado que es numéricamente significativo puede

ser inútil.Tomado de The Use and Misuse of statistics HBP.

Page 38: Sesión 01

Dr. Jorge Ramírez Medina

Fin de sesión

Gracias por

su atención