25
Unidad 1. Estadística descriptiva ___________________________________________________________________________________________________ _________________________ II.1 EL MÉTODO ESTADÍSTICO 1. ¿QUÉ ES LA ESTADISTICA?. La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir y analizar los datos. Así como de realizar inferencias a partir de ellos con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. La Estadística se puede dividir en dos grandes ramas: la Estadística Descriptiva y la Estadística Inferencial. Estadística Descriptiva: procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa. El resumen de los puede hacerse mediante tablas, gráficos o valores numéricos. Los conjuntos de datos que contienen observaciones de más de una variable permiten estudiar la relación o asociación que existe entre ellas. Estadística Inferencial: métodos empleados para inferir algo acerca de una población basándose en los datos obtenidos a partir de una muestra. Los datos estadísticos son cálculos aritméticos realizados sobre los valores obtenidos en una porción de la población, seleccionada según criterios rigurosos. 2. Conceptos ligados a la Definición Estadística del Problema: Población : Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cuales se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos producidos por una fábrica en un año, lanzamientos de una moneda, etc.). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones. Muestra : es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclusiones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población. Individuo (unidades estadísticas, unidades elementales, elementos o unidades de análisis): cada uno de los elementos de la muestra o de la población (personas, tornillos, hospitales, comercios) y sobre los que recaerá la observación. Variable : cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario, color de ojos, sexo, número de hijos). Los datos: son los valores que alcanzan las unidades en las variables estudiadas. P arámetro: es un solo valor obtenido para describir en forma sumaria las características pertinentes o un estado de naturaleza acerca de una población. Una población puede que tenga muchas características y, por consiguiente, también muchos parámetros, Sin duda, no todos los parámetros de una población son necesarios en una situación problemática dada; su elección depende de la naturaleza del problema. Se denota por . BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh ______________________________________________________________________________________________________ __________________________ 1

UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Embed Size (px)

Citation preview

Page 1: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

II.1 EL MÉTODO ESTADÍSTICO1. ¿QUÉ ES LA ESTADISTICA?. La Estadística se ocupa de los métodos y procedimientos para reco-ger, clasificar, resumir y analizar los datos. Así como de realizar inferencias a partir de ellos con la finali -dad de ayudar a la toma de decisiones y en su caso formular predicciones.

La Estadística se puede dividir en dos grandes ramas: la Estadística Descriptiva y la Estadística Inferen-cial. Estadística Descriptiva: procedimientos empleados para organizar y resumir conjuntos de observa-

ciones en forma cuantitativa. El resumen de los puede hacerse mediante tablas, gráficos o valores numéricos. Los conjuntos de datos que contienen observaciones de más de una variable permiten estudiar la relación o asociación que existe entre ellas.

Estadística Inferencial: métodos empleados para inferir algo acerca de una población basándose en los datos obtenidos a partir de una muestra. Los datos estadísticos son cálculos aritméticos reali -zados sobre los valores obtenidos en una porción de la población, seleccionada según criterios rigu-rosos.

2. Conceptos ligados a la Definición Estadística del Problema: Población : Es el conjunto de todos los elementos que cumplen ciertas propiedades y entre los cua-

les se desea estudiar un determinado fenómeno (pueden ser hogares, número de tornillos produci -dos por una fábrica en un año, lanzamientos de una moneda, etc.). Llamamos población estadística o universo al conjunto de referencia sobre el cual van a recaer las observaciones.

Muestra : es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclu-siones sobre las características de la población. La muestra debe ser representativa, en el sentido de que las conclusiones obtenidas deben servir para el total de la población.

Individuo (unidades estadísticas, unidades elementales, elementos o unidades de análisis): cada uno de los elementos de la muestra o de la población (personas, tornillos, hospitales, comercios) y sobre los que recaerá la observación.

Variable : cada uno de los rasgos o característica de los elementos de una población y que varían de un individuo a otro (salario, color de ojos, sexo, número de hijos).

Los datos: son los valores que alcanzan las unidades en las variables estudiadas. P arámetro: es un solo valor obtenido para describir en forma sumaria las características pertinentes

o un estado de naturaleza acerca de una población. Una población puede que tenga muchas características y, por consiguiente, también muchos parámetros, Sin duda, no todos los parámetros de una población son necesarios en una situación problemática dada; su elección depende de la naturaleza del problema. Se denota por .

Estadígrafo o estadístico : Es una función definida sobre los valores de la muestra. Se usa a menudo para “estimar” un parámetro y resumir las características en la muestra.

3. Tipos de Variables: Las variables pueden ser cualitativas o cuantitativas. Generalmente se utiliza el término “modalidad” cuando hablamos de caracteres cualitativos y el término “valor” cuando estudia-mos caracteres cuantitativos. Una variable no es sino el conjunto de las distintas modalidades o va-lores que toma un carácter. Variables cualitativas (o categóricas) : aquellas que no aparecen en forma numérica, sino

como categorías o atributos (sexo, profesión, color de ojos). Las variables cualitativas sólo pue-den tener niveles de medición nominales u ordinales.

Variables cuantitativas : las que pueden expresarse numéricamente (temperatura, salario, nú-mero de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados. Una Variable cuantitativa, según la cardinalidad de valores que puede tomar la variable, en cualquier intervalo, puede ser discreta o continua.

o Variables discretas : son el resultado de contar y sólo toman valores enteros (número de hijos);

o Variables continuas : son el resultado de medir, y pueden contener decimales (tempe-ratura, peso, altura). Se pueden subdividir a voluntad. Pueden tomar, entonces, cual-quier valor en un determinado intervalo.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

1

Page 2: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

2

Page 3: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________ 4. Las variables pueden corresponder a cuatro niveles de medición:

Cuadro 1. Descripción de las variables según escala de mediciónESCALA o Niveles de

mediciónDEFINICIÓN EJEMPLOS

NOMINAL Todos los valores de la variable se clasifican en diversas categorías excluyentes y sin orden. Los números solo identifican las categorías.

- Sexo - Estado civil - Profesión.- Religión - Nacionalidad.- Color de piel.

ORDINAL Hay orden entre las categorías, pero no grados de distancia.Los números son rangos de orden.

- Estratos socio económicos.- Preferencias.- Nivel de contaminación.- Nivel de calidad

DE INTERVALO Hay orden y grados de distancia iguales entre las categorías. No tienen “0” origen único natural, sino convencional. Los números indican el monto en que un objeto se diferencia de otro.

- Tiempo calendario- Escalas de Temperaturas - Coeficiente de inteligencia - Puntuación obtenida en una escala- Tallas de vestir.

DE RAZÓN Tiene las características de la escala de intervalo, pero se agrega un punto cero absoluto tal que significa ausencia del atributo y la razón o cociente de dos números es significativo pudiéndose aplicarles todo tipo de instrumental matemático. Ejemplo: ingreso familiar.

- Ingresos.- Edades.- Pesos.- Estaturas.- Longitud.- Altura.

Fuente: Elaboración propia.

5. Elementos de una variable: Se distinguen 3 elementos: Nombre o denominación de la variable. Definición o conceptualización. Conjunto de valores inherentes de la variable o categorías (códigos) definidas por el inves-

tigador.

Cuadro 2. Ejemplos de descripción de los elementos de una variableEjemplo 1a) Nombre: Estado civil.b) Definición: Situación civil en relación con las leyes y

costumbres el país.c) Categorías: 01) Soltero(a) 02) Casado (a) 03) Viudo (a) 04) Divorciado (a)d) Categorización:¿Cuál es su estado civil?

Ejemplo 2a) Nombre: Ingresos.b) Definición: Recursos monetarios netos, incluyendo

las bonificaciones que percibe una persona por su ocupación principal y secundaria durante el período de referencia de la encuesta.

c) Categorías: En forma de niveles o simplemente in-tervalos.Niveles de Ingreso: Alto. Medio. BajoIntervalos: Por ejemplo 4 intervalos

Menos de 100.000; 100.001 a 300.000; 300.001 a 700.000; 700.001 y más.d) Categorización: ¿Cuál es su ingreso total el último

mes?

Fuente: Elaboración propia.

6. Fuentes de datos Estadísticos Fuentes secundarias: Se pueden encontrar datos (estadísticas) relacionadas en artículos publicados, tesis, revistas,

periódicos, etc. Fuentes primarias: La información deberá recolectarse y analizarse. Algunas formas de recolec-

tar datos de “primera mano” es mediante registros, diseño de experimentos, encuestas ( muestrales, censales), …etc.

Presentar los datos a través de tablas y gráficos estadísticos.

II.2 TABLA DE DATOS: Los datos se organizan en filas (unidades de análisis o casos) y columnas (va-riables). La i-ésima fila: Valores que resultan de la medición de las p variables sobre el i-ésimo individuo (caso) observado. La j-ésima columna: Vj tiene los n valores de la j-ésima variable.

Tabla 1. Ejemplo base de datos o tabla de datos.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

3

Page 4: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

VARIABLESU. de Análisis (Casos)

SexoV1

EdadV2

Estado CivilV3

Nº HijosV4

Tiempo Servicio (años)

V5

Tipo de ViviendaV6

01 F 48 Casada 4 21 102 F 37 Casada 3 15 107 F 45 Casada 0 20 108 M 37 Soltero 0 11 2... … … … … … …32 F 48 Anulada 0 4 3Fuente: Elaboración propia sobre la base de la población de Trabajadores de la Empresa Super S.A. Muestra: Hogares (Familias). Casos (n = 32 Hoga-res). U. de Análisis: Jefe de Hogar .

1. TABLAS O CUADROS ESTADÍSTICOS: Presentan ordenadamente los datos en filas y columnas, clasificados y agrupados de acuerdo a un criterio específico.

DISTRIBUCIÓN DE FRECUENCIAS: Es un agrupamiento de datos en clases (o categorías o modalidades o valores o intervalos) que muestran el número de observaciones en cada clase (categoría, modalidad, valor o intervalo) mutuamente excluyentes.

2. TABLA DE DISTRIBUCIÓN DE FRECUENCIASSea X la variable de interés con valores (datos originales) x1, x2, x3, ... , xn. Sea xi una observación cualquiera. Para construir una TABLA DE DISTRIBUCIÓN DE FRECUENCIAS hay que organizar los datos me-diante los 2 procesos siguientes:1. Clasificación : Determinar las categorías, o los valores distintos de los datos, o los intervalos de cla-

se.2. Tabulación : Distribuir los valores de la variable (datos originales) en las categorías o intervalos.

CLASIFICACIÓNEs la “Elección de las categorías o modalidades o valores o clases o intervalos de clases”. Hay que distinguir varios casos:

a) a) Variables cualitativas (nominales u ordinales): las clases serán nominales (nombres).

b) b) Variables cuantitativas discretas (con pocos valores): las clases serán valores numéricos

distintos.c) Variables cuantitativas continuas (o discretas con muchos valores): las clases vendrán definidas

por los denominados “intervalos disjuntos de clase”. Aquí, las modalidades que contiene una clase son todos los valores numéricos posibles contenidos en el intervalo.

a) VARIABLES CUALITATIVAS - NOMINALES U ORDINALESTabla 2. Tabla de distribución de frecuencias para variables cualitativas ordinales ModalidadesDistintas de X

= Yi

Frec. Absoluta

ni

Frec. Relativa(ni/n)= fi

%fi Frec. Acumulada* Ni

Frec. RelativaAcumulada.

(Ni/n)= Fi

100*Fi Frec. porcentualAcumulada

Y1 n1 f1 100*f1 N1= n1 F1 100*F1

Y2 n2 f2 100*f2 N2= n1+ n2 F2 100*F2

...... ….. ….. ….. …..Ym nm fm 100*fm Nm=n Fm=1 100*Fm

n 1 100* Estás columnas en el caso de variables nominales no tienen sentido.Fuente: Elaboración propia.

Ejemplo: a) Variables cualitativas (nominales u ordinales): Profesionales según área de ingeniería de CODELCO en una muestra de 20 personas. Se consulta, X: Profesión de cada persona. ¿Cuál es elTipo de variable y Nivel de medición?.Profesiones o especialidades. I = Informático C = Civil E=Electrónico M = Mecánico R = Riesgos

C I M E M M C E M IM R C I M M C R M R

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

4

Page 5: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Tabla 3. Distribución de profesionales según especialidadEspecialidades ni fi %fi

Informática n1=3 f1=0,15 15Civil n2=4 f2=0,20 20Mecánica n3 f3=0,40 40

Electrónica n4=2 f4=0,10 10Riesgos n5=3 f5=

n=20 1Fuente: Elaboración propia.

b) VARIABLES CUANTITATIVAS - DISCRETAS CON POCOS VALORES.1.Ubicar el valor menor y el valor mayor. Sean Valor menor =Xmín ; Valor mayor = Xmáx 2.Se identifican los m valores “distintos” de X.

Ejemplo. “Tabla para Variables Cuantitativas Discretas”. En una muestra de n = 20 empresas pequeñas. Interesa organizar en una tabla de frecuencias la variable X= Número de trabajadores, en cada empresa. Los datos son:

6 5 4 4 6 2 53 3 4 4 4 6 35 5 4 5 4 3

CLASIFICACIÓNUbicar el valor menor de la variable X: Xmín = 2Ubicar el valor mayor de la variable X: Xmáx = 6Se identifican los valores “distintos” de X y se denotan por xi (para destacar el hecho de la “reducción de datos” que estamos realizando). x1= 2 x2= 3 x3= 4 x4= 5 x5= 6Aquí: m=5 (De los 20 valores hay 5 distintos).

Tabla 4. Distribución de frecuencias del número de trabajadores de 20 empresas.

Número de Trabajadores

Xi

ni fi fi% Ni Fi Fi%

2 1 1/20=0,05 5 1 0,05 5 3 4 4/20=0,2 20 5 0,25 25 4 7 7/20=0,35 35 12 0,60 605 6 3 3/20=0,15 15 20 1 100

TOTAL n =20 1 100Fuente: Elaboración propia.

GRÁFICO DE BARRASSe puede usar para describir cualquier nivel de medición (nominal, ordinal, de intervalo o de razón), pero fundamentalmente para las variables discretas.Hay varios tipos de gráficos de barras:1) De barras simples; 2) De barras agrupadas (o pareadas, 2 o más variables).

GRÁFICOS DE BARRAS SIMPLES Objetivo: Mostrar una distribución de frecuencia. Tipo de variable : Cualquiera no continua. Nº de variables: 1

Cada valor de la variable se representa por una barra cuyo largo indica el número (o porcentaje) de veces que se ha repetido ese valor. En el eje de las abscisas se ubican los valores de la variable (modalidades o valores discretos) y en las ordenadas las frecuencias absolutas o relativas o porcentajes.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

5

Page 6: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Gráfico 1. Distribución de profesionales según especialidad

Fuente: Elaboración propia.

GRÁFICOS DE BARRAS AGRUPADASObjetivo: Mostrar asociación entre variables.Tipo de variable : Cualquiera no continua. Nº de variables : 2 o más sin exagerar.

Gráfico 2. Distribución de profesionales por especialidad, según empresa.

Construya dos tablas de frecuencia con la información de la gráfica

GRÁFICO CIRCULAR DE SECTORES (TARTAS). Dividir un círculo en tantas porciones como clases hay. A cada clase le corresponde un arco proporcional a su frecuencia absoluta o relativa. Muy útil para desplegar una distribución de frecuencias relativas o porcentajes.Objetivo : Mostrar asociación entre variablesTipo de variable: Cualquiera no continua.Nº de Variables: 1

Gráfico 3. Superficie, en porcentaje, de las provincias de la Región de Los Lagos, a diciembre de 2006.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

6

Page 7: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Fuente: Elaboración propia.

Provincias de la región de los Lagos y el porcentaje de superficie en la Región

c) VARIABLES CUANTITATIVAS -CONTINUAS (O DISCRETAS CON MUCHOS VALORES)1.Se usan los “intervalos de clase”.Sea “m” el número de intervalos de clase. Para este número, se debe tomar en cuenta:

1. La naturaleza de la variable.2. El número de valores observados(cantidad de datos)3. El rango o recorrido de la variable.4. La unidad de medida.5. Los objetivos del estudio.

Reglas prácticas. Número de intervalos (m). Se elige un “m” tal que permita visualizar la “estructura” de los datos. Dependiendo de la cantidad

de datos, m varía generalmente entre 5 y 20 intervalos. Si se toman muchos intervalos se avanzará poco en el resumen de la información. Si son pocos, tal vez la “reducción” sea exagerada.

Un método muy usado es: T omar el entero superior más próximo en las fórmula siguiente:

m =1 + 3,322 log (n) (H. A. Sturges)

Sean:Rango de X= X máx - Xmín

LIi = Límite (Extremo) Inferior de un intervalo de clase.

Intervalo de clase = ] LIi - LSi ] ]No Se Incluye - Se incluye]Cualquier valor de X, SOLO puede pertenecer a un unico intervalo.

Amplitud del intervalo i-esimo Ai=LSi - LIi

LSi = Límite (Extremo) Superior del intervalo de clase.i-esimo

Marca de claseEs el punto medio de cada intervalo de clase.

EJEMPLODeterminar cuánto estudian los alumnos de lunes a viernes. Una muestra aleatoria de 30 estudiantes indicó las horas por semana que estudia cada uno: Organice los datos en distribución de frecuencias.

Nombre de la variable: horas de estudio, ¿ tipo de variable?.15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6; 12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8; 33,8; 23,2; 12,9; 27,1; 16,6.CLASIFICACIÓNn=30 Xmáx = 33,8 Xmín = 10,3 Rango = Xmáx-Xmín =23,5Número de intervalos = m = 1+3,3*log 30=5,87..Aprox. 6

Amplit.intervalos = Ai = 23,5 /6 =3,92.

Podemos tomar esta amplitud o cualquiera con valor superior. Si tomamos una amplitud modificada de 1 La construcción de Tablas de Frecuencia, con intervalos de clase, supone una ligera pérdida de información por la concentración de datos originales en las marcas de clase. Observemos que no se registra el dato original xi sino que este se ubica dentro de un intervalo. A menor número de intervalos, mayor es la pérdida de información. Pero, no es aconsejable usar un número elevado de intervalos, pues significaría poco avance en la reducción.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

7

Page 8: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________ 4, entonces se amplia el recorrido en los extremos desde 10 a 34. (Determine como se obtienen estos valores).Tabla 5. Distribución de frecuencias de las horas de estudio de 30 estudiantes.

Horas de estudio X i n i f i % N i F i %]10-14] 12 6 0,20 20 6 0,20 20]14-18] 16 8 0,267 26,7 14 0,467 46,7]18-22] 20]22-26] 24]26-30] 28 3 0,10 10 29 0,967 96,7]30-34] 32 1 0,033 3,3 30 1,000 100

n=30 1 100Fuente: Elaboración propia.

Ejercicio. Construya una tabla de frecuencia para los siguientes datos, realice el ejercicio en forma manual y a través de computador, por ejemplo con Excel. Como recomendación trabaje la variable en miles de dólares.

Tabla 6. Precios de venta de 80 autos vendidos en marzo 2006 en Valdivia (US$)20.197 20.372 17.454 20.591 14.96814.266 15.021 25.683 27.872 16.76632.851 16.251 17.047 21.285 26.07625.670 12.546 12.935 16.873 22.44925.034 21.533 24.443 16.889 19.44217.155 16.688 20.657 23.613 16.33120.765 22.783 23.661 29.277 23.28521.052 22.799 12.794 15.263 19.37418.442 18.722 23.651 24.453 17.35617.962 19.845 16.587 20.269 17.63315.890 18.740 21.324 21.609 29.49217.642 20.613 22.251 22.277 25.33717.818 23.237 17.004 14.357 14.89121.220 27.655 17.895 17.203 19.81717.445 18.556 17.642 18.981 24.89618.639 21.296 33.625 14.399 21.571

Fuente: Cámara de Comercio.12.546 12.794 12.935 14.266 14.357 14.399 14.891 14.968 15.021 15.26315.890 16.251 16.331 16.587 16.688 16.766 16.873 16.889 17.004 17.04717.155 17.203 17.356 17.445 17.454 17.633 17.642 17.642 17.818 17.89517.962 18.442 18.556 18.639 18.722 18.740 18.981 19.374 19.442 19.81719.845 20.197 20.269 20.372 20.591 20.613 20.657 20.765 21.052 21.22021.285 21.296 21.324 21.533 21.571 21.609 22.251 22.277 22.449 22.78322.799 23.237 23.285 23.613 23.651 23.661 24.443 24.453 24.896 25.03425.337 25.670 25.683 26.076 27.655 27.872 29.277 29.492 32.851 33.625

Encuentre los siguientes percentiles: P10 , P35 P65, Obtenga: Rango inter cuartilico, (Q3 – Q1)La posición del percentil r (Pr ) se encuentra con la formula: (n+1) r/100 1< r<100> precios<-scan("d:/precios.txt")

Sugerencia: En Excel use una sola columna para poner todos los datos, enseguida, ordene los datosB) TABLAS O CUADROS ESTADÍSTICOSEs el arreglo ordenado en columnas y filas, de datos estadísticos o características relacionadas, con el objeto de ofrecer información estadística de fácil lectura, comparación e interpretación. Un cuadro estadístico es el resultado de trabajos previos (planeamiento, recopilación, tabulación, cálculos, etc). Constituyen los “cuadros de análisis” que se incluyen frecuentemente en el cuerpo de los estudios, investigaciones o informes.c) PARTES PRINCIPALES DE UNA TABLA ESTADÍSTICA (CUADRO)

1. Número de la TABLA. ; 2. Título.; 3. Encabezamiento; 4. Cuerpo; 5. Nota de pie o llamadas. 6. Pie: Fuente.

2. REPRESENTACIONES GRÁFICAS DE UNA DISTRIBUCIÓN DE FRECUENCIASLa tabla estadística resume los datos que disponemos de una población, de forma que ésta se puede analizar de una manera más sistemática y resumida. Para darnos cuenta de un sólo vistazo de las características de la población resulta más claro el uso de gráficos. Todo gráfico estadístico es la representación de cantidades,

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

8

Page 9: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________ números o medidas por medio de figuras o dibujos, por lo tanto se construyen con relación a una escala de medida que debe conocerse. El tamaño y la forma del gráfico debe interpretarse numéricamente como una aproximación del verdadero valor de la variable que representa. Las tres formas de gráficas más usadas son tallo y hoja, histogramas, polígonos de frecuencia y las distribuciones de frecuencias acumuladas u ojivas.

2.1. TALLO Y HOJA (Steam and Leaf). Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente es la hoja. Una ventaja de la representación de tallo y hoja comparado con la distribución de frecuencias es que “no se pierde la identidad de cada observación”.Ejemplo: Los siguientes son los puntajes (0 a 100) en el Examen de Estadística de 12 alumnos: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representación de tallo y hoja para los datos.

EjemploPara las horas de estudio de los 30 alumnos.Las hojas son decimas

TALLO HOJA6 97 8 98 2 3 4 5 6 89 1 2 6

2.2. HISTOGRAMAObjetivo: Mostrar una distribución de frecuencias absolutas, relativas o porcentuales Tipo de variables: Cuantitativas continuas o discretas con muchos valores.Número de variables: Una.Es la presentación más frecuente para datos agrupados. Las clases se marcan en el eje horizontal con la amplitud del intervalo. Las frecuencias de clase van en el eje vertical y se representan por las alturas de las barras que se trazan adyacentes entre sí. 2.3. POLÍGONO DE FRECUENCIAS Objetivo: Mostrar una distribución de frecuencias absoluta o relativa.Tipo de variables: Cuantitativas continuas o discretas con muchos valores.Número de variables: Una o de preferencia más de una.Un Polígono de Frecuencias se construye a partir del histograma uniendo los puntos medios de las bases superiores de cada rectángulo. Son útiles en la comparación de distribuciones de frecuencias.2.4. GRÁFICO DE FRECUENCIAS ACUMULADAS (OJIVA)Se usa para determinar cuántos o qué proporción de los valores de los datos es menor o igual (o mayor) que cierto valor. Objetivo: Mostrar distribución de frecuencias acumuladas. Tipo de variables: Cuantitativas continuas o discretas con muchos valores.Número de variables: Una.

Representación gráfica de distribuciones de frecuencias: variables cuantitativas discretas con muchos valores o variables continua s . Un histograma (Figura 1), un polígono de frecuencias (Figura 2), un diagrama escalonado (figura 3), o una ojiva de frecuencias (Figura 4), nos permiten un análisis más rápido de los datos. Figura 1 Figura 2 Figura 3 Figura 4

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

9

0

0,05

0,1

0,15

0,2

0,25

0,3

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,5 34387,5

0

0,2

0,4

0,6

0,8

1

1,2

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,5 34387,50

0,2

0,4

0,6

0,8

1

1,2

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,5 34387,50

0,2

0,4

0,6

0,8

1

1,2

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,50

0,2

0,4

0,6

0,8

1

1,2

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,50

0,2

0,4

0,6

0,8

1

1,2

11083,5 13996,5 16909,5 19822,5 22735,5 25648,5 28561,5 31474,5

TALLO HOJA10 312 9 913 5 714 0 215 0 4 716 617 1 4 818 3 3 6 919 720 3 7 821 423 0 7 226 127 129 833 8

Page 10: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Fuente: Elaboración propia.

Nota: Complemetariamente existe una amplia variedad de gráficos, dentro de los que podemos mencio-nar gráficos lineales, pictogramas,…etc. Los estudiantes deben investigar los distintos tipos de gráficos utilizados con mayor frecuencia en publicaciones de índole genérico como propios de la especialidad. Como ejemplo podemos mencionar el gráfico lineal. GRÁFICOS LINEALESExpresan el comportamiento de dos (o más) variables. La variable independiente se inscribe en el eje horizontal y la dependiente en el eje vertical.Objetivo: Mostrar asociación entre variables.Tipo de Variables : Continua.Nº de Variables: 2 o más sin exagerar.

Gráfico 4. Evolución de la fuerza de trabajo ocupada en Chile y en la Región de Los Lagos. 2001 – 2006.

Fuente: Elaboración propia sobre la base de datos aportados por el INE – Región de Los Lagos.

Ejercicio; construya los gráficos adecuados para el ejemplo de las horas de estudio de los 30 estudiantes

III. RESUMENES NUMERICOS: ESTADÍGRAFOS DE POSICIÓN, DISPERSIÓN Y FORMAObjetivo de describir los datos es reducir una serie de datos a unos pocos coeficientes que contengan la mayor parte de la información relevante, con el fin de descubrir regularidades estadísticas en el grupo analizado. Los estadígrafos de posición de “Tendencia Central” tratan de ubicar e identificar el valor de la variable alrededor del cual “tienden a centrarse los datos”. Recuerde que: Estadígrafos: resumen información de la muestra. Parámetros: resumen información en la población. Las tablas de frecuencia y gráficos nos dan una idea general del “patrón” de la distribución de los valores, pero no nos indican un valor “típico”, “medio” o “promedio” o “central”.

3.1 Estadígrafos de posición central: Valor que representa un conjunto de datos y que trata de señalar una “posición central” de los

datos. Los más utilizados son:

El “promedio aritmético”. (La Media Aritmética). El “valor más común”. (La Moda). El “valor central”. (La Mediana). El cálculo de los estadígrafos difiere del caso en que se dispone de los datos originales o no agrupados, de aquel

en que no se dispone de ellos al encontrase agrupados en tablas de frecuencia. Cabe destacar que los valores calculados diferirán levemente por la perdida de información en las tablas de frecuencias.

3.1.1 La media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas:

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

10

Page 11: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

a) Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: Para el cálculo de los estadígra-fos será necesario distinguir los casos en los que los datos vengan agrupados, de aquellos en los que vengan sin agrupar.

Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

La media aritmética es el estadígrafo de posición central más utilizado. Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información. Sin embargo, presenta el problema de que su valor se puede ver muy influido por valores extremos, que se apartan en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

Ejemplo datos originales: Los siguientes son los puntajes (0 a 100) en el Examen de Estadística de 12 alumnos: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representación de tallo y hoja para los datos. Obtenga la media aritmética.

Datos originales (sin agrupar)

Investigue como obtener este estadígrafo a través de la calculadora científica y planilla Excel.

Ejemplo de datos agrupados en tablas de frecuencia: Un muestra aleatoria de 30 estudiantes de la UACh indicó que las horas de estudio, por semana, que cada uno estudia, se distribuye como muestra la Tabla 7.

Tabla 7. Horas de estudio de 30 estudiantes de la UACh.Horas de estudio X i n I f I X*ni X*fi

]10-14] 12 6 0,20 72 2,4]14-18] 16 8 0,2667 128 4,2672]18-22] 20 9 0,30 180 6]22-26] 24 3 0,10 72 2,4]26-30] 28 3 0,10 84 2,8]30-34] 32 1 0,0333 32 1,0656

n=30 1 568 18,9327Fuente: Elaboración propia.

Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

Ejercicio: obtenga la media para datos originales y agrupados en el ejemplo de los automóviles. Interprete la cifra resultado.

a.1) PROPIEDADES DE LA MEDIA ARITMÉTICA 1. Todas las variables de nivel de intervalo o de razón tienen Media Aritmética.2. Al evaluar la media se incluyen todos los valores de la variable y su valor final puede no ser un valor

observado.3. Un conjunto de valores sólo tiene una media aritmética.4. Es el único estadígrafo de posición tal que “la suma de las desviaciones de cada valor respecto a la

media es cero”. Ejemplo. Para la propiedad 4: Sean los tres valores: 3, 8 y 4. La media es 5. La propiedad 4 indica que: (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 – 1 = 0

a.2) DESVENTAJAS DE LA MEDIA ARITMÉTICALa media aritmética es muy sensible a los valores extremos de la variable. Se desplaza en la dirección del valor extremo. Luego, no se recomienda usar como medida central en distribuciones muy asimétricas. Ejemplo: Sean los valores 1; 2; 3; 4 y 5; La media aritmética es 3.

Sean los valores 1; 2; 3; 4; 50. La media aritmética es 12.b) Media geométrica: Investigar su definición y utilizaciónc) Media armónica: Investigar su definición y utilización

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

11

Page 12: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

3.1.2 La mediana (me): Consideramos una variable discreta X cuyas observaciones en una tabla estadística han sido ordenadas de menor a mayor. Llamaremos mediana, Me al primer valor de la variable que deja por debajo de sí al 50% de las observaciones. Por tanto, si n es el número de observaciones, la mediana corresponderá:

Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

Posición de la mediana =

Valor10,

312,

912,

913,

513,

714

14,2

15

15,4

15,7

16,6

17,1

17,4

17,8

18,3

18,3

18,6

18,9

19,7

20,3

20,7

20,8

21,4

23

23,2

23,7 26,1 27,1 29,8 33,8

Posi-ción 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

24 25 26 27 28 29 30

Datos originales (sin agrupar)

Por lo tanto la Mediana es: Me=18,3 horas

Ejemplo datos agrupados en tablas de frecuencia: Muestra aleatoria de 30 estudiantes indicó las horas por semana que estudia cada uno:

Tabla 8. Horas de estudio de 30 estudiantes de la UACh.

Horas de estudio X i n I Ni

]10-14] 12 6 6]14-18] 16 8 14]18-22] 20 9 23]22-26] 24 3 26]26-30] 28 3 29]30-34] 32 1 30

n=30Fuente: Elaboración propia.

Lugar en que se encuentra la mediana Datos agrupados en tablas de frecuencia

Ejercicio: obtenga la media para datos originales y agrupados en el ejemplo de los automóviles. Interprete a) PROPIEDADES DE LA MEDIANA

Es única para un conjunto de datos. No es afectada por valores extremos. Puede calcularse para variables ordinales, de intervalo y de razón. Usa menos información que la media, ya que sólo depende del orden de los datos.

3.1.3 La moda (md o mo): La observación modal es aquella que ocurre con mayor frecuencia.Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

Valor más frecuente

donde Da= Diferencia de la frecuencia absoluta del inter-valo donde se encuentra la moda y la frecuencia absoluta del intervalo anterior.Db= Diferencia de la frecuencia absoluta donde se encuentra la moda y la frecuencia absoluta del in-tervalo siguiente.

Ejemplo datos sin agrupar: Mo=12,9 horas y 18,3 horas

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

12

Page 13: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Ejemplo datos agrupados en tablas de frecuencia: Muestra aleatoria de 30 estudiantes indicó las horas por semana que estudia cada uno:

Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

Horas de estudio

X i n I Ni

]10-14] 12 6 6]14-18] 16 8 14]18-22] 20 9 23]22-26] 24 3 26]26-30] 28 3 29]30-34] 32 1 30

n=30

a) VENTAJAS DE LA MODA La moda es válida para todos los niveles de medida de las variables. No es afectada por valores muy extremos. Igual que la mediana, se puede usar en distribuciones con extremo abierto.b) DESVENTAJAS DE LA MODA Muchas variables no tienen moda, pues ningún valor aparece más de una vez. Si existe puede no ser única. Algunas variables tienen más de una moda. Esto ocurre cuando la po-

blación muestreada no es homogénea respecto a ciertas variables del estudio. Por ejemplo una pobla -ción que incluya hombres (machos) y mujeres (hembras).

3.2 POSICIÓN - LOCALIZACIÓN: El objetivo de estos estadígrafos es que sirven para clasificar (localizar) a un individuo dentro de una

determinada muestra. Dividen la distribución de los datos en grupos iguales de acuerdo a un cierto porcentaje. Genéricamente se llaman “CUANTILES”.

Los más usados son los percentiles (99), cuarteles (3), quintiles (4), deciles (10). Por ejemplo el primer cuartil es ese valor debajo del cual clasifica al 25% de las observaciones, y sobre el cual puede encontrarse el 75% restante. Segundo cuartil ¿cómo quedaría? y el Tercer cuartil

Datos originales (sin agrupar) Datos agrupados en tablas de frecuenciaPosición del cuantil pedido

Obtenga con estos datos el Cuartil 1, decil 4, cuantil 80Valor

10,3

12,9

12,9

13,5

13,7

14

14,2

15

15,4

15,7

16,6

17,1

17,4

17,8

18,3

18,3

18,6

18,9

19,7

20,3

20,7

20,8

21,4

23

23,2

23,7 26,1 27,1 29,8 33,8

Posi-ción 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

24 25 26 27 28 29 30

Cuartil 1= Q1=C25

por lo tanto C25=15 horas

Decil 4= D4=C40

por lo tanto C40=17,1 horas

¿cuantil 80 cuánto es?

Ejemplo datos agrupados en tablas de frecuencia: Muestra aleatoria de 30 estudiantes indicó las horas por semana que estudia cada uno:

Lugar en que se encuentran los cuantiles Datos agrupados en tablas de frecuencia

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

13

Page 14: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Diagramas de caja: Es una representación gráfica basada en cuartiles, que ayuda a ilustrar un conjunto de datos. Para elaborar tal diagrama solamente se necesitan cinco valores estadísticos: el valor mínimo; Q1; la mediana (Q2), Q3, y el valor máximo. A veces se gráfica el promedio.

Ejemplo: Realizar un gráfico de caja para el ejemplo de la variable horas de estudio.

Gráfico de Caja y Bigotes

Horas de estudio10 14 18 22 26 30 34

Ejercicio realice un gráfico de caja para datos venta de automóviles.

3.3. ESTADÍGRAFOS DE DISPERSIÓN: El objetivo es determinar el grado de alejamiento de los datos respecto a un estadígrafo de tendencia central que,

generalmente suele ser la media aritmética. Nos dan una idea acerca de lo agrupados que están los datos, y por lo tanto indican la homogeneidad de estos. En resumen, muestran la representatividad de los estadígrafos de tendencia central. A mayor dispersión menor representatividad. Por ejemplo un río tiene una profundidad media de 0,90 m.

Pero, la máxima profundidad puede ser 3 m o puede variar entre 0,35 m. y 2,10 m.Se toman por ejemplo los tres conjuntos pequeños de datos.

Set 1 Set 2 Set 3 0, 5,10 4,5,6 5,5,5

¿Qué media tienen los tres grupos?, ¿se puede establecer que los grupos son similares?¿se puede observar el grado de dispersión de cada grupo?

3.3.1 Rango: El estadígrafo de dispersión más simple es el rango o recorrido. El rango es simplemente la diferencia entre la observación más alta y la más baja.

3.3.2 Varianza de una muestra. Indica el promedio de las desviaciones (al cuadrado) de lasobservaciones con respecto a la media aritmética. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media aritmética, multiplicadas por el número de veces que se ha repetido cada valor. La sumatoria obtenida se divide por el tamaño de la muestra menos 1.

Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.

3.3.3 Desviación Estándar Muestral

Obtenga con los datos de horas de estudio la varianza y desviación estándar.Datos originales (sin agrupar) Datos agrupados en tablas de frecuencia

Calcule en el ejemplo de los autos ambos estadígrafos de dispersión.

3.3.4 Coeficiente de Variación (CV): Es una medida relativa de dispersión. Determina el grado de dispersión de un conjunto de datos relativo a su media. Es muy útil cuando se consideran dos o más distribuciones

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

14

Page 15: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

que tiene medidas significativamente diferentes.

El interés del coeficiente de variación es que al ser un porcentaje permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación estándar, ya que viene expresada en las mismas uni-das que los datos de la serie. Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones estándar (una viene expresada en centímetros y la otra en kilogramos). En cambio, sus co-eficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.

Ejercicio Resumen: La tabla siguiente muestra las diferencias en peso encontrada al hacer un muestreo de 100 mediciones en un laboratorio de una serie de productos (Y: diferencia en mm del peso real en comparación con el señalado por la etiqueta). Obtenga los estadígrafos planteados anteriormente.

Intervalos ni

[1,5 - 2,5] 43]2,5 - 3,5] 30]3,5 - 4,5] 17]4,5 - 5,5] 7]5,5 - 6,5] 3

3.3.5 La Distribución Normal y la Regla empírica. Si la muestra es simétrica y tiene la forma de una campana,

3.4 ESTADISTICOS DE FORMA: Objetivo miden la cantidad de “deformación” respecto de una distribución Normal. Los Estadígrafos de forma permiten conocer que forma tiene la curva que representa la serie de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva: Concentración: Indican si los valores de la variable están más o menos uniformemente repartidos a lo

largo de la muestra. Asimetría: Indican si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma

(centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares. Curtosis: Indican si los valores de la distribución están más o menos concentrados alrededor de los va-

lores medios de la muestra.

a) Concentración: Investigar este tema.b) Asimetría: Hemos comentado que el concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética)Para cuantificar el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene defini-do: Los resultados pueden ser los siguientes:

Figura 1. Indicador e ilustración gráfica de la simetría.

Fuente: Elaboración propia.

Simétrica; As=0; existe la misma concentración de valores a la derecha y a la izquierda de la media)

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

15

Simetría

Simétrica

Asimétrica positiva

Asimétrica negativa

Page 16: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________ Asimétrica positiva = As>0; existe mayor concentración de valores a la derecha de la media que a su iz-

quierda) Asimétrica negativa= As<0; existe mayor concentración de valores a la izquierda de la media que a su dere-

cha)

c) Curtosis: El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrede-dor de la zona central de la distribución. El Coeficiente de Curtosis viene definido por la siguiente fórmula:

Figura 2. Indicador e ilustración gráfica de la curtosis.

Fuente: Elaboración propia.

Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: K=3, presenta un grado de concentración medio alrededor de los valores centra-les de la variable (el mismo que presenta una distribución normal). K=3

Distribución leptocúrtica: K>3, presenta un elevado grado de concentración alrededor de los valores centra-les de la variable.

Distribución platicúrtica: K<3 presenta un reducido grado de concentración alrededor de los valores centra-les de la variable.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

16

Curtosis

Mesocúrtica

Leptocúrtica

Platicúrtica

Page 17: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

Ejercicios propuestos. BAIN 052

1.- REVISIÓN DE CONCEPTOS. Como usted sabe, en cualquier estudio científico es vital definir con precisión los términos. Por lo tanto, debe tratar de comprender perfectamente todos los términos la primera vez que los ve. ¿Cuáles son los nuevos términos que ha aprendido en este capítulo?. ¿Puede definir cada uno con palabras suyas?.

2.-¿Qué es la ESTADÍSTICA?2.1. Defina la Estadística2.3. Investigue y Refiérase a los siguientes términos: investigación, empírica, investigación empírica, fenómenos reales, modelo,

clasificación de los modelos, modelos matemáticos, teoría, realidad.2.4. ¿Cómo se relaciona la ESTADÍSTICA con los conceptos involucrados en el punto anterior?.

3.- USOS DE LA ESTADISTICA EN SU ESPECIALIDAD. Piense en por lo menos diez usos de la ESTADÍSTICA en su especialidad y áreas relacionadas.

4.- EL MÉTODO ESTADÍSTICO4.1. Señale cuales son las etapas en un estudio estadístico y refiérase en forma breve pero precisa a cada una de ellas. 4.2. Considere al menos una de las situaciones que mencionó en el problema tres anterior. Describa como se aplicarían, a la solución de dicha

situación, las etapas de un estudio estadístico.5. Desarrolle en EXCEL el siguiente problema. Con el objetivo de conocer las preferencias de los usuarios en cuanto marcas de computadoras

personales, se entrevistó a 50 personas que habían comprado un PC en el último mes, obteniéndose los siguientes resultados: Tabla 2.1 Datos de una muestra de 50 compras de PC.

IBM HP Acer Dell Toshiba IBM IBM HP Dell IBMHP IBM HP IBM IBM IBM HP IBM IBM DellDell IBM Dell Acer HP Toshiba IBM Toshiba IBM IBMHP Dell IBM IBM IBM Dell Acer IBM HP DellDell Dell IBM Acer Dell Toshiba Toshiba Acer Dell Dell

Construya la tabla de distribución de frecuencias y los gráficos correspondientes. Efectúe el análisis de los resultados obtenidos.6. Desarrolle en EXCEL el siguiente problema. CASO DIÁMETROS DE TUBOS DE CEMENTO. Con el objetivo de controlar la calidad en un

proceso de fabricación de tubos de cemento, se seleccionó una muestra de 100 de tales tubos y se les midió su diámetro, obteniéndose los valores que se registran en la siguiente tabla. Construya la tabla de distribución de frecuencias y los gráficos correspondientes. Efectúe el análisis de los resultados obtenidos.

Datos originales 9,80 10,49 9,40 10,52 9,42 10,31 9,50 10,57 9,58 10,34 11,05 9,75 9,73 10,82 9,73 10,74 10,72 9,68 10,62 9,659,22 10,26 9,86 10,29 9,91 10,54 9,93 10,11 9,96 10,57 10,46 10,06 10,03 10,41 10,03 10,39 10,36 10,01 10,36 9,98

10,06 10,06 10,08 10,08 10,08 10,08 10,08 10,34 10,11 10,13 10,26 10,24 10,24 10,21 10,21 10,21 10,19 10,16 10,16 10,1310,26 9,83 10,29 9,88 10,29 9,91 10,31 9,93 10,34 9,98 10,06 10,44 10,44 10,03 10,39 10,03 10,01 10,36 10,01 10,3410,46 9,37 10,52 9,42 10,54 9,47 10,57 9,55 10,57 9,63 9,78 10,90 10,87 9,73 10,77 9,70 9,70 10,67 9,68 10,59

a. Construya una tabla de frecuencias: adecuada para estos datos; Agrupando en 5 clases de longitud 10; utilizando las fórmulas para datos agrupados, compare y comente los resultados obtenidos.

b. Grafique : El histograma, El polígono de frecuencias respectivas, la ojiva de frecuenciasc. Compare, analice, interprete y comente el resultado en el contexto de lo que representan los datos.

d. ¿Cuál es el valor modal y cómo se interpreta desde el punto de vista de los datos?e. ¿Cuál es el valor mediano y cómo se interpreta desde el punto de vista de los datos?f. ¿Cuántos tubos tienen al menos 10,77 centímetros de diámetro?g. ¿Qué porcentaje de tubos tienen como diámetro 10,82 centímetros o menos?h. ¿Qué cantidad de tubos es tal que al menos el 50% de la muestra tiene una cantidad inferior o igual?i. ¿Qué porcentaje de tubos tienen como diámetro 10,87 centímetros o menos? j. ¿Qué valor tiene y cómo se interpreta el cuartil 3 para estos datos?k. ¿ Qué valor tiene y cómo se interpreta el cuartil 1 para estos datos?l. ¿ Qué valor tiene y cómo se interpreta la mediana para estos datos?m. ¿Qué valor tienen la media aritmética y la desviación estándar?. De una interpretación concreta de estos valores, desde el punto de vista del

significado de los datos del problema.n. Determine el rango intercuartílico y explique su significado desde el punto de vista de los datos del problema.o. Estudie la simetría de la distribución.p. Estudie la curtosis de la distribución.

7. Se determinó la cantidad de partículas contaminantes en una oblea de silicio antes de cierto proceso de lavado, en una muestra de tamaño 100, y se obtuvieron las siguientes frecuencias:Nº de part 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14Frecuencia 1 2 3 12 11 15 18 10 12 4 5 3 1 2 1

a. Obtenga la media del número de partículas contaminantes; Obtenga la mediana del número de partículas contaminantesb. Obtenga S del número de partículas contaminantes

8. Dada la siguiente distribución de frecuencias de la duración, en horas, de una pieza de una determinada máquina retroexcavadora:Tabla 1.1 Distribución de frecuencias de la duración, en horas, de una pieza de una determinada máquina retroexcavadora.

Número de clase Duración en horas Frecuencias absolutas123456789

300 - 399400 - 499500 - 599600 - 699 700 - 799800 - 899900 - 999

1000 -10991100 - 1199

14465876686248226

Determine:a) El valor modal y su significado b) El valor mediano y su significadoc) ¿Cuántas horas duran a lo menos el 45% de las piezas?d) ¿Qué porcentaje dura más de 600 horas, pero menos de 1000 horas?.

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

17

Page 18: UNIVERSIDAD AUSTRAL DE CHILE - Enfermería ... · Web viewEs una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos

Unidad 1. Estadística descriptiva____________________________________________________________________________________________________________________________

e) La media aritmética y la desviación estándar. De una interpretación concreta de estos valores, desde el punto de vista del significado de los datos del problema.

f) Determine el segundo cuartil, y explique su significado desde el punto de vista de los datos del problema.g) Determine el percentil 45, y explique su significado desde el punto de vista de los datos del problema.h) Determine el cuarto quintil, y explique su significado desde el punto de vista de los datos del problema.i) Determine el rango intercuartílico y explique su significado desde el punto de vista de los datos del problema.j) Estudie la simetría de la distribución.k) ¿Cómo compara el resultado obtenido en h) con los valores de la media aritmética, la mediana y la moda?.l) Estudie la curtosis de la distribución.

9. Antes de construirse la represa en el Río Rapel, el cuerpo de ingenieros realizó una serie de pruebas, para medir el flujo de agua que pasa por el lugar de la represa, los resultados se muestran a continuación:

Flujo de agua (miles de litros por minuto)

Frecuencia

[1000-1050] 7]1050-1100] 21]1100-1150] 32]1150-1200] 49]1200-1250] 58]1250-1300] 41]1300-1350] 27]1350-1400] 11Total 246

a) Determine el flujo de agua promediob) Determine si las muestras tienen un flujo homogéneo.c) Construya una ojiva (Fi) y responda, ¿qué fracción del flujo presentó menos de 1300 miles de litros por minuto.d) Hasta que flujo alcanza el 45% de las muestras. Use Ojiva.

10. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomadas de un articulo en Technometrics, revista dedicada a las aplicaciones estadísticas en ciencias físicas e ingeniería. Trace un diagrama de tallo y hojas para estos datos. ¿Por qué es relativamente fácil identificar un valor representativo de octanaje? ¿Revela el diagrama algunas propiedades importantes de los datos?.Obtenga un histograma con 7 intervalos de igual amplitud, obtenga el gráfico de caja de éstos datos y estudie los valores atípicos y la dispersión de los datos en cada cuartil. Realice un análisis exploratorio con estos datos.

88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,395,6 93,3 94,7 91,1 91,0 94,2 87,8 89,988,3 87,6 84,3 86,7 88,2 90,8 88,3 98,894,2 92,7 93,2 91,0 90,3 93,4 88,5 90,189,2 88,3 85,3 87,9 88,6 90,9 89,0 96,193,3 91,8 92,3 90,4 90,1 93,0 88,7 89,989,8 89,6 87,4 88,9 91,2 89,3 94,4 92,791,8 91,6 90,4 91,1 92,6 89,8 90,6 91,190,4 89,3 89,7 90,3 91,6 90,5 93,7 92,792,2 92,2 91,2 91,0 92,2 90,0 90,7

11. El conjunto de datos adjunto está formado con observaciones del gasto de agua en la ducha (l/min) para una muestra de n =129 casas en Perth, Australia.

4,6 12,3 7,1 7,0 4,0 6,7 9,2 6,9 11,5 5,111,2 10,5 14,3 8,0 8,8 5,1 6,4 5,6 9,6 7,57,5 6,2 5,8 2,3 3,4 9,8 10,4 6,6 3,7 6,48,3 6,5 7,6 9,3 9,2 5,0 7,3 6,3 13,8 6,25,4 4,8 7,5 6,0 6,9 7,5 10,8 6,6 5,0 3,37,6 3,9 11,9 2,2 15,0 6,1 7,2 15,3 18,9 7,25,4 5,5 4,3 9,0 12,7 7,4 11,3 5,0 3,5 8,28,4 7,3 10,3 11,9 6,0 9,5 5,6 9,3 10,4 9,75,1 6,7 10,2 6,2 8,4 4,8 7,0 5,6 10,5 14,610,8 15,5 7,5 6,4 3,4 6,6 5,5 5,9 15,0 9,67,8 7,0 6,9 4,1 3,6 11,9 3,7 5,7 6,8 11,39,3 9,6 10,4 9,3 6,9 9,8 9,1 10,6 4,5 6,28,3 3,2 4,9 5,0 6,0 8,2 6,3 3,8 6,0

a) Construya un diagrama de tallo y hojas con los datos,b) ¿Cuál sería un valor de un gasto de agua común representativo?c) ¿Le parece que la gráfica está muy concentrada o extendida?d) ¿Parece que la distribución de valores es razonablemente simétrica?, Si no es así ¿Cómo describiría la desviación a partir de la simetría?,e) ¿Encuentra alguna observación alejada del resto de los datos?

BAIN 052. Báez, A., Figueroa, V., Parra, S., Rojas, O., Vergara, G. Profesores Intitulo de Estadística- UACh________________________________________________________________________________________________________________________________

18