Upload
elfer-ruiz-h
View
232
Download
7
Embed Size (px)
DESCRIPTION
estatica
Citation preview
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 1/146
Estadística General 2013
1 Mg. Miguel Angel Macetas Hernández
19 17 16 14 12 11
2 0
1 5
1 0
5
0
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 2/146
Estadística General 2013
2 Mg. Miguel Angel Macetas Hernández
ÍNDICE
I. CAPITULO ¿Qué es la Estadística? ................................................................................................. 4
1.1 Introducción ................................................................................................................................... 4
1.2 ¿Qué se entiende por estadística? .......................................................................................... 4
1.3 ¿Por qué hay que estudiar Estadística? ................................................................................ 5
1.4 Tipos de estadística ..................................................................................................................... 7
1.5 Elementos que caracterizan a los problemas estadísticos ............................................... 8
1.6 Definiciones básicas .................................................................................................................... 8
1.7 Clasificación de las Variables ................................................................................................. 10
A. Según la Naturaleza de la Variable .................................................................................... 10
B. Según la Escala de Medición ............................................................................................... 11
ESCALAS DE MEDICIÓN ................................................................................................................... 21
C. Según la Relación Entre Variables ..................................................................................... 22
II. CAPITULO Presentación de Datos ........................................................................................... 24
2.1. Clasificación y cómputo de datos uni. y bivariables:. ...................................................... 24
A. Codificación y tabulación ..................................................................................................... 24
B. Presentación tabular de los Datos: cuadros de distribución de frecuencias ........ 24
C. Cuadros estadísticos ............................................................................................................. 24
D. Partes Principales de un Cuadro Estadístico ................................................................. 25
2.2. Cuadros de Frecuencias de Variables Discretas ............................................................... 30
A. DISTRIBUCIÓN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: .................. 36
B. REPRESENTACIÓN GRAFICA DE LA VARIABLE CUALITATIVAS: .......................... 37
D. REPRESENTACIÓN GRAFICA DE LA CUANTITATIVAS DISCRETAS: ......................... 43
2.3. Cuadros de Frecuencias de Variables Continuas .......................................................... 46
E. DISTRIBUCIÓN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: ......................... 55
F. REPRESENTACIÓN GRAFICA DE LA CUANTITATIVAS CONTINUA: ................................................. 60
Gráficos Estadísticos ............................................................................................................................ 72
Clasificación De Los Gráficos ............................................................................................................. 72
III. CAPITULO Medidas de Resumen .............................................................................................. 87
3.1 Medidas de resumen para variables cualitativas ................................................................ 87
3.2 Razón e Índice. Definición. Cálculo e interpretación ........................................................ 87
3.3 Medidas de resumen para variables cuantitativas. ........................................................... 99
3.3.1 Medidas de Posición Centrales (Tendencia Central) ................................................ 99
1. La Media Aritmética ...................................................................................................................... 99
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 3/146
Estadística General 2013
3 Mg. Miguel Angel Macetas Hernández
2. La Mediana (Me) ......................................................................................................................... 101
3. Moda (Mo) (Valor Modal o Promedio Típico) ......................................................................... 105
Características de las Medidas de Posición Centrales ................................................................. 107
4. Media Geométrica: G X , G ...................................................................................................... 114
5. Media Armónica: H X , H ......................................................................................................... 118
IV. CAPITULO Estadígrafos de Tendencia No central ............................................................. 121
4.1. Estadígrafos de Tendencia No central ................................................................................ 121
A. Los Cuartiles .......................................................................................................................... 121
B. Para elaborar un diagrama de caja y bigotes es necesario saber: ......................... 123
C. Deciles ..................................................................................................................................... 127
D. Percentiles o Centiles ......................................................................................................... 129
V. CAPITULO Medidas de Dispersión ............................................................................................. 132
5.1. Medidas de dispersión ............................................................................................................ 132
A. Recorrido o rango (R) ................................................................................................................ 132
B. Recorrido Semi Cuartil (Q) ........................................................................................................ 132
C. Varianza (s2) ........................................................................................................................... 132
D. Desviación Estándar o Típica (s) ......................................................................................... 134
E. Coeficiente de Variación (CV) ................................................................................................... 134
VI. CAPITULO Estadígrafos de Deformación ............................................................................. 135
Asimetría.- ................................................................................................................................................. 135
A. Relación Entre La Media, Mediana y Moda .................................................................... 135
B. Distribución Simétrica ......................................................................................................... 135
C. Importancia de la Asimetría.- ................................................................................................. 136
D. Coeficiente de Asimetría. ................................................................................................... 136
E. Kurtosis o Apuntamiento.- ..................................................................................................... 136
VII. CAPITULO Regresión y Correlación Lineal .......................................................................... 142
Regresión y Correlación Lineal ........................................................................................................ 142
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 4/146
Estadística General 2013
4 Mg. Miguel Angel Macetas Hernández
I. CAPITULO ¿Qué es la Estadística?
1.1 Introducción
La importancia de la estadística en la actualidad, no se pone en discusión. Casi
todos los programas profesionales universitarios incluyen en su currículo, al menos
un curso de estadística. En muchos países, inclusive en el Perú, la estadística forma
parte del currículo de la educación secundaria e inclusive se incluyen algunos
tópicos en la educación primaria.
La dinámica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetización en estadística.
1.2 ¿Qué se entiende por estadística?
Al revisar el texto, vemos que esta parte se encuentra desarrollada posteriormente a
las razones por las que se debe estudiar estadística, aquí lo hacemos primero, para
iniciar entendiendo lo que significa la Estadística.
Realice la lectura de este acápite e identifique las ideas principales al respecto. Le
sugiero que subraye las ideas principales que encuentre.
¿Está de acuerdo en que la idea central se relaciona con el tratamiento de
información numérica?
Lo invito ahora a que enuncie su propia definición sobre la estadística.
¿Le parece a usted que podríamos definir a la estadística como la ciencia que nos
proporciona los elementos de juicio necesarios para llegar a tomar decisiones
adecuadas?, si está de acuerdo reflexione sobre las razones que le llevan a estarlo;
si no lo está también reflexione sobre la definición adecuada y regrese al texto para
constatarlo.
De las diferentes formas de enunciar lo que significa la estadística, realice ahora un
cuadro sinóptico en la que se resuman las ideas claves que se observan en
cualquiera de las definiciones encontradas. Para ello lea detenidamente este acápite
que se encuentra en el texto básico y reflexione sobre los distintos ejemplos que sehan planteado allí.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 5/146
Estadística General 2013
5 Mg. Miguel Angel Macetas Hernández
1.3 ¿Por qué hay que estudiar Estadística?
Si se revisa un catálogo de información de la universidad, se descubrirá que la
educación estadística se requiere en muchos Facultades. ¿Por qué pasa esto?.
¿Cuáles son las diferencias en los cursos de Estadística impartidos en una
Facultades de la Universidad. La mayor diferencia son los ejemplos utilizados.Básicamente, el contenido del curso es el mismo; Por ejemplo en una Escuela
Profesional de Administración interesan cosas como las ganancias, horas de trabajo,
y salarios. En un Departamento de Salud interesan los resultados de las pruebas, y
en una Facultad de Ingeniería pueden interesar cuántas unidades son producidas
por una máquina en especial. Sin embargo, las tres áreas tienen interés en lo que es
un valor típico y en la cantidad de variación existente en la información. Es posible
que también exista una diferencia en el nivel de matemáticas requerido. Un curso deEstadística en ingeniería generalmente requiere del Cálculo, los cursos de
Estadística en escuelas de administración y en la educación, generalmente enseñan
un curso orientado a aplicaciones. Entonces, ¿por qué se requiere estudiar
Estadística en tantas carreras?.
La primera razón es que en todos lados encontramos información numérica. Si se
revisan los periódicos, revistas de información, revistas de negocios, publicacionesde interés general, o revistas de deportes, uno estará bombardeado con información
numérica.
Presentamos aquí algunos ejemplos:
Ford reporta que en 2011 sus ventas fueron de $146900 millones (de dólares),
arriba en un 7,2%; sus ganancias fueron de $4400 millones, con ascenso en un7,0%, y el efectivo neto circulante fue de S/.7200 millones.
Los egresados de postgrado de la Universidad, contaron con un sueldo promedio
inicial de $400 dólares y un 70% de ellos consiguieron trabajo a los tres meses de
la graduación.
Para los futbolistas que gustan de jugar en campos deportivos, el alquiler de los
campos promediaban S/.500 nuevos soles por semana.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 6/146
Estadística General 2013
6 Mg. Miguel Angel Macetas Hernández
¿Cómo podemos determinar si las conclusiones presentadas son razonables?, ¿las
muestras fueron suficientemente grandes?, ¿cómo se seleccionaron las unidades de
la muestra? Para poder ser un consumidor con conocimientos sobre esta
información, necesitamos poder leer los cuadros, las gráficas y entender la discusión
de la información numérica. El entender los conceptos básicos de la Estadística será
de gran ayuda.
La segunda razón para tomar el curso de Estadística es que las técnicas estadís-
ticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere
decir que afectan a nuestro bienestar personal. He aquí algunos ejemplos:
Las compañías de seguros utilizan análisis estadísticos para establecer las tarifas
de los seguros de casa, automóvil, vida y salud. Existen tablas que resumen la
probabilidad de que una mujer de 25 años de edad viva el año siguiente, los si-
guientes cinco años, etc. Las primas del seguro de vida se pueden establecer
basándose en estas probabilidades.
La Agencia de Protección al Medio Ambiente está interesada en la calidad del
agua en el Lago Ene. Periódicamente toman muestras de agua para establecer el
nivel de contaminación y mantener el nivel de calidad.
Los investigadores médicos estudian las tasas de cura de enfermedades, basán-
dose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por
ejemplo, ¿cuál es el efecto de tratar cierto tipo de daño a la rodilla con cirugía o
con terapia física? Si se toma una aspirina diaria, ¿se reducirá el riesgo de sufrir un
ataque cardiaco?
La tercera razón para tomar el curso de Estadística es que el conocimiento de los
métodos estadísticos ayudará a entender por qué se toman ciertas decisiones, y le
aportarán una mejor comprensión sobre la manera en la que lo afectan.
Sin importar el tipo de trabajo que seleccione, encontrará que tiene que enfrentar la
toma de decisiones con la ayuda del análisis de datos. Para poder realizar una deci-
sión basada en la información, necesitará:
1. Determinar si la información existente es adecuada o si se requiere información
adicional.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 7/146
Estadística General 2013
7 Mg. Miguel Angel Macetas Hernández
2. Reunir información adicional, si es necesario, de tal forma que no hayan resultados
erróneos.
3. Resumir la información de una forma útil e informativa.
4. Analizar la información disponible.
5. Sacar las conclusiones y realizar las deducciones necesarias, al tiempo que se
evalúa el riesgo de llegar a una conclusión incorrecta.
1.4 Tipos de estadística
Por lo general, el estudio de la estadística se divide en dos categorías
Estadística Descriptiva: cuando se recolección, clasificación resumen,
procesamiento y representa un grupo de datos utilizando métodos numéricos y
gráficos que resumen y presentan la información contenida en ellos. No pretende
ir más allá del conjunto de datos investigados.
Estadística Inferencial: cuando apoyándose en el cálculo de probabilidades y a
partir de datos muestrales, efectúa estimaciones, decisiones, predicciones y
otras generalizaciones sobre un conjunto mayor de datos.
Figura N° 01
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 8/146
Estadística General 2013
8 Mg. Miguel Angel Macetas Hernández
1.5 Elementos que caracterizan a los problemas estadísticos
La población de interés y el procedimiento científico que se empleó para tomar la
muestra de la población.
La muestra y el análisis matemático de su información.
Las inferencias estadísticas que resultan del análisis de la muestra.
La probabilidad de que las inferencias sean correctas.
1.6 Definiciones básicas
Población o Universo (N) Está referido a un colectivo finito o infinito de elementos
individuales. Población es un conjunto completo de individuos u objetos que
poseen alguna característica común observable. Población es el número de
elementos que definen la cobertura de un estudio. La población es el universo de
estudio que está integrado por la totalidad de todas las unidades de análisis. Por
ejemplo
Alumnos de Ingeniería Civil matriculados en ciclo académico 2012 en la
Universidad.
Alumnos de IV ciclo de la Escuela Profesional de Ingeniería Civil de la
Universidad.
Ingenieros Civiles Colegiados en el departamento de Cajamarca en el año 2012.
Muestra (n) Es la parte o subconjunto de una población. La muestra está
constituida de elementos seleccionados de una manera deliberada, con el objeto
de investigar las propiedades de su población. La muestra sólo da información de
aquella población de la que ha sido extraída.
Figura N° 02
POBLACIÓN (N) MUESTRA (n)
Muestreo
Inferencia
µ δ2
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 9/146
Estadística General 2013
9 Mg. Miguel Angel Macetas Hernández
Unidad de Análisis o Unidad de Observación Es el objeto o elemento indivisible
que será estudiado en una población sobre los cuales se va a obtener datos. La
unidad de análisis no es el fenómeno investigado sino el que genera el fenómeno y
proporciona datos concretos. Por ejemplo
El tipo de análisis al que se someterá la información es determinante para elegirla unidad de análisis. Por ejemplo, si el objetivo es dar cuenta de la satisfacción
del usuario de un servicio médico, la unidad de análisis natural es el paciente
atendido, o la persona que se atiende en ese servicio médico.
La unidad de muestreo corresponde a la entidad básica mediante la cual se
accederá a la unidad de análisis. En algunos casos, ambas se corresponden. Por
ejemplo:
Si se desea estimar la prevalencia de daño auditivo en relación con niveles de
ruido ambiental en una muestra de trabajadores de una fábrica, la unidad de
muestreo puede corresponder a la entidad "sujeto", si se dispone de un registro
detallado de cada sujeto. La unidad de análisis es por cierto el trabajador de la
fábrica.
Dato. Es el valor o respuesta que adquiere variable la en cada unidad de análisis.
Dato es el resultado de la observación, entrevista o recopilación en general. Los
datos son. materia prima de la Estadística.
Parámetro. Es una medida usada para describir algunas características de una
población, y para determinar su valor es necesario utilizar la información de la
población completa y por lo tanto, las decisiones se tomaran con certidumbre total.
Por ejemplo:Media poblacional (µ), Varianza poblacional (δ2), Proporción poblacional (p).
Estadígrafo. Es una medida usada para describir alguna característica de la
muestra y la toma de decisiones contiene un grado de incertidumbre. Por ejemplo:
Media muestral (), Varianza muestral (), Proporción muestral ( )
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 10/146
Estadística General 2013
10 Mg. Miguel Angel Macetas Hernández
Variable: Es una característica que puede tomar diferentes valores o atributos. Las
variables son características observables , susceptibles de adoptar distintos
valores (cuant i f icado ) o ser expresados en varias categorías
1.7 Clasificación de las Variables
Podemos considerar muchos criterios de clasificación como:
A. Según la Naturaleza de la Variable
a) Variables Cualitativas o Estadísticas de Atributos.
Cuando expresan una cualidad, característica o atributo, tienen carácter cualitativo
sus datos se expresan mediante una palabra es no numérico. Por ejemplo:
Estado civil, los colores, lugar de nacimiento, profesiones, actividad económica,
causas de accidentes, etc.
b) Variables Cuantitativas.
Cuando el valor de la variable se expresa por una cantidad, es de, carácter
numérico. El dato o valor puede resultar de la operación de contar o de medir. Por
ejemplo:
Edad número de hijos por familia, ingresos, viviendas por centro poblado, niveles
de, desempleo, producción, utilidades por empresas, etc.,
Variable Valores o atributo Rendimiento académico
Genero
Calidad de atención de un
restaurante
Peso de alumnos
Número de hijos
12, 14, 17, 20
Masculino, femenino
Pésimo, malo, regular bueno excelente
45,6 Kg. 57,8 Kg. 73,6 Kg
1, 2, 3,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 11/146
Estadística General 2013
11 Mg. Miguel Angel Macetas Hernández
Las variables cuantitativas pueden ser: discreta y continua.
b.1. Variable Discreta.
Cuando el valor de la variable resulta de la operación de contar su valor está
representado sólo por números naturales (enteros positivos). Por Ejemplos:
Hijos por familia número de accidentes por día, trabajadores por empresa;
población por distritos, habitaciones por vivienda. etc.
b.2. Variable Continúa.Cuando la variable es susceptible de medirse es toda variable cuyo valor se
obtiene por medición o comparación con una unidad o patrón de medida. Las
variables continuas pueden tener cualquier valor dentro de su rango o recorridopor tanto se expresa por cualquier número real. Por ejemplos:
Ingresos monetarios, producción de maíz, peso, estatura, tiempo de
servicios, horas trabajadas, niveles de empleo. etc.
B. Según la Escala de Medición
a) La escala nominal o categóricaLa medición en su nivel más débil existe cuando los números u otros símbolos se
usan simplemente para clasificar un objeto, una persona o una característica.
Cuando se emplean números u otros símbolos para identificar los grupos a los
cuales pertenecen varios objetos, estos números o símbolos constituyen una
escala nominal o categórica. Esta escala se conoce como escala clasificatoria.
Por ejemplo:
Se resumen en preguntas dicotómicas, o aquellas con dos opciones de
respuesta, y de selección múltiple, o aquellas con tres o más opciones de
respuesta. Veamos algunos ejemplos:
Dicotómicas Género: Femenino Masculino
Has comprado el producto X? SI NO
Selección múltiple En tus próximas compras incluirás el producto X?
SI NO No sabe
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 12/146
Estadística General 2013
12 Mg. Miguel Angel Macetas Hernández
Propiedades Formales
Todas las escalas tienen ciertas propiedades formales, las cuales proporcionan
definiciones casi exactas de las características de la escala; definiciones más
exactas que las que pueden darse en términos verbales. Estas propiedades
pueden ser formuladas de manera más abstracta de lo que hemos hecho aquí,
por un conjunto de axiomas que especifican las operaciones de la escala y las
relaciones entre los objetos que han sido escalados.
En una escala nominal, las operaciones de la escala dividen a una clase dada en
un conjunto de subclases mutuamente excluyentes. La única relación implica- da
es la de equivalencia; esto es, los miembros de cualquier subclase deben ser
equivalentes en la propiedad que está siendo escalada. Esta relación se simboliza
por el signo familiar de "igual" (=). La relación de equivalencia es reflexiva,
simétrica y transitiva.
Considérese un conjunto de objetos . . Supóngase que el objeto x,
tiene algún atributo verdadero, A (x). Entonces, para cualquier par de atributos en
el conjunto
()
()
()
Operaciones AdmisiblesYa que en una escala nominal la clasificación puede estar igualmente bien
representada por cualquier conjunto de símbolos, se dice que la escala nominal
es "única hasta una transformación de uno a uno". Los símbolos que designan las
variadas subclases en la escala pueden ser intercambiados si esto se hace de
manera cabal y consistentemente. Por ejemplo:
Cuando se emiten nuevas placas para automóviles, el código que previamente
pertenecía a una ciudad puede ser intercambiado con el de otra ciudad. La
escala nominal podría preservarse si este cambio se ejecutara cabal y
consistentemente en la emisión de todas las placas.
Ya que los símbolos que designan los variados grupos de una escala nominal
pueden ser intercambiados sin alterar la información esencial en la escala, el
único tipo de estadísticos descriptivos admisibles son aquellos que pueden ser
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 13/146
Estadística General 2013
13 Mg. Miguel Angel Macetas Hernández
incambiables por tal transformación: la moda, la cuenta de frecuencias, etc. En
ciertas condiciones, podemos probar hipótesis considerando la distribución de
casos entre las categorías, usando pruebas no paramétricas tales como la ji
cuadrada o una prueba basada en la distribución binomial. Estas pruebas son
adecuadas para da- tos escalados nominalmente debido a que se enfocan sobre
la frecuencia en las categorías, es decir, sobre datos enumerativos. En suma,
cuando los datos en una escala nominal, podemos rotular las categorías "1", "2",
"3",….., en cualquier orden que el Vamos. En una muestra podemos contar el
número de "1", el número de "2", etc. (Estas son cuentas de frecuencia) Podemos
calcular el porcentaje de "1" en la muestra, el porcentaje de "2", etc. (Esta es la
distribución de frecuencia relativa.) Y podemos registrar qué categoría tiene la
frecuencia más grande. (Ésta es la moda.) Pero en general, no podemos "sumar"
las categorías "1" y "2" para formar la categoría "3", ya que podríamos violar las
suposiciones de un sistema de clasificación nominal. En capítulos posteriores
estudiaremos diferentes técnicas estadísticas adecuadas para datos categóricos o
escalados nominalmente.
b) La escala ordinal o de rangos
Puede suceder que los objetos en una categoría de una escala no sean tan sólo
diferentes de los objetos en otras categorías de esa escala, sino que también
exista algún tipo de relación entre ellos. Las relaciones típicas entre las clases
son: más alto, más preferido, más difícil, más perturbador, más maduro, etc. Tales
relaciones se denotan por medio del símbolo >, el cual en general significa "mayor
que". En referencia a escalas particulares, > puede ser usado para designar que
es preferido a, es más alto que, es más difícil que, etc. Su significado específico
depende de la naturaleza de la relación que define la escala.
Dado un grupo de clases de equivalencia (esto es, dado una escala nominal), si larelación > se sostiene entre algunos pero no todos los pares de clases, tenemos
una escala parcialmente ordenada. Si la relación > se sostiene para todos los
pares de clases, de manera que es posible un rango completo ordenado de
clases, tenemos una escala ordinal. Por ejemplo:
Grado de Instrucción: Primaria – Secundaria – Superior
Intensidad del dolor: Leve – Moderado – Intenso
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 14/146
Estadística General 2013
14 Mg. Miguel Angel Macetas Hernández
Propiedades Formales Axiomáticamente, la diferencia fundamental entre una escala nominal y una
ordinal es que esta última incorpora no sólo la relación de equivalencia (=), sino
también la relación "mayor que" (>). Esta última relación es irreflexiva, asimétrica
y transitiva.
Considérese un conjunto de objetos . Supóngase que existe alguna
relación en el atributo verdadero entre los objetos de cada categoría, además de
la equivalencia dentro de las categorías. Esto es,
()
()
()
()
Es decir, la función de clasificación ordena los objetos en el mismo modo en que
de hecho están ordenados los atributos.
Operaciones Admisibles
Ya que cualquier transformación que preserve el orden no cambia la información
contenida en la escala ordinal, se dice que la escala es "única hasta una trans-
formación monotónica". Una transformación monotónica es aquella que preserva
el orden de los objetos. Esto es, no importa qué números demos a un par de
clases o a los miembros de esas clases, siempre que les sea asignado un número
mayor a los miembros de la clase que es "mayor que" o "más preferida".
(Naturalmente, se pueden usar números menores para las clases "más
preferidas". Así nos referimos generalmente a una ejecución excelente como"primera clase", y a ejecuciones progresivamente inferiores como "segunda clase"
y "tercera clase". Siempre que seamos consistentes, no importa si se usan
números mayores o menores para denotar "mayor que" o "más preferido".) Por
ejemplo:
En el ejército un cabo usa dos bandas en su manga y un sargento usa tres.
Estas insignias denotan que el sargento > el cabo, y el símbolo > denota "mayor
rango que". Esta relación podría ser igualmente bien expresada si el cabo usaracuatro bandas y el sargento siete.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 15/146
Estadística General 2013
15 Mg. Miguel Angel Macetas Hernández
Vale decir, una transformación que no cambia el orden de las clases es
completamente admisible ya que no implica pérdida alguna de información.
Cualesquiera o todos los números que se aplican a las clases en una escala
ordinal pueden ser cambiados de cualquier forma que no altere el orden (rango)
de los objetos. Puede aplicarse cualquier transformación montónica y aún
preservarse las propiedades de la escala, esto es, preservar la relación entre los
objetos.
El estadístico más, apropiado para describir la tendencia central de las
puntuaciones en una escala ordinal es la mediana, ya que en relación con la
distribución de puntuaciones, la mediana no es afectada por los cambios en
cualesquiera de las puntuaciones que están por arriba o por abajo de ella,
siempre que el número de puntuaciones por arriba y por debajo permanezca
constante. Con el escalamiento ordinal, las hipótesis pueden ser probadas usando
el gran grupo de pruebas estadísticas no paramétricas que en ocasiones se
llaman estadísticos de rango o estadísticos de orden.
c) La escala de Intervalo
Cuando una escala tiene todas las características de una escala ordinal y cuando
además tienen sentido las distancias o diferencias entre cualesquiera dos
números de la escala, se ha logrado una medición considerablemente más fuerte
que la ordinal. En tal caso, la medición ha sido lograda en el sentido de una
escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan
preciso que conocemos cuán grandes son los intervalos (distancias) entre todos
los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces
hemos logrado una medida de intervalo. Una escala de intervalo está
caracterizada por una unidad común y constante de medida que asigna un
número a todos los pares de objetos en el orden establecido. En esta clase demedición, la razón de cualesquiera dos intervalos es independiente de la unidad
de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de
medida son arbitrarios. Por ejemplo
Medimos la temperatura en una escala de intervalo. De hecho, comúnmente se
usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la
unidad de medida y el punto cero son arbitrarios; son diferentes en ambas
escalas. Sin embargo, las dos escalas contienen la misma cantidad y la mismaclase de información. Esto es así debido a que están linealmente relacionadas.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 16/146
Estadística General 2013
16 Mg. Miguel Angel Macetas Hernández
Es decir, una lectura en una escala puede ser transformada en la lectura
equivalente de la otra por medio de una transformación lineal.
Donde
°F = número de grados en la escala Fahrenheit
°C = número de grados en la escala Celsius
Se puede mostrar que las razones de las diferencias de temperatura (intervalos)
son independientes de la unidad de medida y del punto cero. Por ejemplo, el
punto de "congelación" ocurre en 0° en la escala Celsius, y el punto de "ebulli-
ción" ocurre en los 100°. En la escala Fahrenheit, la "congelación" ocurre en los
32° y la "ebullición" en 212°. Algunas otras lecturas de la misma temperatura en
las dos escalas son las siguientes:
Celsius — 18 0 10 30 100
Fahrenheit 0 32 50 86 212
Nótese que la razón de las diferencias entre las lecturas de temperatura en una
escala, es igual a la razón entre las diferencias equivalentes en la otra escala. Por
ejemplo,
En la escala Celsius la razón de las diferencias entre 30 y 10, y 10 y 0 es (30 —
10) / (10 — 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la
razón es (86 — 50) / (50 — 32) = 2. En ambos casos las razones son las
mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razón de
cualesquiera dos intervalos es independiente de la unidad usada y del punto
cero, siendo ambos arbitrarios.
Muchos científicos de la conducta aspiran a crear escalas de intervalo, y en pocas
ocasiones tienen éxito. Sin embargo, generalmente lo que es tomado como éxito
son suposiciones no probadas que el constructor de la escala voluntariamente
cree. Una suposición frecuente es que la variable que está siendo escalada está
normalmente distribuida entre los individuos a los que se evalúa con base en esta
suposición, el constructor de la escala manipula las unidades de la escala hasta
que se encuentre la supuesta distribución normal de las puntuaciones de los
individuos. Naturalmente, el procedimiento es sólo tan bueno como la intuición del
investigador al elegir la distribución que supone.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 17/146
Estadística General 2013
17 Mg. Miguel Angel Macetas Hernández
Otra suposición que se hace a menudo para crear una escala de intervalo aparen-
te es la suposición de que las respuestas "afirmativas" de las personas en
cualquier reactivo son exactamente equivalentes a responder de manera
afirmativa en cualquier otro reactivo. Esta suposición se hace para satisfacer el
requisito de que una escala de intervalo debe tener una unidad de medida común
y constante. En escalas de habilidades o de aptitudes, la suposición de
equivalencia consiste en que dar la respuesta correcta a cualquier reactivo es
exactamente equivalente (en la cantidad de habilidad mostrada) a dar la
respuesta correcta a cualquier otro reactivo.
Propiedades Formales Axiomáticamente, se puede mostrar que las operaciones y relaciones que dan
origen a la estructura de una escala de intervalo son tales que las diferencias enla escala son isomórficas a la estructura de la aritmética. Los números pueden ser
asociados con las posiciones de los objetos en una escala de intervalo tal que las
operaciones de la aritmética pueden ser significativamente ejecutadas con las
diferencias entre los números.
Al construir una escala de intervalo no sólo se deben especificar equivalencias,
como en la escala nominal, y relaciones "mayor que", como en la escala ordinal,
sino también se debe ser capaz de especificar la razón entre dos intervaloscualesquiera.
Considérese un conjunto de objetos Supóngase que los atributos
verdaderos de los objetos existen en alguna relación unos con otros, además de
sus equivalencias dentro de las categorías. Esto es:
()
()
Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x)
que tienen las propiedades de una escala ordinal y, además
Nótese que en este caso, la diferencia entre los atributos de los dos objetos es
proporcional a la diferencia entre las asignaciones de clasificación:
()
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 18/146
Estadística General 2013
18 Mg. Miguel Angel Macetas Hernández
Operaciones Admisibles
Cualquier cambio en los números asociados con las posiciones de los objetos
medidos en una escala de intervalo debe preservar no sólo el orden de los
objetos, sino también las diferencias relativas entre los objetos. Esto es, la escala
de intervalo es "única hasta una transformación lineal". Así, como hemosseñalado, la información proporcionada por la escala no es afectada si cada
número se multiplica por una constante positiva y después se le suma a este
producto una constante, esto es . (En el ejemplo de la
temperatura, c = 9/5 y b = 32.)
Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto
es inherente al hecho de que la escala está sujeta a transformaciones queconsisten en agregar una constante a los números que constituyen la escala.
La escala de intervalo es la primera escala verdaderamente "cuantitativa" que
hemos encontrado. Todos los estadísticos paramétricos comunes (medias,
desviaciones estándar, correlaciones producto-momento, etc.) son aplicables a
los datos en una escala de intervalo. Si de hecho se ha logrado una medida en
una escala de intervalo y si se han encontrado adecuadamente todas lassuposiciones del modelo estadístico paramétrico (dadas en la sección "El modelo
estadístico"), entonces el investigador puede utilizar pruebas estadísticas
paramétricas tales como la prueba t o la prueba F. En tal caso, los métodos no
paramétricos no aprovechan toda la información contenida en los datos de
investigación. Puede notarse que una escala de intervalo es una condición
necesaria, pero no suficiente, para usar una prueba estadística paramétrica que
incluya la distribución normal.
d) La escala de razón
Cuando una escala tiene todas las características de una escala de intervalo y,
además, tiene un punto cero verdadero en su origen, se llama escala de razón.
En una escala de razón, la razón de cualesquiera dos puntos es independiente de
la unidad de medida. Por ejemplo
Medimos la masa o el peso en una escala de razón. La escala de onzas y libras
tiene un punto cero verdadero, al igual que la escala de gramos. La razón entre
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 19/146
Estadística General 2013
19 Mg. Miguel Angel Macetas Hernández
cualesquiera dos pesos es independiente de la unidad de medida. Por ejemplo,
si de- terminamos los pesos de dos objetos diferentes no sólo en libras sino
también en gramos, encontraremos que la razón de los dos pesos en libras es
idéntica a la razón de los dos pesos en gramos.
Aunque es difícil identificar ejemplos significativos en las ciencias sociales y de la
conducta, los contraejemplos abundan. Consideramos dos. Notamos
anteriormente que las calificaciones se miden en una escala ordinal. Considérese
a dos estudiantes, uno de los cuales recibe una A y el otro una C; y supóngase
que las asignaciones numéricas fueron 4 y 2, respectivamente. Aunque la razón
de las dos calificaciones es dos (4/2 = 2), no tiene sentido decir que el estudiante
con una A posee el doble de "algo" del estudiante que recibe la C. (El estudiante
puede obtener el doble de ciertos puntos, pero no es claro si esto tiene algún
significado sustantivo en conocimiento, habilidad o perseverancia.) Finalmente, en
el caso de la temperatura, considérese un cambio en la temperatura de 100 a 30
°C. No podemos decir que el incremento representa que el calor se incrementó al
triple. Para ver esto, nótese que el cambio en la temperatura es equivalente a un
cambio de 500 a 86 °F. Debido a que las razones de las temperaturas en las dos
escalas son claramente diferentes, la razón no tiene sentido interpretable alguno.
Propiedades Formales
Las operaciones y relaciones que dan origen a los valores numéricos en una
escala de razón son tales que la escala es isomórfica a la estructura de la
aritmética. Por tanto, las operaciones de la aritmética son permisibles con los
valores numéricos asignados a los objetos, así como a los intervalos entre los
números, como en el caso de la escala de intervalo.
Las escalas de razón, que se encuentran más comúnmente en las ciencias
físicas, se logran sólo cuando son operacionalmente posibles de alcanzar todas
las siguientes cuatro relaciones: 1. equivalencia; 2. mayor que; 3. razón conocida
entre cualesquiera dos intervalos, y 4. razón conocida entre cualesquiera dos
valores de la escala.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 20/146
Estadística General 2013
20 Mg. Miguel Angel Macetas Hernández
Considérese un conjunto de objetos . Supóngase que el atributo
verdadero de los objetos existe con alguna relación entre cada uno de ellos,
además de la equivalencia dentro de las categorías. Esto es
()
()
()
Entonces, una escala de razón es un sistema clasificatorio de los objetos L (x) si
()
()
y la razón de las clasificaciones asignadas es igual a la razón de los atributos
verdaderos.
Operaciones Admisibles
Los números asociados con los valores de la escala de razón son números "ver-
daderos" con un cero verdadero: sólo la unidad de medida es arbitraria. Así, la es-
cala de razón es única hasta la multiplicación por una constante positiva. Esto es,
las razones entre cualesquiera dos números se preservan cuando los valores de
la escala son todos multiplicados por una constante positiva y, además, tal
transformación no altera la información contenida en la escala.
Cualquier prueba estadística paramétrica puede usarse cuando se han logrado
medidas de razón y se encuentran las suposiciones adicionales concernientes a
la distribución. Más aún, existen algunos estadísticos que se aplican sólo a datos
que descansan en una escala de razón; debido a la fuerza de las suposiciones
que sub- yacen a la escala, la mayoría de estas pruebas son pararnétricas.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 21/146
Estadística General 2013
21 Mg. Miguel Angel Macetas Hernández
ESCALAS DE MEDICIÓN
Tipo Variables Categóricas Variables numéricas
Naturaleza CUALITATIVAS CUANTITATIVAS
Escala(0) NOMINAL Ningún
atributo(1) ORDINAL Un atributo (2) INTERVALO Dos atributos (3) RAZÓN Tres atributos
Atributos de laescala
Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen
Característica
Posee categorías a lasque se asigna un nombresin que exista ningúnorden implícito entreellas.
Posee categoríasordenadas, pero nopermite cuantificar ladistancia entre unacategoría y otra.
Tiene intervalos iguales ymedibles, pero no tiene unorigen real. Puede asumirvalores negativos.
Tiene intervalosconstantes entre valores;además de un origen real.El cero significa laausencia de la variable.
Ejemplos Género Estado Civil Instrucción Intensidad Temperatura Hora del día Peso. Hijos
Valor FinalMasculino
Femenino
Soltero
Casado
Conviviente
Primaria
Secundaria
Superior
Leve
Moderado
Severo
-10 C
0 C
20 C
00 Horas
10 Horas
20 Horas
00.00 Kg
10.24 Kg
20.00 Kg
Uno
Dos
Tres
Observaciones
Dicotómicas: Tienen solamente dos categorías Ejemplosde Ordinal Dicotómica: Nuevo - Continuador
Vivo – Fallecido
Sano – Enfermo
Politómicas: Tienen más de dos categorías.
Continuas: Provienen de medirSe pueden representar con números enteros o fraccionarios
Entre dos valores siempre existe un número intermedio
Discretas: Provienen de contar
Solamente pueden ser representados con números enteros
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 22/146
Estadística General 2013
22 Mg. Miguel Angel Macetas Hernández
C. Según la Relación Entre Variables
a) Variables Dependientes
Son aquellas que se explican por otras variables, son los efectos o resultados
respecto a los cuales hay que buscar su motivo, causas o razón de ser, Es lavariable que traduce la consecuencia del efecto de una varias razones o causas.
b) Variables Independientes
Son las variables explicativas o predicativas, cuya asociación, relación o
influencia en la variable dependiente se pretende escribir en la investigación. Las
variables independientes son los que traducen o explican las causas o razones
de las variaciones en la variable dependiente. Simplificando, en la relación de
variables, las causas o antecedentes serían las variables independientes (VI) y la
causa o consecuente es la variable dependiente (VD). Ejemplos: En el caso más
simple, para la relación dé dos variables.
El presupuesto familiar (VD) depende de los ingresos (VI).
El volumen de ventas (VD) se explica por la inversión en propaganda (V).
El número de hijos por familia (VD) tiene relación con el nivel educativo de los
padres (VI).
c) Variables Intervinientes o interferentes
Son aquellas que coparticipan con la variable independiente condicionando el
comportamiento de la variable dependiente. En el caso de la relación entre
presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes
serian la conducta de consumo, la edad de los miembros de la familia, etc.
Elementos de una Variable
La identificación y definición de variables es la tarea más delicada de todainvestigación y del trabajo estadístico. En consecuencia, para tener éxito en la
selección de variables, es recomendable distinguir las siguientes cinco
características.
Un nombre o denominación. de la variable.
Alguna definición o conceptualización.
Un conjunto de categorías. que es definida por el investigador. Las
categorías no son únicas.
Procedimientos para categorías las unidades de análisis.
Algunas medidas de resumen o indicadores.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 23/146
Estadística General 2013
23 Mg. Miguel Angel Macetas Hernández
Ejemplo 1:a) Nombre : Estado civil o conyugal.
b) Definición: Es la situación de la persona empadronada en relación con las leyes
y costumbres del país.
c) Categorías:
01) Sol tero (a).
02) Casado (a).
03) Conviviente.
04) Viudo (a).
05) Divorciado (a).
06) Separado (a).d) Categorización: ¿Cuál es su estado civil o conyugal?
e) Medidas de Porcentajes
Resumen – Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.
Ejemplo 2:
a) Nombre : Ingresosb) Definición Son los recursos monetarios netos incluyendo todas las
Bonificaciones que percibe una persona por su ocupación principal y secundaria
durante el período de referencia de la encuesta.
c) Categorías : Puede proponerse en forma de niveles o simplemente intervalos.
Niveles de ingreso: alto, medio, bajo
Intervalos: Por ejemplo 8 intervalos
Menos de 4000; 4001 él 8000; 8001 a 12000; 1 2001 a 1 6000; 16001 a 20000:20001 a 25000; 25001 a 30000; 30001 y más soles.
d) Categorización: ¿Cuál fue su ingreso total en el último mes?
e) Indicadores : Ingreso promedio.
Dispersión de los ingresos. etc.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 24/146
Estadística General 2013
24 Mg. Miguel Angel Macetas Hernández
II. CAPITULO Presentación de Datos2.1. Clasificación y cómputo de datos uni. y bivariables:.
A. Codificación y tabulación
La codificación facilita la tabulación y el conteo. (obtención de una buena
información)
La codificación de las respuestas da lugar a categorías o modalidades.
Es recomendable que los cuestionarios tengan las alternativas de respuesta pre
codificadas.
Si el cuestionario tiene preguntas abiertas (respuesta libre), estas previamente
debe ser clasificadas en categorías.
B. Presentación tabular de los Datos: cuadros de distribución de frecuencias
Es necesario agrupar los datos y presentarlos en cuadros y diagramas sencillos.
Un cuadro de frecuencias, son cuadros que indican la distribución de un conjunto
de datos en clases o categorías y muestran el número de elementos y la
proporción de cada uno de los valores de la variable.
Un cuadro de frecuencias, permite una buena ayuda para formularse
interrogantes acerca de los datos.
Un cuadro de frecuencias, es un punto de partida en la búsqueda de un modelo
teórico para analizar la distribución de los datos. En la cuadro se observa la frecuencia o repetición de cada uno de los valores de
la variable.
Las observaciones o recopilaciones de datos denotaremos la variable por X y los
datos originales: . donde Xi representan la i – ésima observación de
la variable con (i = 1, 2, 3, 4,..., N). Es decir que:
X1 = dato de la primera observaciónX2 = dato de la segunda observaciónX3 = dato de la tercera observación………………………………………… …………………………………………. XN = dato de la N – ésima observación
C. Cuadros estadísticos
En una investigación, después que los datos han sido recogidos, revisados y
almacenados en una base de datos, se procede a la presentación de los
resultados en forma tabular o gráfica y al análisis estadístico de la información.
La facilidad de su construcción y el rápido efecto en la transmisión de loscontenidos, han hecho de los cuadros estadísticos los recursos idóneos para la
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 25/146
Estadística General 2013
25 Mg. Miguel Angel Macetas Hernández
presentación de los resultados de las investigaciones en todas las áreas
científicas.
“La presentación tabular y el gráfico no son competidores, sino más bien
elementos que se complementan. Los gráficos deben agregarse a los cuadros o
distribuciones de frecuencias para llamar la atención y despertar el interés por
los datos que se presentan, así como para reforzar las argumentaciones o
conclusiones a las que se haya llegado. Como un principio muy conveniente,
debe adoptarse el de que en ningún caso puede considerarse que el gráfico
sustituye a la presentación tabular. La práctica seguida por algunas personas, de
presentar gráficos omitiendo los cuadros que contienen la información básica,
debe ser evitada y combatida por inconveniente y por limitar la calidad y la
utilidad de las publicaciones y estudios. Sólo en casos de verdadera excepción,
como cuando se trata de propaganda o de artículos meramente divulgadores,
podría aceptarse la práctica comentada.”
Objetivo
Un cuadro estadístico tiene como objetivo presentar datos numéricos ordenados,
en filas y columnas, de acuerdo a ciertos criterios de clasificación.
Ventajas Los cuadros permiten presentar en forma resumida y ordenada muchos datos
Es un instrumento que clasifica, resume y comunica información estadística
Facilita el análisis de los datos
Su fácil comprensión, permite que sea utilizado por muchas personas
Todo cuadro estadístico debe explicarse por sí mismo, sin necesidad de texto o
figuras anexas, y debe ser sencillo y claro
D. Partes Principales de un Cuadro Estadístico
En general, un cuadro estadístico completo, tal como el Cuadro Nº 01, por ejemplo,
puede tener ocho partes:
1. Número del cuadro. 2. Título. 3. Encabezamiento o conceptos.
4. Cuerpo. 5. Nota de pie o llamadas. 6. Fuente.
7. Nota de unidad de medida. 8. Elaboración.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 26/146
Estadística General 2013
26 Mg. Miguel Angel Macetas Hernández
Ramas de Actividad
PEA de15 añosy más
N i v e l d e Educación
Sin
Nivel*Primaria Secundaria
Sup. No
Univer.
Superior
Univer.No Especificado
TOTAL 100,0 5,89 42,11 35,87 5,67 8,66 1,80
1. Agricultura, Caza, Selvicultura yPesca
100,0 14,97 64,05 15,59 0,70 1,30 3,40
2. Explotación de Minas y Canteras. 100,0 0,75 41,13 39,59 5,79 12,63 0,11
3. Industrias Manufactureras. 100,0 3,60 43,57 41,60 2,94 6,70 1,59
4. Electricidad, Gas y Agua. 100,0 0,00 21,95 48,29 8,29 20,49 0,98
5. Construcción. 100,0 4,78 64,36 24,99 1,05 3,54 1,28
6. Comercio, Restaurantes y Hoteles. 100,0 6,95 45,04 39,66 2,06 4,39 1,91
7. Transportes, Almacenamiento yComunicaciones. 100,0 1,34 45,18 46,87 2,28 3,15 1,18
8. Establecimientos Financieros,Seguros, Bienes Inmuebles yServicios a las Empresas
100,0 0,64 11,60 48,71 9,28 29,25 0,52
9. Servicios Comunales, Sociales yPersonales.
100,0 2,10 26,56 43,35 11,46 15,22 1,30
10. Actividades No bien especificadas. 100,0 9,35 44,70 34,99 3,55 4,97 2,43
11. Buscan trabajo por primera vez. 100,0 1,94 25,75 56,97 6,70 7,94 0,71
* Incluye PEA con educación inicial o pre – escolarFuente: INE Resultados definitivos de los Censos Nacionales IX de Población y IV de ViviendaElaborado: Statistic MAH.
5) NOTA DE PIE O LLAMADAS, se usa para aclarar algunos términos o siglas, y también para indicar quéelementos están o no incluidos en algunos de los conceptos del cuadro.6) FUENTE, es la indicación al pie el cuadro, que sirve para nombrar la publicación, entidad, estudio o fuente
de donde se obtuvieron los datos utilizados para construir el cuadro. La identificación de la fuente permite,si fuera el caso, comprobar la información o para obtener información complementaria.Hay dos tipos de fuentes: i) primaria, cuando se obtiene directamente de la unidad de análisis o cuando serecurre a los propios formularios de una encuesta: ii) secundaria, cuando se recurre a documentosboletines o cuadros estadísticos publicados.
7) Nota Unida de Medida se escribe debajo del título, se usa cuando se abrevia la escritura8) ELABORACIÓN, es una indicación que se coloca debajo de la fuente, y sirve para mencionar el
responsable, que utilizando datos originales o de la fuente elaboró el cuadro estadístico final: indica laresponsabilidad de la publicación del cuadro. A veces resulta Útil indicar la fecha de elaboración.QUE : Población Total Económicamente Activa De 15 Años Y Más DONDE : Del Departamento CajamarcaCOMO : Por Nivel Educativo Según Ramas de ActividadCUANDO : Censo de Población 2009.
CUADRO Nº 01 1Es el código o elemento deidentificación que permiteubicar el cuadro en el interiorde un documento
2
7
POBLACI N TOTAL ECON MICAMENTE ACTIVA DE 15 A OS Y M S, DEL DEPARTAMENTO DE
CAJAMARCA: POR NIVEL EDUCATIVO SEGÚN RAMAS DE ACTIVIDAD. CENSO DE POBLACIÓN 2009
Como
Que
CuandoDonde
Donde
Es la descripciónresumida del contenidodel cuadro. La redaccióndel título debe ser breve,
claro y completo, demodo que se puedandeducir sin ambigüedadqué tipo de informa.Debe indicar
1. QUE2. DONDE3. COMO4. CUANDO
Expresa en qué unidadesestán las variables
(Distribución porcentual)
Descripción de las filas ycolumnas del cuadro
3
Es elcontenidonuméricodel cuadro
4
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 27/146
Estadística General 2013
27 Mg. Miguel Angel Macetas Hernández
CUADRO 04
PACIENTES SEGÚN NÚMERO DE LEUCOCITOS /mm3.
HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA - 2007..
Número deLeucocitos
(miles)1/
Número dePacientes (ni )
Porcentaje dePacientes
( hi % )5.0 - 5.96.0 - 6.97.0 - 7.98.0 - 8.99.0 - 9.9
10.0 - 11.0
3101113108
5.518.220.023.618.214.5
T o t a l a/ 55 100.0
- Nota de pie. a/. Muestra aleatoria sistemática.1/. Datos expresados en miles.
- Fuente. H.R.C
E. Características:
1. La cuadro estadística debe ser lo más simple posible.
2. Si se utilizan símbolos, abreviaturas, etc., deben explicarse detalladamente en
notas de pie de página.3. Deben ser incluidas las unidades específicas de medida que corresponden a los
datos.
4. Deberán consignarse los totales.
5. Si los datos no son originales debe quedar explícita la fuente de donde se ha
tomado.
66.. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea
comparar datos de una cuadro con otra, ya que en los criterios de clasificación de
la variable puede que el entendimiento nuestro de un concepto no coincida
totalmente con el de otro investigador.
77.. Una cuadro estadística puede ser completada con las frecuencias acumuladas,
frecuencias relativas (porcentajes, promedios o razones), etc.
F. Tipos de cuadros.
En su forma más general los cuadros pueden dividirse en simples y
compuestas.
a) Cuadros Simp les . Clasifican un fenómeno según una única variable. Ejemplo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 28/146
Estadística General 2013
28 Mg. Miguel Angel Macetas Hernández
Cuadro 04.
b) Cuadros Comp uestos . Son las que recogen los datos de dos o más variables,
cada una de ellas con sus correspondientes criterios de clasificación. Dentro de los
cuadros compuestos las que se utilizan con mayor frecuencia son: Las cuadros
dobles y las Maestras.
c) Cuadros Dobles . Resumen información clasificadas según 2 variables, y estas se
denominan: Cuadros de contingencia y cuadros de correlación.
d) Cuadro de Cont ing encia. Cuando ambas variables son cualitativas o mixtas.
Ejemplo. El cuadro siguiente muestra una distribución bidimensional (Cuadro decontingencia)
CUADRO 05
REACCIÓN A LA VACUNACIÓN CONTRA EL SARAMPIÓN Y LA RUBÉOLA EN UNAMUESTRA DE 288 NIÑOS DE CAJAMARCA -1994.
Vacunados contrasarampión
Vacunados contra rubéolaT O T A L
Reacción Positiva Reacción Negativa
Reacción positiva
Reacción negativa
76
120
72
20
148
140
T O T A L 196 92 288
La interpretación a esta cuadro sería la siguiente: de una muestra de 288 individuos,
76 tuvieron reacciones positivas a las dos vacunaciones, 20 individuos tuvieron
reacción negativa a ambas pruebas, 120 individuos tuvieron reacción positiva ante la
vacuna contra la rubéola, pero negativamente ante la vacuna contra el sarampión, y
72 niños tuvieron reacción negativa a la vacuna contra la rubéola y positiva en la
vacuna contra el sarampión.
CUADRO DE CORRELACIÓN. Cuando ambas variables son cuantitativas. Por
ejemplo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 29/146
Estadística General 2013
29 Mg. Miguel Angel Macetas Hernández
CUADRO 06
MUJERES EN EDAD FÉRTIL SEGÚN GRUPO ETÁREO Y NÚMERO DE HIJOSNACIDOS VIVOS - HOSPITAL REGIONAL DE CAJAMARCA - CAJAMARCA – 2007
GRUPO ETÁREO(Años Cumplidos)
Número de Hijos Nacidos VivosT O T A L
0 1 2 3 45 y+
15 - 1920 - 2425 - 2930 - 3435 - 3940 - 4445 - 49
T o t a l
2. Cuadr o Maestra . En este tipo de cuadros todos los criterios de clasificación de
cada una de las variables son sometidos a una clasificación cruzada. Esto da
lugar a una perspectiva mucho más amplia, ya que nos permite obtener datos
de una única variable o de cualquier combinación de las variables que entran
en juego en la cuadro.
Ejemplo. El cuadro muestra la composición por edad, sexo y trabajo de ungrupo de personas con Tuberculosis pulmonar en Cajamarca (Esquema)durante 2007.
CUADRO 07
PERSONAS CON TBC SEGÚN EDAD, CONDICIÓN LABORAL Y SEXO - DISTRITO DECAJAMARCA - 2007
EDADTRABAJADORES NO TRABAJADORES T O T A L
Hombr es
Mujeres
TotalHombr
esMujere
sTotal
Hombr es
Mujer es
Total
15 – 1920 – 2425 – 29
.
.
.50 – 54
55 – 5960 ó +TOTAL
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 30/146
Estadística General 2013
30 Mg. Miguel Angel Macetas Hernández
n
nh i
i
Nota: Con este tipo de cuadros podemos extraer datos de las personas que padecenTuberculosis en un determinado intervalo de edad (A), también del total depersonas que no trabajan y han contraído la TBC (B), y del total de mujeres, ya
sean trabajadoras o no, que tienen tuberculosis (C).
2.2. Cuadros de Frecuencias de Variables Discretas
Para este tipo de variables cuyo valor sólo se puede expresar por número enteros
positivos, los datos que caen dentro de cada clase.
Elementos de un cuadro de Frecuencia
Frecuencias Absolutas o Repetidas (f i o ni).- Es el número de veces que se repiteun determinado valor de la variable.
Frecuencia Relativa (hi ).- Es el cociente de:
Frecuencia absoluta o RepeticionesNúmero de Observaciones
CUADRO Nº 7.8NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS – 2004
ProvinciasNúmero deNacimientos
Porcentaje de Nacimientos
Lambayeque n1 = 325 4334
944
100x325
n
nh 1
1 ,
Chiclayo n2 =330
9635944
100x330
n
nh 2
2
,
Ferreñafe n3 = 289
6130944
100x289
n
nh 3
3 ,
Total n = 944 100,00
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 31/146
Estadística General 2013
31 Mg. Miguel Angel Macetas Hernández
Ejemplo con variables cualitativasEjemplo. El restaurante "Hay Que Rico" en la ciudad de Chiclayo, usa un cuestionariopara conocer la opinión de sus clientes sobre el servicio, la calidad de los alimentos, loscócteles, los precios y el ambiente del restaurante en el mes de julio del 2005. Cada
característica se valora en una escala: notable (O), muy bueno (V), bueno (G), mediano (A)y malo (P). Elabore un cuadro estadísticoG O V G A O V G O V A GV O P V O G A O O O G OV V A G O V P V O O G OO V O G A O V O O G V A
Aplicación de la función de Excel en la Elaboración de Tablas con variables cualitativas
Figura N° 03 Ingreso de los datos
Paso.- 1 Se ubica en la celda A1 (Calidad) Insertar se selecciona tabla dinámica
Figura N° 04 Selección de la tabla dinámica
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 32/146
Estadística General 2013
32 Mg. Miguel Angel Macetas Hernández
Paso.- 2 En la ventana de Crear tabla dinamica se elije donde se desea colocar elinforme de la tabla dinamica
Figura N° 05 Crear tabla dinamica
Paso.- 3 En la ventana de lista de campos de la tabla dinámica se selecciona la variable
Calidad en Etiqueta de la fila y de columnas y en Σ valores
Figura N° 06 Seleccionar campos para agregar al informe
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 33/146
Estadística General 2013
33 Mg. Miguel Angel Macetas Hernández
Paso.- 4 Insertamos un gráfico un dinámico de barras
Figura N° 07 Insertar grafico
Paso.- 4 Presentación del gráfico de barras de la variable calidad
Grafico N° 01: Grafico de Barras de la variable calidad
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 34/146
Estadística General 2013
34 Mg. Miguel Angel Macetas Hernández
Ejemplo:En un estudio de mercado para determinar la aceptación de un centro comercial Shopping Plaza
por departamentos ubicada en la ciudad de Cajamarca, se eligió una muestra de 35 clientes para
conocer sus impresiones. Los resultados son los siguientes:
Cliente Razón de visita
Gasto
semanal
Ingreso
Mensual
Número
de hijos
Forma de
Pago
1 Oferta permanente 66.00 1200 2 Efectivo
2 Guardería 72.50 1500 1 Crédito
3 Tarjeta de crédito 79.10 2100 3 Crédito
4 Oferta permanente 82.70 2000 3 Efectivo
5 Guardería 55.30 1500 1 Efectivo
6 Parking amplio 100.10 2200 2 Crédito
7 Aire acondicionado 35.30 1450 3 Efectivo
8 Tarjeta de crédito 60.40 1310 1 Crédito
9 Aire acondicionado 57.20 1150 2 Efectivo
10 Parking amplio 140.00 2320 0 Crédito
11 Tarjeta de crédito 69.10 1350 2 Efectivo
12 Parking amplio 73.10 1640 1 Crédito
13 Guardería 75.30 1680 3 Crédito
14 Aire acondicionado 30.00 1100 0 Efectivo
15 Parking amplio 95.20 1850 2 Efectivo
16 Guardería 65.30 1410 1 Efectivo
17 Tarjeta de crédito 68.00 1580 3 Crédito
18 Parking amplio 115.30 2110 0 Efectivo
19 Parking amplio 130.20 2180 2 Crédito20 Aire acondicionado 48.40 1640 3 Crédito
21 Guardería 86.00 1840 2 Crédito
22 Parking amplio 102.20 1950 3 Efectivo
23 Oferta permanente 50.10 1230 2 Efectivo
24 Tarjeta de crédito 101.20 2000 2 Crédito
25 Parking amplio 102.20 2810 3 Crédito
26 Oferta permanente 58.10 1530 4 Efectivo
27 Tarjeta de crédito 90.30 1980 2 Crédito
28 Parking amplio 119.10 2900 4 Crédito
29 Oferta permanente 125.10 2680 3 Efectivo30 Tarjeta de crédito 70.20 1970 2 Crédito
31 Parking amplio 118.40 2560 3 Crédito
32 Oferta permanente 110.10 2180 4 Crédito
33 Tarjeta de crédito 84.30 1980 3 Efectivo
34 Oferta permanente 77.20 2050 2 Crédito
35 Oferta permanente 104.20 2500 4 Crédito
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 35/146
Estadística General 2013
35 Mg. Miguel Angel Macetas Hernández
Se copia (Ctrl + C) y se pega (Ctrl + V) al Minitab las 35 observaciones
Figura N° 08: Pantalla del Minitab ingresado los datos
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 36/146
Estadística General 2013
36 Mg. Miguel Angel Macetas Hernández
A. DISTRIBUCIÓN DE FRECUENCIAS DE LA VARIABLE CUALITATIVAS: Realizamosla tabulación de la variable “Razón de visita” procedemos a ejecutar en el Minitab
MINITAB: Tabla de frecuencias
1. Paso 1 .- Estadísticas/Tablas/cuenta de variables individuales
Figura N° 09 Estadísticas/Tablas/cuenta de variables individuales
2. Paso 2.- En la ventana cuenta de variables indiv iduales se selecciona la variable‘Razón de Visita’. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajesacumulados. Aceptar
Figura N° 10 Ventana cuenta de variables individuales Resultado del procesamiento en Minitab
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 37/146
Estadística General 2013
37 Mg. Miguel Angel Macetas Hernández
Figura N° 11 Cuenta de la variable Razón de visita
B. REPRESENTACIÓN GRAFICA DE LA VARIABLE CUALITATIVAS: Realizamos latabulación de la variable “Razón de visita” procedemos a ejecutar en el Minitab
1. Grafico Circular .- Se trabaja con los valores de las frecuencias Absolutas (n i)frecuencias relativas (hi) como la variables seleccionada es variable cualitativa(Razón de Visita)
Paso 1 .- Gráfica/Gráfica Circular
Figura N° 12 Gráfico circular en minitab
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 38/146
Estadística General 2013
38 Mg. Miguel Angel Macetas Hernández
Paso 2 .- En la ventana de Grafica circular se selecciona Variables Categórica:Razón de visita
Figura N° 13 Grafica Circular
Paso 3 .- En la ventana de Grafica circular se selecciona Etiquetas… Seleccionar la pestaña Etiqueta de división de la gráfica circular con: Nombre decategoría/ Porcentaje /Dibujar una línea de la etiqueta a la división
Figura N° 14 Etiqueta de división de la gráfica circular
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 39/146
Estadística General 2013
39 Mg. Miguel Angel Macetas Hernández
Aire acon dicionado
Guardería
Oferta permanente
Parking amplioTarjeta de crédito
Categoría
Tarjeta de crédito22.9%
Parking amplio28.6%
Oferta permanente22.9%
Guardería14.3%
Aire acondicionado11.4%
Gráfica circular de Razón de visita
Gráfico N° 02 Gráfico Circular de Razón de visita
2. Gráfico de Barras.- En el eje horizontal representa los valores o las categorías yen el eje vertical se presentan los valores de las frecuencias Absolutas (n i)frecuencias relativas (hi) como la variables seleccionada es variable cualitativa(Razón de Visita)
Paso 1 .- Gráfica/Gráfica de barras…
Figura N° 15 Gráfico barras en minitab
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 40/146
Estadística General 2013
40 Mg. Miguel Angel Macetas Hernández
Paso 1 .- En la ventana Gráfica de barrasLas barras representan: Conteos de valores únicosBarras simples/ Aceptar
Figura N° 16: Gráfica de barras
Paso 2.- En la ventana Gráfica de barras – Conteo de valores únicos, simples seselecciona la variable categórica: ‘Razón de visita’ y se selecciona Opciones degráficas…
Figura N° 17: Gráfica de barras – Conteo de valores únicos, simples
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 41/146
Estadística General 2013
41 Mg. Miguel Angel Macetas Hernández
Paso 3.- En la ventana Gráfica de barras – Opciones de gráficasOrdenar grupos de X principal por Y descendente/Aceptar
Figura N° 18: Gráfica de barras – Opciones
Paso 4.- En la ventana Gráfica de barras – Conteo de valores únicos, simples seselecciona Etiquetas
En Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar
Figura N° 19: Gráfica de barras – Etiquetas
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 42/146
Estadística General 2013
42 Mg. Miguel Angel Macetas Hernández
Aire acondicionadoGuarderíaTarjeta de créditoOferta permanenteParking amplio
10
8
6
4
2
0
Razón de visita
C o n t e o
4
5
88
10
Gráfica de Razón de visita
Gráfico N° 03 Gráfico de barras Razón de visita
C. DISTRIBUCIÓN DE FRECUENCIAS DE LA VARIABLE CUANTITATIVASDISCRETAS: Realizamos la tabulación de la variable “Número de hijos” procedemos aejecutar en el Minitab
1. Paso 1 .- Estadísticas/Tablas/cuenta de variables individuales
Figura N° 20 Estadísticas/Tablas/cuenta de variables individuales
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 43/146
Estadística General 2013
43 Mg. Miguel Angel Macetas Hernández
2. Paso 2.- En la ventana cuenta de variables indiv iduales se selecciona la variable‘Número de hijos’. Mostrar Conteos/Porcentajes/ Conteos acumulados porcentajesacumulados. Aceptar
Figura N° 21 Ventana cuenta de variables individuales
Resultado del procesamiento en Minitab
Figura N° 22 Cuenta de la variable Número de hijos
D. REPRESENTACIÓN GRAFICA DE LA CUANTITATIVAS DISCRETAS: Realizamos latabulación de la variable ‘Número de hijos’ procedemos a ejecutar en el Minitab
1. Gráfico de Barras.- Se trabaja con los valores de las frecuencias Absolutas (ni)frecuencias relativas (hi) como la variables seleccionada es variable discreta
“Número de hijos”
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 44/146
Estadística General 2013
44 Mg. Miguel Angel Macetas Hernández
Paso 1 .- En la ventana Gráfica de barrasLas barras representan: Conteos de valores únicosBarras simples/ Aceptar
Figura N° 23: Gráfica de barras
Paso 2.- En la ventana Gráfica de barras – Conteo de valores únicos, simples se
selecciona la variable categórica: ‘Número de hijos’ y se selecciona Opciones degráficas…
Figura N° 24: Gráfica de barras – Conteo de valores únicos, simples
Paso 3.- En la ventana Gráfica de barras – Opciones de gráficasOrdenar grupos de X principal por Y descendente/Aceptar
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 45/146
Estadística General 2013
45 Mg. Miguel Angel Macetas Hernández
Figura N° 25: Gráfica de barras – Opciones
Paso 4.- En la ventana Gráfica de barras – Conteo de valores únicos, simples seselecciona EtiquetasEn Etiquetas de datos se selecciona Usar etiquetas de valor y /Aceptar/Aceptar
Figura N° 26: Gráfica de barras – Etiquetas
Salida de Minitab
04132
12
10
8
6
4
2
0
Número de hijos
C o n t e o
3
4
5
11
12
Gráfica de Número de hijos
Gráfico N° 04 Gráfico de barras Número de hijos
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 46/146
Estadística General 2013
46 Mg. Miguel Angel Macetas Hernández
2.3. Cuadros de Frecuencias de Variables Continuas
Los sueldos mensuales en dólares de 60 empleados de la empresa Z.S.A., son lossiguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 509 462 380 518 480 625 507 645 382
Construir un cuadro de Frecuencias se aplica el procedimiento siguiente:
Población: Empleados de la empresa Z.S.A (n = 60)
Variable: X = sueldo mensual en dólares.
Datos: Xi = sueldo mensual en dólares
Xi (i =1, 2, 3,.....,60) n =60 trabajadores
Determinamos el máximo y mínimo de Xi, el sueldo más alto (Xmax) y el sueldo mínimo(Xmin).
X38 = Xmax = 667 X17 = Xmin = 321
1. Recorrido(R): Xmax – Xmin = 667 – 321 =346
2. Elegimos el número de Intervalos (m). Se puede considerar 5 ó 15 intervalos
Si aplicamos:
Para calcular el número de clases de un cuadro de frecuencias podemos usar las
siguientes expresiones ó fórmulas:a) Raíz cuadrada √
b) Regla de Sturges m = 1 + 3.322 Log(n)
m = 1 + 3.322 Log(60)
m = 7 intervalos
c) Regla de Stockes
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 47/146
Estadística General 2013
47 Mg. Miguel Angel Macetas Hernández
3. Determinar la amplitud de los intervalos (C)
.......,minmax 4285497
321667
m
XXc i
Se puede redondear a 50
4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o
segmentos, cuyo extremos son:
I1 I2 I3 I4 I5 I6 I7
320 370 420 470 520 570 620 670
Utilizaremos un concepto matemático de intervalo abierto (paréntesis) y de intervalo
cerrado (corchete). Donde (Li-1 – Li] significa que está abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no está incluida el extremo
inferior (Li-1) pero si lo está el extremo superior (L i).
Forma de expresar:
Intervalo de clase(Li-1 – Li]
320 – 370
370 – 420
420 – 470
470 – 520
520 – 570
570 – 620
620 – 670
Punto medio de cada intervalo, es la MARCA DE CLASE se denota con y i donde
6452
670620y
4952
520470y
3452
370320y
7
4
1
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 48/146
Estadística General 2013
48 Mg. Miguel Angel Macetas Hernández
5. Elementos de una cuadro de frecuencia, en toda cuadro de frecuencia se
identifica los siguientes elementos:
a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la
variable X, el número de veces ni que se repite ese valor.
b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variable
X la relación por cociente entre el número de veces que aparece el valor xi y el
número total de valores de la variable (N).n
nh i
i
c) Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta
acumulada del valor in a la suma de las frecuencias absolutas de los valores de la
variable X anteriores o iguales a in . Su valor es ii n N con j = 1......i
d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida
por el número total de valores de la variable. Su valor es iH = N
Ni
.
De todas estas definiciones se extraen las siguientes deducciones:
La suma de las frecuencias absolutas sin acumular es igual al número total de los (
in ,= N)
La última frecuencia relativa acumulada es el total de elementos (n).
La suma de todos las frecuencias relativas acumular es igual
La última frecuencia relativa acumulada es la unidad
La distribución de frecuencias de una variable suele presentarse ordenadamente
mediante la tabla de frecuencias siguiente:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 49/146
Estadística General 2013
49 Mg. Miguel Angel Macetas Hernández
Intervalosde clases
Marcade
clase
Frecuencia Absolutas
Frecuencias Absolutas
Acumuladas
FrecuenciasRelativas
Frecuencias Relativas Acumuladas
<Li-1 Li] xi ni Ni hi Hi
<L 1 – L2] x1 n1 N1=n1 h1=N
n1 H1=N
N1
<L2, – L3] x2 n2 N2 = n1+n2 h2=N
n2 H2=
N
N2
<L3, – L4] x3 n3 N3 =n1+n2+n3 h3=N
n3 H3=
N
3N
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
<Lk-1, –Lk ] xk nK Nk = n1+...+nK =n hk =N
nk Hk =N
Nk =1.00
Total n ni =n hi =1
Lectura de la información debe considerar los Signos y Símbolos siguientes:
( – ) No existe el fenómeno que trata
( 0 ) La cantidad no alcanza a la mitad de la unidad tomada como base
(···) Informe no disponible.
Los Intervalos pueden ser de lasiguiente manera:
<Li-1 – Li] <Li-1 – Li>[Li-1 – Li> [Li-1 – Li]
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 50/146
Estadística General 2013
50 Mg. Miguel Angel Macetas Hernández
Aplicación de la función de Excel en la Elaboración de Tablas
Se ingresa los datos sobre el sueldo mensual en dólares de 60 empleados de la empresa
Z.S.A., en una columna desde la celda A1 hasta la celda A61.
Determinamos el máximo y mínimo de Xi, el sueldo más alto (Xmax =MAX(A2:A61) =667 y el sueldo mínimo (Xmin =MIN(A2:A61). = 321
1. Rango ó Recorrido(R): Xmax – Xmin = 667 – 321 =346
Restamos la Celda A2 menos la Celda A3
2. Elegimos el número de Intervalos (m). Se puede considerar 5 ó 15 intervalos
Si aplicamos:
Para calcular el número de clases de un cuadro de frecuencias podemos usar las
siguientes expresiones ó fórmulas:
a) Regla de Sturges m = 1 + 3.322 Log(n)
m = 1 + 3.322 Log(60)= 6.907
=1+3.322*LOG(CONTAR(A2:A61))
Para redondear a un entero superior se utiliza la siguiente función
=MULTIPLO.SUPERIOR(D7,1)
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 51/146
Estadística General 2013
51 Mg. Miguel Angel Macetas Hernández
m = 7 intervalos
3. Determinar la amplitud de los intervalos (C)
.......,minmax428549
7
321667
m
XXci
Se divide el rango y el número de Intervalos =D5/E7. También redondear a un
entero superior =MULTIPLO.SUPERIOR(D9,1) Se puede redondear a 50
4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o
segmentos, cuyo extremos son:
Utilizaremos un concepto matemático de intervalo abierto (paréntesis) y de intervalo
cerrado (corchete). Donde (Li-1 – Li] significa que está abierto por la izquierda y
cerrado por la derecha, es decir que en cada intervalo no está incluida el extremo
inferior (Li-1) pero si lo está el extremo superior (L i).
Forma de expresar:
I1 I2 I3 I4 I5 I6 I7
320 370 420 470 520 570 620 670
En el primer intervalo I1 en el límite inferior la observación mínima se le resta una
observación porque es intervalo abierto (321 – 1 = 320), para el límite superior al valor
obtenido en el límite inferior se suma la amplitud (se fija la amplitud con F4)=E16+$E$9
En el segundo intervalo I2 en el límite inferior es =F16, para para el límite superior
=E17+$E$9
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 52/146
Estadística General 2013
52 Mg. Miguel Angel Macetas Hernández
5. Elementos de una cuadro de frecuencia, en todo cuadro de frecuencia se
identifica los siguientes elementos:
a) Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi de la
variable X, el número de veces ni que se repite ese valor.
Para calcular la Frecuencia absoluta en Excel se tendrá que activar Archivo
Opciones Complementos Ir… Herramienta para análisis
Se selecciona el Rango de entrada desde la celda A2 hasta A61 y el Rango de
Clase F:16 hasta F22
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 53/146
Estadística General 2013
53 Mg. Miguel Angel Macetas Hernández
Por lo tanto las frecuencias quedan determinadas de la siguiente manera
b) Frecuencia relativa (hi): Se denomina frecuencia relativa del valor xi de la variableX la relación por cociente entre el número de veces que aparece el valor xi y el
número total de valores de la variable (N).n
nh i
i
Se divide H16/$H$23
c) Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absolutaacumulada del valor in a la suma de las frecuencias absolutas de los valores de la
variable X anteriores o iguales a in . Su valor es ii n N con j = 1......i
d) Frecuencia relativa acumulada (Hi): Es la frecuencia absoluta acumulada dividida
por el número total de valores de la variable. Su valor es iH =N
Ni .
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 54/146
Estadística General 2013
54 Mg. Miguel Angel Macetas Hernández
Figura:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 55/146
Estadística General 2013
55 Mg. Miguel Angel Macetas Hernández
E. DISTRIBUCIÓN DE FRECUENCIAS, DE LA VARIABLE CUANTITATIVA CONTINUA: Se trabajara con
la variable “Gasto semanal en la tienda VENDO”
Calculo previos para tabular la variable
Paso 1.- Hallar el rango o amplitud de los datos
Rango = 140.0 – 30.0 = 110.0
Cálculos del Rango con el Minitab
Figura N° 19: Calculo del Rango
Figura N° 20: Calculo de las observaciones mínimas, máximas y el rango
Rango = Observación mayor – Observación menor
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 56/146
Estadística General 2013
56 Mg. Miguel Angel Macetas Hernández
Figura N° 21: Calculo del Rango
Pasó 2.- Hallar el número de Intervalos (m) Dos maneras:
a) Por la experiencia del investigador, usualmente
b) Por la fórmula de Sturges
m = 1+ 3.322 log (35) = 6.12939 ≅ 6 Intervalos
Seleccionamos Calc para calcular número de clases
Figura N° 22: Cálculo de Número de Intervalos
5 ≤ m ≤ 15
m = 1+ 3.322 log
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 57/146
Estadística General 2013
57 Mg. Miguel Angel Macetas Hernández
Paso 3.- Hallar la amplitud de los intervalos (C)
≅
Paso 4.- Hallar los intervalos de clase
Li-1 = límite inferior de la clase i
Li = límite superior de la clase i
Intervalos de clasesFrecuenciaAbsolutas
FrecuenciasAbsolutas
Acumuladas[Li-1 Li> ni Ni
[Observación menor – L2> n1 N1=n1
[L2, – L3> n2 N2 = n1+n2
[L3, – L4> n3 N3 =n1+n2+n3
.
.
. ...
.
.
.
Lk-1, –Lk > nK Nk = n1+...+nK =n
Total n ni =n
Los intervalos son los siguientes:
[Li-1 Li>
[L1 = obs. menor = 30.0 L1 = L1 +IC = 48.4>
[L2 = 48.4 L2 = 66.8>
[L3 = 66.8 L3 = 85.2>
[L4 = 85.2 L4 = 103.6>
[L5 = 103.6 L5 = 122.0>
[L6 = 122.0 L7 = 140.4>
Paso 5- Tabulación de los datos (conteo de datos)
Gasto mensual
[Li-1 Li>
Frecuencia
absoluta n
i
Frecuencia
relativa hi %
Frecuencia
acumulada
absoluta Ni
Frecuencia
acumulada
relativa Hi %
[ 30.0 – 48.4> 2 5.71 2 5.71
[ 48.4 – 66.8> 8 22.86 10 28.57
[ 66.8 – 85.2> 10 28.57 20 57.14
[ 85.2 – 103.6> 7 20.00 27 77.14
[103.6 – 122.0> 5 14.29 32 91.43
[122.0 – 140.4] 3 8.57 35 100.00
Nota: Creamos una nueva variable denominada Gastos en la columna C8
Paso 6- Tabulación de los datos (conteo de datos) con Minitab. Seleccionamos Datos/
Codificar/ Numérico a numérico…
• Redondeo por exceso •Igual # decimales que los datos
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 58/146
Estadística General 2013
58 Mg. Miguel Angel Macetas Hernández
Figura N° 23: Codificar de Numérico a numérico
Pasó 6- En la ventana Código – Numérico a numérico se ingresan los valores de los
intervalos mencionando a que intervalo corresponde:
Figura N° 24: En la ventana Código – Numérico a numérico se ingresan los valores
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 59/146
Estadística General 2013
59 Mg. Miguel Angel Macetas Hernández
Pasó 7- Mostrar los intervalos con sus respectivos frecuencias absolutas y relativas.
Seleccionamos Estadísticas/Tablas/Cuentas de variables individuales seleccionamos C8:
Gastos en la ventana de variables. También Conteos/Porcentajes/Conteos acumulados y
porcentaje acumulados.
Figura N°
24: Cuentas de variables individuales
Figura N° 25: Cuentas de variables: Gastos
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 60/146
Estadística General 2013
60 Mg. Miguel Angel Macetas Hernández
F. REPRESENTACIÓN GRAFICA DE LA CUANTITATIVAS CONTINUA: Realizamos la
tabulación de la variable ‘Gasto semanal’ procedemos a ejecutar en el Minitab
Calculo previos para tabular la variable
1. Histogramas Se utilizan para variables continuas o para variables discretas, con un grannúmero de datos, y que se han agrupado en clases. Paso 1.- Seleccionamos Gráfica/Histograma…
Figura N° 25: Seleccionar Histogramas
Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar
Figura N° 26: Ventana Histogramas
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 61/146
Estadística General 2013
61 Mg. Miguel Angel Macetas Hernández
Paso 3.- En la ventana Histograma simple en la ventana de Variables gráficas:
‘Gasto semanal’
Figura N° 27: Histograma simple
Paso 4.- Se selecciona Escala… selecciona Tipo de escala Y
Figura N° 28: Histograma – Escala
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 62/146
Estadística General 2013
62 Mg. Miguel Angel Macetas Hernández
Paso 5.- En la ventana Histograma – Escala/tipo de escala Y/Porcentaje
Figura N° 29: Histograma – Escala
Paso 6.- Se ejecuta doble click en el Histograma en el eje de X
1351201059075604530
25
20
15
10
5
0
Gasto semanal
P o r c e n t a j e
Histograma de Gasto semanal
Gráfico N° 03: Histograma de Gasto semanal
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 63/146
Estadística General 2013
63 Mg. Miguel Angel Macetas Hernández
Paso 7.- En la ventana Editar Escala se seccionamiento: Tipo de
intervalo/Punto de corte. En Definición de intervalo/posiciones de punto
medio/punto de corte: 30:140.4/18.4/Aceptar
Figura N° 30: Histograma – Escala
140.4122.0103.685.266.848.430.0
30
25
20
15
10
5
0
Gasto semanal
P o r c e n t a j e
Histograma de Gasto semanal
Gráfico N° 04: Histograma de Gasto semanal
2. Histogramas Se construye con cada punto medio o marca de clase (Xi) de cada
Observación
MínimaObservación
Máxima
Amplitud del
intervalo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 64/146
Estadística General 2013
64 Mg. Miguel Angel Macetas Hernández
intervalo se levanta un segmento de altura igual a la respectiva Frecuencias
Absolutas (ni ó hi).
Paso 1.- Se copia la marca de clase y frecuencia relativa
Figura N° 31: Marca de clase y Frecuencia Relativa
Paso 2.- Seleccionamos Gráfica/ Gráfica de dispersión…
Figura N° 31: Gráfica de dispersión
Se agrega una clase:
39.2 – 18.4 =20.8
Se agrega una clase:
131.2 + 18.4 = 149.6
Frec. Rela
h = 0.00
Frec. Rela
h = 0.00
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 65/146
Estadística General 2012
65 Mg. Miguel Angel Macetas Hernández
Paso 3.- En la ventana Gráfica de dispersión con línea de conexión
Figura N° 32: Gráfica de dispersión
Paso 4.- En la ventana Gráfica de dispersión con línea de conexión:
Se agrega en la Variables Y: ‘Frec. Rela’ y Variables X: Marca de Clase
Figura N° 32: Gráfica de dispersión con línea de conexión
Pasó 5.- En la Gráfica de Frec. Rela vs Marca de Clase
Doble Crick en eje de Y en la frecuencia Relativa se muestra la venta Editar escala
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 66/146
Estadística General 2012
66 Mg. Miguel Angel Macetas Hernández
16014012010080604020
30
25
20
15
10
5
0
Marca de clase
F r e c .
R e l a
Gráfica de dispersión de Frec. Rela vs. Marca de clase
Gráfico N° 05: Polígono de frecuencia de Gasto semanal
Pasó 6.- En la venta Editar escala en el Rango de escala/Mínimo =0/ Aceptar
Figura N° 32: Editar escala
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 67/146
Estadística General 2012
67 Mg. Miguel Angel Macetas Hernández
16014012010080604020
30
25
20
15
10
5
0
Marca de clase
F r e c .
R e l a
Gráfica de dispersión de Frec. Rela vs. Marca de clase
Gráfico N° 05: Polígono de frecuencia de Gasto semanal
3. Polígonos Acumulativos de Frecuencias (Ojiva). Aquellos que se desarrollan mediante la
marca de clase que tiene coincidencia con el punto medio de las distintas columnas del
histograma. En el momento de la representación de todas las frecuencias que forman parte
de una tabla de datos agrupados, se genera el histograma de frecuencias acumuladas que
posibilita la diagramación del polígono correspondiente.
Paso 1.- Seleccionamos Gráfica/Histograma…
Figura N° 33: Seleccionar Histogramas
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 68/146
Estadística General 2012
68 Mg. Miguel Angel Macetas Hernández
Paso 2.- En la ventana Histograma seleccionamos simple/Aceptar
Figura N° 34: Ventana Histogramas
Paso 3.- En la ventana Histograma simple en la ventana de Variables gráficas: ‘Gasto
semanal’
Figura N° 35: Histograma simple
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 69/146
Estadística General 2012
69 Mg. Miguel Angel Macetas Hernández
Paso 4.- Se selecciona Escala… selecciona Tipo de escala Y
Figura N° 36: Histograma – Escala
Paso 5.- En la ventana Histograma – Escala/tipo de escala Y/Porcentaje
Figura N° 37: Histograma – Escala
Pasó 6.- Doble Click en eje de Gasto mensual donde se presenta la ventana Editar escala
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 70/146
Estadística General 2012
70 Mg. Miguel Angel Macetas Hernández
1351201059075604530
100
80
60
40
20
0
Gasto semanal
P o r c e n t a j e a c u m u
l a d o
Histograma de Gasto semanal
Gráfico N° 06: Polígono de frecuencia Acumulada
Pasó 7.- En la ventana de Editar Escala/Tipo intervalo/Punto de corte
Posiciones de punto medio/punto de corte: 30:140.4/18.4 Aceptar
Figura N° 38: Ventana de Editar Escala
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 71/146
Estadística General 2012
71 Mg. Miguel Angel Macetas Hernández
140.4122.0103.685.266.848.430.0
100
80
60
40
20
0
Gasto semanal
P o r c e n t a j e a c u m
u l a d o
Histograma de Gasto semanal
Gráfico N° 06: Polígono de frecuencia Acumulada
4. Diagrama de Tallos y hojas: Permite obtener simultáneamente una distribución de
frecuencias de la variable y su representación gráfica. Para construirlo basta separar en cada
dato el último dígito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formará el tallo).
Paso 1.- Seleccionamos Tallo y Hoja.
Figura N° 38: Seleccionar Tallo y Hoja
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 72/146
Estadística General 2012
72 Mg. Miguel Angel Macetas Hernández
Gráficos Estadísticos
Primero definiré lo que es un gráfico o diagrama en estadística.
Un diagrama es una especie de esquemático, formado por líneas, figuras, mapas,utilizado para representar, bien datos estadísticos a escala o según una cierta
proporción, o bien los elementos de un sistema, las etapas de un proceso y las
divisiones o subdivisiones de una clasificación. Entre las funciones que cumplen los
diagramas se pueden señalar las siguientes:
Hacen más visibles los datos, sistemas y procesos
Ponen de manifiesto sus variaciones y su evolución histórica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de
un proceso y representar la correlación entre dos o más variables.
Sistematizan y sintetizan los datos, sistemas y procesos.
Aclaran y complementan las cuadros y las exposiciones teóricas o cuantitativas.
El estudio de su disposición y de las relaciones que muestran pueden sugerir
hipótesis nuevas.
Algunos de los diagramas más importantes son el diagrama en árbol, diagrama de
áreas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques,
diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y
hoja diagrama, histogramas y gráficos de caja y bigote o boxplots.
Clasificación De Los Gráficos
Los gráficos podemos clasificarlos en la siguiente forma:
A. Gráficos de coordenadas ortogonales.
Con divisiones equidistantes: Cronodiagrama, historiograma, histograma y
polígono acumulativo, gráfico en Z, gráfico en escalera, gráfico de banderola,
gráfico mixto (La Banda Flaman), curva de frecuencia, estereograma, gráfico
de Gantt, gráfico de barras, etc
Con divisiones semi-equidistantes: Cuadriculado logarítmico y semi-
logarítmico.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 73/146
Estadística General 2012
73 Mg. Miguel Angel Macetas Hernández
B. Gráficos de coordenadas seudo-ortogonales.
C. Gráficos de coordenadas no ortogonales.
Gráficos de coordenadas polares, gráfico en espiral, gráfico triangular
equilátero, etc.
D. Gráficos sin coordenadas.
De superficies: Gráficos de sectores, gráficos geométricos diversos.
De volúmenes: Cubo, esfera, etc.
De figuras (pictórico).
Cartograma de señalización y densidad.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 74/146
Estadística General 2012
74 Mg. Miguel Angel Macetas Hernández
AbscisasOrdenadas
E. GRÁFICOS DE LA DISTRIBUCIÓN DE FRECUENCIAS
Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto elgrafico de las frecuencias sean para variables discretas como para variablescont inuas , se construye en el primer cuadrante del plano cartesiano o rectangular. Eneje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o
intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectivafrecuencia.
i. Frecuencias de variable DiscretaLa representación gráfica de las (ni ó hi) se hace mediante el Diagrama de Frecuencia.Par el efecto, en el eje horizontal se representan los valores Yi, y en el eje verticalesrepresenta los valores de las frecuencias (ni ó hi)
Opiniónde los
Clientes
Frecuenc
iaabsoluta
ni
Frecuen
ciaRelativa
hi % A 6 12,5G 10 20,8O 18 37,5P 2 4,2V 12 25,0
Total 48 100,0
Al considerar las frecuencias absolutas acumuladas o relativas acumuladas, larepresentación gráfica se hace mediante el GRÁFICO ACUMULATIVO DEFRECUENCIAS. En el eje horizontal se colocan los valores de la Marca de Clase (X i), y enel eje vertical los valores Ni ó Hi, a continuación, a partir de cada extremo de los segmentosse traza tramos horizontales formando una escalera como se aprecia en el siguiente grafico
Intervalos de
clases
(Li-1 L i
]
Marcade
clase
Xi
Frecuencia
Absolut
asni
Frecuencias
Absolutas Acumula
dasNi
16 – 27 21,5 3 327 – 38 32,5 5 838 – 49 43,5 10 1849 – 60 54,5 3 2160 – 71 65,5 8 2971 – 82 76,5 7 3682 – 93 87,5 4 40Total 40
Opinión de los Clientes
F r e c u e n c i a A b s o l u
t a s
A G O P V 0
5
10
15
20
6
10
18
2
12
ni
0
5
10
15
20
25
30
35
40
45
0 20 40 60 80 100
Marca de Clase
F r e c u e n c i a s A b s o l u t
a s
A c u m u l a d a s
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 75/146
Estadística General 2012
75 Mg. Miguel Angel Macetas Hernández
ii. Frecuencias de variable ContinuaEn el caso más general, las variables continuas se agrupan en cuadros de frecuenciascon intervalos, por lo tanto se trata de representar gráficamente intervalos en el ejehorizontal.
La representación gráfica de las frecuencias (absolutas o relativas) se hace medianteel Histograma de Frecuencias , que está constituido por un conjunto de rectángulos,cuya base es igual a la amplitud de un intervalo y la altura igual a la respectivafrecuencia. Para construir el histograma de frecuencias, se indican en el eje horizontal
Otro gráfico que se usa para representar las frecuencias es el Polígo no de Fr ecu enc ias ,que se construye como sigue: en cada punto medio o marca de clase (X i ) de cada intervalose levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni ó h i), luegoune los extremos con una línea poligonal, resultando el Polígo no de Frecu enc ias . Para
completar los extremos, se extiende el polígono en media amplitud de cada extremo.
Opiniónde los
Clientes
Frecuencia
absolutani
Frecuencia
Relativahi %
Conviertenhi %
A Grados
EnGrad
os
A 6 12,5
100
5,12x360 45.0
G 10 20,8
100
8,20x360 74.9
O 18 37,5 135.0
P 2 4,2 16.3
V 12 25,0 91.8
Total 48 100,0
Intervalos de
clases
(Li-1 Li]
Frecuencia
Absolutasni
16 – 27 3
27 – 38 5
38 – 49 10
49 – 60 3
60 – 71 8
71 – 82 7
82 – 93 4
Total 40
6
10
18
2
12
0
2
4
6
8
10
12
14
16
18
F r e c u e n c i a A b s o l u t a
A G O P V
Opinión de los Clientes
En el caso de Gráficos de
Barras, en el eje horizontal
representa los valores de Yi, yen el eje vertical se presentanlos valores de las frecuencias Absolutas (ni ó hi)
ara los Gráficos de Sectores
irculares ó Pastel , se
onvierten los valores des frecuencias Absolutas
ni ó hi) a grados mediante
100
%ixh360
12.5%
20.8%
37.5%
4.2%
25.0%
0
2
4
6
8
10
0 16 27 38 49 60 71 82 93
Límite inferior
F r e c u e n c i a A b s o l u t a s
ni
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 76/146
Estadística General 2012
76 Mg. Miguel Angel Macetas Hernández
Intervalos de
clases
(Li-1 Li]
Marcade
claseXi
Frecuencia
Absolutasni
10.5 0
16 – 27 21,5 3
27 – 38 32,5 5
38 – 49 43,5 10
49 – 60 54,5 3
60 – 71 65,5 8
71 – 82 76,5 7
82 – 93 87,5 4
98.5 0
Total 40
Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los
Polígono s Ac um ulativo s de Frecuencias (Ojiva) . De igual manera, en el eje horizontal
se ubican los extremos los intervalos y en el eje vertical lo valores de N i, H i. En el extremosuperior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuenciaabsoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentosde recta, los extremo de los segmentos verticales, obteniendo una línea poligonal que, apartir de la última frecuencia acumulativa, se extiende paralelamente al eje horizontal,obteniéndose la gráfica del Polígono A cum ulativ o de Frecuencias
Intervalosde clases<Li-1 Li]
Marcade clase
Xi
Frecuencia
Absolutas
ni
Frecuencias Absolutas Acumulada
s
Ni
16 – 27 21,5 3 3
27 – 38 32,5 5 8
38 – 49 43,5 10 18
49 – 60 54,5 3 21
60 – 71 65,5 8 29
71 – 82 76,5 7 36
82 – 93 87,5 4 40
Total 40
Años Demanda de cobre en China1990 5051991 6001992 8501993 10001994 7701995 11251996 12401997 12602008 13801999 1550
2000 16602001 17502002 18402003 1900
0
2
4
6
8
10
12
0 10.5 21.5 32.5 43.5 54.5 65.5 76.5 87.5 98.5
F r e c u e n c i a A b s o l u t a
Marca de clase
0
5
10
15
20
25
30
35
40
45
0 16 27 38 49 60
Intervalode Clase
F r e c u e n c i a s A b s o l u t a s
A c u m u l a d a s
71 82 93
Gráfico Nº 3.3: Diagrama de dispersión
Demanda de cobre refinado en China
(miles de toneladas métricas)
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1 9 9 0
1 9 9 1
1 9 9 2
1 9 9 3
1 9 9 4
1 9 9 5
1 9 9 6
1 9 9 7
1 9 9 8
1 9 9 9
2 0 0 0
2 0 0 1
2 0 0 2
2 0 0 3
Años (variable independiente = X)
D e m a n d a d e c o b r e e n C h i n a
( v a r i a b l e d e p e n d i e n t e = Y )
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 77/146
Estadística General 2012
77 Mg. Miguel Angel Macetas Hernández
32,030,028,026,024,022,020,018,016,0
40
30
20
10
0
0
1
1 2 3 4
3020100
32
30
28
26
24
22
20
18
16
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12 0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9
0
1
2
3
4
5
6
7
8
1 2 3 4
0
10
20
30
40
50
60
70
80
90
100
1 2 3 4
0
5
10
15
20
25
30
1 2 3 4
CLASIFICACIÓN DE LASVARIABLES
OBJETIVO DEL GRAFICOMOSTRAR
TAMAÑODEL
RECORRIDO
ESCALA DEMEDICIÓN
DISTRIBUCIÓN DEFRECUENCIAS
(UNA VARIABLE)
ASOCIACIÓN ENTREVARIABLES (DOS O
MAS)
D
I
S
C
RE
T
A
S
T
O
D
A
S
BASTONES
BARRAS SIMPLES
SECTOR CIRCULAR
BARRAS AGRUPAS
BARRASCOMPUESTAS
C
O
N
TI
N
U
A
S
INTERVAL
O
O
RAZON
HISTOGRAMA
POLÍGONO DEFRECUENCIAS
CORRELACIÓN
LINEAL
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 78/146
Estadística General 2012
78 Mg. Miguel Angel Macetas Hernández
F. VENTAJAS Y DESVENTAJAS DE LOS GRÁFICOS
Ventajas de los gráficos.
a) Síntesis.- Un cuadro con cifras es difícil de estudiar requiriendo a menudo un
penoso trabajo analítico para poder descubrir las informaciones que contiene.
Por el contrario, mediante un gráfico el investigador hace aparecer lasprincipales características de una serie estadística.
b) Descubrimiento.- El gráfico permite descubrir hechos esenciales, que
pasarían desapercibidos al simple examen de los cuadros numéricos.
c) Control.- Permite descubrir anomalías de cálculo o tipográficas, que no son
fáciles de hallar en los cuadros.
d) Comparación.- Si el análisis de los datos de una serie en un cuadro, es una
labor delicada, la confrontación de los datos de dos series lo es más todavía.
En cambio, los gráficos permiten un conjunto de comparaciones a simple vista.
e) Búsqueda de las regularidades.- Los gráficos permiten hallar fácilmente la
regularidad de los movimientos de las series cronológicas. También permite
destacar la alternancia o repetición de ciertos fenómenos.
El Gráfico es un instrumento de investigación científica.
Desventajas de los gráficos
a) Ocultamiento.- El gráfico oculta una cierta cantidad de información. En este
sentido es menos preciso que un cuadro.
b) Deformaciones.- Por fallas deliberadas o no en la construcción, puede
introducir importantes deformaciones de los hechos. Un dibujante poco
escrupuloso puede exagerar o reducir, mediante un mal uso de las escalas y
de los trazos, la importancia de un fenómeno. Tal cosa puede ocurrir en
gráficos para fines políticos, económicos o publicitarios.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 79/146
Estadística General 2012
79 Mg. Miguel Angel Macetas Hernández
Construir Una Pirámide Poblacional
Elaborar una pirámide poblacional a partir de datos
1. Abre una nueva hoja de cálculo Excel para introducir los datos.
2. Escribe en la primera fila el título de la tabla de Datos: Perú 2011.
3. Introduce los grupos de edad en la primera columna:
En la cabecera de la columna escribe: Edad
A continuación escribe los grupos de Edad: 0-4, 5-9, ..., 80 y más
Al final de la columna escribe: Total
4. En las siguientes columnas escribe los datos, en el siguiente orden: Hombres,
Mujeres.
Nota: Los datos de que aparezcan en la columna izquierda de la pirámide
(Hombres) deben ser representados con números negativos. Simplemente inserta elsigno - antes de cada valor o crea una nueva columna y multiplica la población
masculina por –1.
5. Ya que estas trabajando con grandes poblaciones, debes ajustar la escala de la
figura, expresando los datos en miles. Puedes hacer esto dividiendo cada celda de
datos por 1.000.
6. También puedes transformar los datos de los distintos grupos de edades en porcentaje
respecto a la población total. En una nueva columna divide el valor del grupo de edad entre
el total de la población.
Creación del Gráfico
1. Selecciona todos los datos -excepto el título y la fila Total- haciendo clic con el ratón y
arrastrando a lo largo de los datos de la tabla (A3:C22).
2. Haz clic en el botón As ist ent e para g ráfic os .
Paso 1. Elige Tipo d e gráfico: B arras , y selecciona el subtipo Barra agrup ada .
Pulsa el botón Siguiente.
Pasó 2. Verás la pirámide. Deja los datos como están y pulsa Siguiente.
Pasó 3. Escribe el títu lo de t u gráfi co (p.e., Perú 2001). Deja los otros cuadros en
blanco, y pulsa el botón Siguiente.
Pasó 4. Selecciona el botón En una hoja nueva (llama a esta hoja como desees) y
pulsa el botón Finalizar.
3. Ya tienes tu pirámide. Es hora de mejorar su apariencia:
Arreglar las barras. Haz doble clic en una de las barras del gráfico. En el cuadro de
diálogo Formato de la serie de datos, selecciona la pestaña Opciones . Configura
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 80/146
Estadística General 2012
80 Mg. Miguel Angel Macetas Hernández
Superposic ión a 100 y pulsa Anch o del rango a 0 y pulsa el botón OK. No
cambies nada más. Las barras del gráfico deben aparecer juntas, sin agujeros.
Arreglar el eje vertical (desplazar las etiquetas de edades hacia la izquierda). Haz
doble click en los datos del eje vert ical . En el cuadro de diálogo Formato d e ejes ,
elige la pestaña Tramas y configura los botones de marca de graduación a Ninguno
y el botón de rótulos a Inferior .
Arreglar el eje horizontal (eliminar los valores negativos del eje hombres). Haz
doble clic sobre los datos del eje horizontal . En la pestaña Número selecciona
Categ oría: Person alizad a y escribe en Tipo: 0;0 .
Aplica cualquier otro formato para mejorar la apariencia de la pirámide: colores de
las barras, tamaño y tipo de fuentes y títulos, eliminación de rejilla y fondo...
Edades Hombres Mujeres Totales Edades Hombres Mujeres
0-4 1266429 1203652 2470081 0-4 -5.5 5.2
5-9 1352926 1298331 2651257 5-9 -5.9 5.6
10-14 1269705 1243519 2513224 10-14 -5.5 5.4
15-19 1154745 1145976 2300721 15-19 -5.0 5.0
20-24 1072826 1097428 2170254 20-24 -4.7 4.8
25-29 918063 958505 1876568 25-29 -4.0 4.2
30-34 857675 894850 1752525 30-34 -3.7 3.9
35-39 768107 816358 1584465 35-39 -3.3 3.5
40-44 691549 729825 1421374 40-44 -3.0 3.2
45-49 561907 592190 1154097 45-49 -2.4 2.6
50-54 449661 471292 920953 50-54 -2.0 2.0
55-59 296106 319847 615953 55-59 -1.3 1.4
60-64 238627 261898 500525 60-64 -1.0 1.1
65-69 177284 204213 381497 65-69 -0.8 0.9
70-74 139265 163512 302777 70-74 -0.6 0.775-79 92800 113044 205844 75-79 -0.4 0.5
80 - + 136901 95194 232095 80 - + -0.6 0.4
Totales 11444576 11609634 23054210 Totales -49.6 50.4
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 81/146
Estadística General 2012
81 Mg. Miguel Angel Macetas Hernández
Pirámide Poblacional
Fuente: Instituto Nacional de Estadística e Informática
8.0000 6.0000 4.0000 2.0000 0.0000 2.0000 4.0000 6.0000 8.0000
0-4
5-9
10-14
15-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
75-79
80- +
Mujeres Hombres
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 82/146
Estadística General 2012
82 Mg. Miguel Angel Macetas Hernández
Ejercicios de variables cualitativas
1. Construye una tabla de distribución de frecuencia, haz una gráfica de barras y un
diagrama de pastel para una muestra de compras de refresco según la preferencia
de 50 personas:
Coke Classi Sprite Coke Classic Pepsi-Cola Coke Classic Coke Classic
Pepsi-Cola Diet Coke Coke Classic Diet Coke Coke Classic Coke Classic
Coke Classic Diet Coke Pepsi-Cola Coke Classic Coke Classic Dr. Pepper
Dr. Pepper Sprite Diet Coke Coke Classic Diet Coke Pepsi-Cola
Pepsi-Cola Coke Classic Pepsi-Cola Pepsi-Cola Coke Classic Pepsi-Cola
Coke Classic Coke Classic Pepsi-Cola Dr. Pepper Pepsi-Cola Pepsi-Cola
Coke Classic Coke Classic Coke Classic Coke Classic Sprite Dr. Pepper
Diet Coke Diet Coke Pepsi-Cola Coke Classic Pepsi-Cola Sprite
Sprite Dr. Pepper
2. Según Nielsen Media Research, los cinco programas de TV más vistos a las 8:00 P.M.
del 14 de octubre de 2012 fueron Congo, The X-Files, Holliday in Your Heart, Ellen
Foster y Unhappily Ever After. La lista siguiente es una encuesta entre 50
espectadores.
Unhappily Ellen Congo X-Files Congo Ellen Ellen X-Files
Ellen Ellen X-Files Ellen Holliday X-Files X-Files
Congo Holliday Congo Ellen Congo Holliday X-Files
Ellen Ellen X-Files X-Files X-Files Ellen Holliday
Ellen Ellen Holliday Holliday Ellen Unhapily X-Files
Holliday X-Files X-Files Ellen Congo Holliday Ellen
Holliday Ellen Holliday X-Files Congo Congo Holliday
a) ¿Traza una gráfica de barras y un diagrama de pastel?
b) ¿De acuerdo con la muestra, qué programa tiene la mayor parte del mercado?
3. Se pidió a los alumnos de primer año del Colegio de Administración en la Universidad
que indicaran su campo preferido, y se obtuvieron los siguientes datos.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 83/146
Estadística General 2012
83 Mg. Miguel Angel Macetas Hernández
Campo Alumnos
Administración 55
Contabilidad 51
Finanzas 28
Mer cadotecnia 82
Haz una gráfica de barras y el diagrama de pastel.
4. En el censo de 1960 (Dirección General de Estadística de la Secretaría de Comercio
y Fomento Industrial) se encontró que la distribución del material predominante en los
muros o paredes de las casas era como se muestra en la tabla:
Material de los murosNúmero de
viviendasProporciones Porcentajes
Adobe 3 184 0.499 49.9
Tabique 1 547 0.242 24.2
Madera 558 0.087 8.7
Embarr o 495 0.078 7.8Mamposter ía 171 0.027 2.7
Bloque de material ligero 76 0.012 1.2
Otr os 349 0.055 5.5
Total 6 380 1.000 100.0
Traza un diagrama de pastel.
5. A continuación vemos datos de una muestra de 55 miembros del Salón de la Fama
de Béisbol, en Cooperstown, Nueva York, para cada posición en el campo. En cada
caso se indica la posición principal del jugador: lanzador(P), receptor (H), primera
base (1), segunda base (2), tercera base (3), parador en corto (S), jardinero izquierdo
(L), jardinero central (C) y jardinero derecho (R).
L P C H 2 P R 1 S S 1 L 2 P R P P P P R C S L R P C L C
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 84/146
Estadística General 2012
84 Mg. Miguel Angel Macetas Hernández
P P R P 2 3 P H L P 1 C P P
P P S 1 L R R 1 2 H S 3 H
b) Construye una gráfica de pastel y otra de barras.
c) ¿Qué posición tiene más miembros en el salón de la fama?d) ¿Qué posición tiene menos miembros?
6. Los empleados de Electrónica Moderna tienen un sistema de horario flexible.
Pueden comenzar su jornada de trabajo a las 7:00, 7:30, 8:00, 8:30 o 9:00. Los
datos siguientes representan una muestra de las horas de entrada que
seleccionaron.
7:00 8:30 9:00 8:00 7:30 7:30 8:30 8:30 7:30 7:00
8:30 8:30 8:00 8:00 7:30 8:30 7:00 9:00 8:30 8:00
a) Haz una gráfica de barras y un diagrama de pastel.
b) ¿Qué opinas acerca de las preferencias de los empleados en el sistema de
horarios flexible?
7. .Durante los primeros 11 meses de 1997, los coches Honda Accord, Chevy Cavalier,
Toyota Camry, Honda Civic y Ford Taurus fueron los coches nuevos más vendidos
en USA. Se presentan los datos de 50 compras de automóvil en Cleveland, Ohio.
Taur us Civic Civic Taur us Accord Civic Accord Camry Camry
Taur us Civic Cavalier Cavalier Taurus Accord Cavalier Taur us Taurus
Camry Civic Cavalier Cavalier Camry Accord Camry Cavalier
Camry Camry Camry Civic Camry Camry Accord Civic
Civic Accord Cavalier Cavalier Accord Camry Taur u Taur us
Cavalier Taur us Accord Civic Accord Taurus Accord Camry
Traza un diagrama de pastel y di: ¿Cuál es el coche que más se vende?
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 85/146
Estadística General 2012
85 Mg. Miguel Angel Macetas Hernández
8. Cada una de las 500 empresas Fortune se clasifica como perteneciente a uno de
varios giros industriales. A continuación vemos una muestra de 20 empresas con
su correspondiente ramo industrial.
Compañía Ramo Compañí a Ramo
IBP Alimentos Borden AlimentosIntel Electrónica McDonnell Douglas Aeroespacial
Coca-Cola Bebidas Norton International Prod. Químicos
Unión Carbide Prod. Químicos Quaker Oats Alimentos
General Electric Electrónica Pepsico Bebidas
Motorola Electrónica Maytag Electrónica
Kellog’s Alimentos Textron Aeroespacial
Dow Chemical Prod. Químicos Sara Lee Alimentos
Campbell’s Soup Alimentos Harris Electrónica
Ralston Purina Alimentos Eaton Electrónica
Elabora una distribución de frecuencias que muestre la cantidad de empresas en
cada ramo industrial y traza una gráfica de barras.
9. Para realizar su Índice de Confianza Comercial, la revista Fortune encuestó a 50
altos ejecutivos financieros preguntándoles sus políticas financieras actuales de
presupuesto de capital y publicidad. En Noviembre de 2011, los encuestados
describieron sus políticas como sigue: Agresiva 57%, Cautelosa 29%, Indecisa 14%.
Traza una gráfica de barras y una de pastel que describan las políticas de
dichos ejecutivos.
10. Cuando se les pidió clasificar la destreza que se requiere para obtener una alta
calificación en un nuevo juego de computadoras como principiante, aprendiz,
competidor, maestro o experto, 44 evaluadores respondieron de la manera siguiente:
experto, maestro, maestro, competidor, experto, maestro, maestro, maestro,
experto, aprendiz, maestro, maestro, maestro, maestro, experto, maestro,
competidor, maestro, maestro, principiante, experto, competidor, maestro, maestro,
experto, experto, maestro, maestro, maestro, competidor, competidor, experto,maestro, experto, experto, experto, competidor, maestro, maestro, experto,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 86/146
Estadística General 2012
86 Mg. Miguel Angel Macetas Hernández
competidor, maestro, maestro y experto. Construye una tabla que indique las
frecuencias correspondientes a estas clasificaciones de destreza que se
requiere para obtener una alta calificación.
11. En la siguiente tabla se mue st ra la estructura de la fuerza de trabajo en el Perú, por
sectores de actividad para los años 2009, 2010 y 2011
Actividad 2009 2010 2011
Agr opecuar ia 65.4 58.3 54.3
Minero, metalúrgico y petrolero 1.8 1.2 1.2
Electr icidad 0.2 0.3 0.4
Manuf actur er o 9.0 11.8 13.8
Construcción e instalación 1.8 2.7 3.6
Tr anspor te 2.5 2.5 3.2
Comercio 9.4 8.3 9.1
Otr as 9.9 14.9 14.3
Total 100.0% 100.0% 100.0%
Base de % (miles de habitantes) 5857 8273 11 202
Construye un diagrama de barras y un diagrama de pastel.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 87/146
Estadística General 2012
87 Mg. Miguel Angel Macetas Hernández
III. CAPITULO Medidas de Resumen 3.1 Medidas de resumen para variables cualitativas
En trabajos de investigación frecuencia se utilizan variables cualitativas, bien por su
naturaleza, o por la escala empleada. Por supuesto, una vez que la información se
recogió, es necesario calcular alguna medida de resumen cuyo resultado es un
indicador que deberá analizarse en un momento posterior.
En este tema te presentamos las medidas de resumen para variables cualitativas que
se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de
atención de salud.
3.2 Razón e Índice. Definición. Cálculo e interpretación
Por razón puede entenderse: Una razón es la relación por cociente que se establece entre las unidades de análisis
que pertenecen a un grupo o categoría (a) y las unidades de análisis que pertenecen
a otra categoría (b) de la misma variable. Su expresióngeneral es:
¿Ésa es la definición? No te desanimes, es una medida de fácil comprensión. Te la
explicaremos con un ejemplo:
Supongamos que de los 600 recién nacidos (RN) de un hospital en cierto período, 300
presentaron los ojos oscuros (OO), en tanto que sólo 100 los tenían claros (OC).
Aplicando la expresión general, la razón OO/OC es
La razón ojos oscuros/ojos claros es de 3; o lo que es lo mismo, 3:1.
Pero, ¿qué significa este resultado? Expresa que hay tres recién nacidos con ojos
oscuros por cada recién nacido de ojos claros en ese hospital y en ese período.
Fíjate que el numerador y el denominador son disjuntos, es decir, no se interceptan,
no están contenidos uno en el otro. Ello te ayudará a establecer las diferencias con
las medidas de resumen que estudiarás a continuación.
Si multiplicas el resultado obtenido por 100, entonces el nuevo número se denomina
índice, de tal suerte que en el ejemplo anterior el índice sería 300. En otras palabras,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 88/146
Estadística General 2012
88 Mg. Miguel Angel Macetas Hernández
en el hospital de referencia, en el período estudiado, por cada 100 bebés de ojos
claros hay 300 de ojos oscuros.
Proporción y Porcentaje. Definición. Cálculo e interpretación
Una proporción.- Es la relación por cociente que se establece entre las
unidades de análisis que pertenecen a un grupo o categoría (a) de una variable y el
total de las unidades de análisis estudiadas (a + b). Su expresión general es
. Si
se multiplica su resultado por 100, se obtendrá el porcentaje
Seguiremos utilizando el ejemplo anterior. ¿Lo recuerdas? Por supuesto que sí. Pues
bien, determinemos la proporción de niños con ojos oscuros (300) en la población de
recién nacidos (400):
Alternativamente, puedes calcular el porcentaje:
Nota: Usamos la P con fines ilustrativos, pues la proporción carece de simbología.
Los resultados anteriores significan que tres de cada cuatro recién nacidos tienen los
ojos oscuros; o que el 75 por ciento de los recién nacidos tiene los ojos oscuros (y,obviamente, el 25% los tiene claros).
¿No te resultan familiares estas nuevas medidas, o sea, la proporción y el porcentaje?
Ya debes estarte preguntando la diferencia que existe entre éstas y la distribución de
frecuencias relativas que ya estudiaste. Nada más claro: no es que sean parecidas,
son exactamente las mismas, pero restringidas a variables cualitativas.
Observa que el porcentaje te permite analizar el aporte, el peso específico o la
importancia relativa de cada categoría respecto al total.
Tasas
Siempre que necesites medir el riesgo de que acontezca cierto fenómeno en una
población determinada, dispones de un indicador valioso y único: las tasas
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 89/146
Estadística General 2012
89 Mg. Miguel Angel Macetas Hernández
Una tasa.- Es una relación por cociente que expresa el riesgo de que ocurra cierto
evento en una población y período determinados. Está compuesta por tres elementos,
a saber
Veamos cuáles son esos elementos: El numerador contiene al número de veces que ocurrió determinado fenómeno en
un área geográfica y en un período determinado.
El denominador indica el número de habitantes de la población en la cual puede
ocurrir el fenómeno.
k es un múltiplo de 10 cuyo uso está justificado por el hecho de que habitualmente
el resultado del cociente es un número fraccionario, y al multiplicarlo por una
potencia de 10 se facilita enormemente la lectura y comprensión del indicador.
Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el
numerador en la población involucrada, en el tiempo y lugar establecidos.
Las tasas que más importancia revisten para nuestro desempeño en el campo de la
Salud son las siguientes:
Tasas de importancia Relevante en Salud Tasas relacionadas con la natalidad
Tasas relacionadas con la mortalidad
Tasas relacionadas con la morbilidad
Una particularidad realmente útil de las tasas es que puedes calcularlas tanto para la
totalidad de la población, como para parte de ella (por ejemplo, para el grupo de edad
de cinco a nueve años, para los estudiantes, para los residentes del área rural, y así
por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o
solamente para una de ellas (o un grupo de ellas). De este modo, tendrás calculadas
tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda
la población o al total de causas; al tiempo que habrás calculado tasas específicas si
incluían a una parte de la población o a una causa o grupo de ellas.
Así las cosas, estarás en plena facultad de hallar tasas brutas de mortalidad, de
natalidad, o bien específicas por edad, por sexo, por edad y sexo a la vez, entre
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 90/146
Estadística General 2012
90 Mg. Miguel Angel Macetas Hernández
muchas otras. Teniendo a tu disposición los datos adecuados, podrás hallar una tasa
tan específica como desees.
Existe en punto cardinal en el manejo de las tasas: la población expuesta al riesgo en
cuestión. Como ya sabes, este es el denominador de la ecuación, y de su correcta
determinación depende la fidelidad del cálculo. Nunca serán suficientes las medidas
que tomes para asegurarte que estás empleando el dato acertado. No creas que es
muy difícil saber que estás errado o en lo cierto, el problema radica en que muchas
veces se pasa por alto este “detalle” de forma involuntaria.
Probablemente te habrás preguntado: «Bueno, ¿y qué tanto problema con el
denominador?»
¡Ah! Es que ahí radica el quid de la cosa. Recuerda que calculas una tasa para medir
el riesgo de ocurrencia de un evento o fenómeno en una población, pero no en
cualquier población, sino en la población expuesta a ese riesgo. Esto quiere decir que
sólo podrás calcular la tasa de mortalidad por cáncer de útero en las mujeres de cierta
ciudad, puesto que sería imposible calcularla en los hombres; del mismo modo que no
puedes calcular la tasa de morbilidad por cáncer de pulmón de los habitantes de Perú
en 2009, utilizando para ello a los habitantes del Perú en el año 2009.
¿Satisfecha tu inquietud?
También haz de saber que las poblaciones están sometidas a constantes cambios en
lo que a su número atañe, determinados por los nacimientos y defunciones y por
los movimientos migratorios (emigración e inmigración), que provocan que no sea la
misma a lo largo de todo el año. De ahí que, por convenio, se tome la población
existente a mediados del período 11 o población media para el cálculo de las tasas.
Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones
pequeñas, como la que usualmente manejan los Consultorios, pues suelen volverse
inestables, ya que cualquier evento “mueve“ mucho la tasa, y a veces no guarda
relación el resultado obtenido con la magnitud del evento acontecido.
Bueno, ya estamos en condiciones de particularizar en las tasas más relevantes en la
práctica diaria.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 91/146
Estadística General 2012
91 Mg. Miguel Angel Macetas Hernández
Tasas relacionadas con la natalidad
El estudio de la natalidad está relacionado con el número de nacimientos ocurridos en
una población y tiempo determinados, así como la distribución que siguen de acuerdo
con ciertas características. Como ves, todo gira en torno a la medición de la misma, y
una de las formas de conseguirlo es utilizando las tasas.
Ahora nos tropezamos con una contrariedad: la población expuesta al riesgo es muy
difícil de definir, ya que tener un hijo no involucra a toda la parte femenina de la
población, y va más allá, pues otros factores de índole psicosocial actúan en tal
decisión. Por estas razones, verás que se han buscado soluciones alternativas a esta
situación.
Tasa bruta de natalidad
Comencemos por la tasa bruta de natalidad. La misma expresa cómo se comportan
los nacimientos en un área y tiempo determinados. Su cálculo es sencillo:
Por ejemplo, la tasa cruda de natalidad de Perú en 2008 fue:Total de nacidos vivos en Perú durante 2008: 151 08012
Total de habitantes en Perú durante 2008: 11 122 308.
Bien, ya tienes el número calculado. Pero, ¿es suficiente con eso? Claro que no,
necesitas saber qué significa, a fin de manejarlo apropiadamente. En primer lugar,
debes informar el resultado de la siguiente forma: «La tasa bruta de natalidad de Perú
en 2008 fue de 14 nacidos vivos por cada 1000 habitantes», ello significa que durante
2008 en Cajamarca nacieron como promedio 14 niños por cada 1 000 habitantes.
Esta tasa tiene el inconveniente de no tomar en cuenta a las personas realmente
expuestas al evento, pero por su sencillez y facilidad de comprensión es la
medida más generalmente utilizada.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 92/146
Estadística General 2012
92 Mg. Miguel Angel Macetas Hernández
De ahora en adelante nos limitaremos a enseñarte cómo calcular e interpretar el
indicador. Continuemos entonces.
Tasa general de fecundidad
Este indicador mide la natalidad, pero tomando en cuenta solamente a la población
femenina en edad reproductiva o fértil (15 a 49 años). El hecho de que se restringe el
denominador no inyecta especificidad a la tasa, pues continúa siendo una mezcla de
diversos grupos de edades con situaciones diversas; amén de que se mueve a la par
de la tasa cruda de natalidad. Se calcula de la siguiente forma:
Así, la tasa de Cuba en 2008 fue:
Interpretación: En Perú, durante 2008, nacieron como promedio 49 niños por cada
1000 mujeres en edad fértil (15 a 49 años).
Tasa de fecundidad específica por edad
Esta es una tasa específica, que usualmente se calcula para grupos quinquenales
comprendidos entre 15 y 49 años.
Interpretación: Durante 2008 en Perú nacieron como promedio 56 niños por cada
1000 mujeres de 15 a 49 años de edad.
Tasas de mortalidad
La medición de la mortalidad tiene como fin conocer el número de defunciones
ocurridas en cierta población durante un período dado, a la vez que se estudia su
distribución relacionándolas con diversas características de dicha población.
Entrando en la materia que nos ocupa, te decimos a continuación las tasas que
podrás calcular.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 93/146
Estadística General 2012
93 Mg. Miguel Angel Macetas Hernández
Tasa bruta de mortalidad
Esta tasa expresa el riesgo que tienen todos los habitantes de cierta población, en un
momento dado, de morir por cualquier causa.
En 2008, en nuestro país esta tasa fue:
Esto significa que en 2008, en Perú fallecieron como promedio 7 personas por cada
1000 habitantes.
Tasa de mortalidad por edad
Ahora te presentamos una tasa de mortalidad específica, que solo mide el riesgo de
morir que tienen las personas del grupo de edad analizado. Su cálculo se logra
restringiendo el denominador a las personas de la edad deseada, e incluyendo en el
numerador a los fallecidos en esa edad.
Por ejemplo, en 2008, en Perú, la tasa de mortalidad en personas de 60 años y más
fue:
Tasa de mortalidad por sexo
El cálculo de esta tasa es muy similar a la anterior, con la diferencia de que te
restringes a un sexo en particular. Expresa el riesgo de morir de las personas de ese
sexo en esa población, en el período especificado. Para calcularla, sustituye elnumerador por el total de defunciones del sexo analizado, y el denominador por el
total de habitantes de ese sexo en el lugar y momento deseados.
En nuestro país, durante 2008 la tasa de mortalidad del sexo femenino fue:
Interpretación: en Perú, en 2008 fallecieron como promedio 6 mujeres por cada 1000féminas.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 94/146
Estadística General 2012
94 Mg. Miguel Angel Macetas Hernández
Tasa de mortalidad por causa
Análogamente, puedes conocer el riesgo a que están sometidos los habitantes de
cierto lugar, en un momento definido, de morir por una causa de muerte dada. Ahora
el numerador está formado por las defunciones debidas a la causa en cuestión,
mientras que el denominador incluye al total de población.
En Perú, durante 2008 la tasa de mortalidad por enfermedades del corazón fue:
Interpretación: en Perú, en 2008 fallecieron como promedio 193 personas por
enfermedades del corazón por cada 100 000 habitantes
Tasa de mortalidad infantil
Arribamos a un punto de suma importancia al analizar la situación de salud de una
comunidad. Este indicador es una especie de diana hacia la cual se dirigen los ojos de
todo aquel que, avezado o no, se tome interés en el estudio de las características de
una población.Es un indicador que toma como población expuesta al riesgo a los nacidos vivos en
período estudiado, y se calcula de la siguiente forma:
A partir del triunfo revolucionario, este indicador ha mostrado una tendencia
descendente, llegando a alcanzar en los dos últimos años cifras inferiores a 8,
incluyéndose de esta forma entre los países de más baja tasa a escala mundial. En2008, la tasa cubana fue:
Ello significa que en 2008, en Cuba fallecieron como promedio 7 niños por cada 1000
nacidos vivos.
Este indicador tiene la singularidad de que puede descomponerse en varios
indicadores, que miden con más especificidad el comportamiento de la mortalidad enel menor de un año. Estos componentes son los siguientes:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 95/146
Estadística General 2012
95 Mg. Miguel Angel Macetas Hernández
1. Tasa de mortalidad neonatal precoz
Al calcular esta tasa conocerás el riesgo de morir de los bebés con menos de
siete días de nacidos. Su cálculo estriba en sustituir el numerador de la TMI por
las defunciones ocurridas en recién nacidos de menos de siete días en el período
y lugar estudiados. En 2008 tuvimos una TMNP de 2.9 por 1000 NV. De este
modo, puedes decir que en Perú, durante 2008, fallecieron como promedio 3
niños de menos de 7 días por cada 1000 nacidos vivos.
2. Tasa de mortalidad neonatal tardía
Conforme calculaste el riesgo de muerte de los bebitos menores de siete días,
puedes conocer también el de siete en adelante y menores de 28 días, cerrando
así el diapasón en la etapa neonatal de la vida. Sólo tienes que sustituir el
numerador de la tasa anterior por las defunciones de niños de 7 - 27 días en la
población de tu interés, durante el período que necesites.
Para nuestro país la TMNT en 2008 fue de 1.4 por cada 1000 nacidos vivos, lo
que quiere decir que en 2008, en Perú falleció como promedio 1 niño de 7 a 27
días por cada 1000 nacidos vivos.
3. Tasa de mortalidad posneonatal
Ahora determinarás el riesgo de muerte de los niños mayores de 28 días y
menores de un año. Con sólo sustituir el numerador de la TMI por las defunciones
acaecidas en los bebés de 28 días a 11 meses, 29 días y 23:59 horas, habráscumplido tu cometido.
El que el denominador, de los tres componentes de la mortalidad infantil, sea el
mismo le imprime a estas tasas una peculiaridad: se puede obtener la mortalidad
infantil mediante la simple suma de sus componentes, o lo que es lo mismo, los
componentes de la mortalidad infantil son sumables.
En Perú, durante 2008, tuvimos una TMP de 2.8 por 1000 NV. Dicho sea con
otras palabras: en 2008, en Perú fallecieron como promedio 3 niños mayores de28 días y menores de un año por cada 1000 nacidos vivos.
Tasa de mortalidad perinatal
Esta es una tasa especial que mide el riesgo de morir en los momentos cercanos al
nacimiento.
Se calcula de la siguiente forma:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 96/146
Estadística General 2012
96 Mg. Miguel Angel Macetas Hernández
Donde:
DFT: defunciones fetales tardías (edad materna igual o superior a las 28
semanas, o peso fetal de 1000 gramos o más).
DNP: defunciones neonatales precoces (defunciones en el menor de siete días).
NV: nacidos vivos
Tasa de mortalidad materna
Aquí tienes otro de los indicadores más celosamente cuidados por todo el personal de
salud, bien sabes de ello. La lógica aspiración de todo país interesado realmente en
exhibir indicadores de salud ejemplares, es mantener esta medida en niveles bajos,
juntamente con la tasa de mortalidad infantil, entre otros. Su cálculo comprende algo
que puede inducir extrañeza: el denominador está formado por los nacidos vivos del
lugar y tiempo escogidos. Al analizarlo con detenimiento verás que resulta lo más
indicado, ya que brinda una estimación mejor del riesgo puesto que este indicador
solamente toma en cuenta las defunciones maternas producidas por complicaciones
del embarazo, parto o puerperio (entendido como los 42 días siguientes al parto).
La TMM fue de 47.7 por 100 000 NV en 2008 para nuestro país. Esto quiere decir que
por cada 100 000 nacidos vivos, murieron en promedio 48 mujeres por causas
directamente relacionadas con el embarazo, parto y puerperio durante 2008 en Perú.
Tasas de morbilidad
La morbilidad, entendida como el patrón de enfermedades que sufren los habitantes
de alguna región, puede ser estudiada numéricamente mediante las tasas de
morbilidad. Ellas son la tasa de incidencia, la tasa de prevalencia y la tasa de
letalidad.
La tasa de incidencia (TI) mide el riesgo que tiene una persona que habita en un lugar
y tiempo determinados, de contraer o adquirir cierta enfermedad, visto esto en función
del tiempo. Por su lado, la tasa de prevalencia (TP) mide el riesgo de tener la
enfermedad, o sea, de estar enfermo; y la tasa de letalidad (TL) expresa la gravedadde la enfermedad.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 97/146
Estadística General 2012
97 Mg. Miguel Angel Macetas Hernández
Comparación de tasas
En ocasiones, pretendemos comparar los riesgos de morir, de enfermar, etc. entre
distintas poblaciones o entre distintas categorías o clases de una variable. Para ello,
lo más conveniente es utilizar la tipificación, bien por el método directo o por el
indirecto; técnicas que no se expondrán en este curso, pues se abordarán en cursos
posteriores. Esta técnica solo sirve para comparar, sus resultados no miden en modo
alguno el riesgo de ocurrencia de los eventos estudiados en la población
Resumen
En este tema estudiaste que:
MEDIDAS RESUMEN VARIABLES CUALITATIVAS 41
1. Las medidas de resumen para datos cualitativos más frecuentemente utilizadas
son las razones, las proporciones y las tasas.
2. Cada uno de esos indicadores tiene diferente interpretación. Así, los más
refinados son las tasas, pues expresan el riesgo de ocurrencia del evento
consignado en su numerador.
3. Debes tener cuidado al calcular las tasas para poblaciones pequeñas, por
ejemplo, en el Consultorio Médico de la Familia, porque suelen ser inestables.
4. Las tasas pueden dividirse en generales y específicas.
5. En el ámbito sanitario, las tasas más usadas son las de natalidad, mortalidad y
morbilidad.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 98/146
Estadística General 2012
98 Mg. Miguel Angel Macetas Hernández
Ejercicios
Un grupo de investigadores recogió algunos datos relacionados con la población
cubana del año 2008, con el objetivo de confeccionar indicadores que reflejaran la
situación del país.
Debido a un virus informático, se estropeó parte de la información almacenada. A
continuación te mostramos los datos que se pudieron recuperar. A partir de los
mismos, ¿podrías ayudarnos a completar las partes faltantes? Para ello, calcula e
interpreta los indicadores solicitados.
Información recogida por los investigadores
Nacidos vivos bajo peso: 10 145
Población total: 11 122 308
Nacidos vivos: 151 080
Defunciones totales: 77 558
Total de hombres: 5 571 882
Total de consultas médicas y estomatológicas: 100 819 793
Fallecidos de 15 a 49 años: 10 057
Total de mujeres: 5 550 426
Fallecidos menores de un año: 1 070
Fallecidos de la provincia Guantánamo: 2 722
Casos diagnosticados por enfermedad meningocócica: 44 Fallecidos mayores de 28 días y menores de 12 meses: 417
Población de Guantánamo: 508 864
Hombres fallecidos por tumores malignos: 9 126
Total de nacidos vivos en Sancti Spíritus: 5 642
Mujeres fallecidas: 34 692
Fallecidos menores de 7 días: 435
Población de 15 a 49 años: 6 117 424 Fallecidos mayores de 7 días y menores de 27 días: 218
Nacidos vivos de la provincia Guantánamo: 7 939
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 99/146
Estadística General 2012
99 Mg. Miguel Angel Macetas Hernández
3.3 Medidas de resumen para variables cuantitativas.
3.3.1 Medidas de Posición Centrales (Tendencia Central)
Se calcula una medida de tendencia central cuando se necesita un valor único que
resuma una serie de datos; por ejemplo: si se presentara la información de
ingresantes a Universidad en el año 2012, se puede decir que la edad mediana de los
postulantes fue de 18 años.
1. La Media AritméticaEs la medida de tendencia central con la cual probablemente esté usted más
familiarizado es la media aritmética; se conoce también como media o promedio; se
representa como x y se conoce como "x barra"; la fórmula para calcularla es:
1.1. Para Datos Sin Agrupar
media x x
n
i
Se lee así: la media es igual a “la suma de las x’s dividido por n”.
Ejemp lo Datos Sin Agrupar
En un brote de hepatitis A, 6 personas iniciaron síntomas 24 a 31 días después de la
exposición. Calcule el promedio del período de incubación en éste brote; los períodos
de incubación para las personas afectadas (Xi) fueron:
29, 31, 24, 29,30 y 25
Pasó Uno Para calcular el numerador sume las observaciones individuales
x = 29+31+24+29+30+25= 168
Paso Dos para calcular el denominador cuente el número de las observaciones: n = 6
Paso Tres Para calcular la media divida el numerador sumatoria de las
observaciones) entre el denominador (número de las observaciones).
Entonces, el promedio del período de incubación del brote es 28 días
Aplicación de la función de Excel en la Media Aritmética Para Datos Sin Agrupar
Se ingresan los datos de los días de incubación desde la celda A1 hasta la A6 y se la
función PROMEDIO(A2:A6)
media x
29 31 24 29 30 25
6
168
6 28 días
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 100/146
Estadística General 2012
100 Mg. Miguel Angel Macetas Hernández
8755540
2235
40
350535,5524163,5435162,564,5xmedia ,
1.2.Para Datos Agrupados
Intervalos
de clases
Marca de
clase
Frecuenci
a
Absolutasxi ni
(Li-1 Li ] xi ni
16 – 27 21,5 3 64,5
27 – 38 32,5 5 162,5
38 – 49 43,5 10 435
49 – 60 54,5 3 163,5
60 – 71 65,5 8 524
71 – 82 76,5 7 535,5
82 – 93 87,5 4 350
Total 40 2235
n
nxxmedia
ii
Marca de Clase
Frecuencia absoluta
Total de Observaciones
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 101/146
Estadística General 2012
101 Mg. Miguel Angel Macetas Hernández
Interpretación: El puntaje promedio en el rendimiento de la línea de acción
educativa de Lenguaje de una muestra de 40 alumnos es 55,875.
1.3. Propiedades de la Media. Aritmética.
Sean: x e y : variable
k : constante
M [ ] : Operador Media Aritmética.
a) M [k] = k
b) M [x + k] = M[x] + k
c) M[kx] = kM[x]
d) M [x y] = M[x] M [y]
e) M[x - μ] = 0
f) f) M ((X –M)2) es mínimo si K = X
La media aritmética es un indicador de posición sensible a valores extremos.
2. La Mediana (Me)Otra medida de tendencia central es la mediana; como se verá es especialmente útil
cuando los datos están sesgados.
Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos
que han sido colocados en orden. Específicamente, la mediana es el valor que divide
una serie de datos en dos mitades con una mitad de las observaciones mayores que
ésta y la otra mitad menores a la mediana.
Para Datos Sin Agrupar
Ejemplo Al tener los siguientes datos de presión arterial sistólicas: 110, 120, 122, 130,
180 Mm. de Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego
entonces, la mediana es 122 Mm. de Hg., el valor de la 3ª observación. Al obtener la
media (132) ésta sería mayor que 4 de los 5 valores.
Cómo Identificar la Mediana de Datos Individuales
Paso Uno Ordene los datos de menor a mayor o viceversa
Paso Dos Encuentre el rango medio con la siguiente fórmula
2
1n
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 102/146
Estadística General 2012
102 Mg. Miguel Angel Macetas Hernández
Rango mediano =
a. Si el número de observaciones (n) es impar el rango medio cae en una
observación.
b. n es par el rango medio cae entre dos observaciones.
Paso Tres Identifique el valor de la mediana
a. Si el rango medio cae en una observación específica (n = impar) la mediana es
igual al valor de ésta observación.
b. Si el rango medio cae entre dos observaciones (n = par) la mediana es igual
al promedio (media aritmética) del valor de estas observaciones.
Ejemplo con Número Impar de Observaciones:
n = 5 13, 7, 9, 15, 11
1. Ordenar de mayor a menor: 7, 9, 11, 13, 15 o viceversa: 15, 13, 11, 9, 7.
2. Encontrar el rango mediano
Rango mediano =
Entonces, el rango medio cae en el valor de la 3ª observación.
3. Identificar el valor de la mediana que es igual al valor de la tercera observación
n = 11
Ejemplo con número par de Observaciones:
n = 6: 15, 7, 13, 9, 10, 11
1. Ordenar los datos 7, 9, 10, 11, 13, 15
2. Encontrar el rango medio
Rango mediano =
Entonces, el rango medio cae entre el valor de la 3ª y la 4ª observación.
3
2
15
2
1n
53
2
16
2
1n,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 103/146
Estadística General 2012
103 Mg. Miguel Angel Macetas Hernández
3. Identificar el valor de la mediana que es igual al promedio de la 3ª y 4ª
observación
Mediana =
En contraste con la media, la mediana no está influenciada por valores
extremos.
Aplicación de la función de Excel en la Mediana Para Datos Sin Agrupar
Se ingresan los datos desde la celda A1 hasta la A6 y se la función MEDIANA(A2:A6)
Para Datos Agrupados
Para calcular la mediana (Me) a partir de una tabla de frecuencias debe
determinarse las frecuencias absolutas acumuladas Ni, que permite conocer hasta
que el valor de la variable o intervalo se tienen acumulado el 50% de n;
Se Calcula con la Siguiente Fórmula:
Donde
5102
1011,
j
n
1 jN
2
n
jc
i jLMe
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 104/146
Estadística General 2012
104 Mg. Miguel Angel Macetas Hernández
jN
2
n
1 jN
n j
n = número total de datos u observaciones
N j = es una Ni inmediata superior a
N j-1 = es una Ni inmediata inferior a
Lj-1 = extremo inferior del Intervalo Mediano
IMe = es el intervalo que corresponde a N j
n j = es el n j que le corresponde al Intervalo Mediano
C j = amplitud del intervalo mediano
Ejemplo
Calcular el puntaje de rendimiento mediano en la línea de acción educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aquí n = 40 luego se compara con los N i se obtiene que 20,observando en la tabla este valor no coincide con algún N i, está entre 18 y 21,
es decir: 18 < 20 < 21
Intervalos de
clases
Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 – 27 n1 = 3 N1 = 3
I2 27 – 38 n2 = 5 N2 = 8
I3 38 – 49 n3 = 10 N3 = 18
I4 49 – 60 n4 = 3 N4 = 21
I5 60 – 71 n5 = 8 N5 = 29
I6 71 – 82 n6 = 7 N6 = 36
I7 82 – 93 n7 = 4 N7 = 40Total 40
Reemplazar los valores obtenidos en la fórmula de Me:
202
40
2
n
2
n
IMe=
N j-1
N j
L j-1
3356Me
33563
182
40
1149Me
,
,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 105/146
Estadística General 2012
105 Mg. Miguel Angel Macetas Hernández
Interpretación, significa que 20 alumnos tienen calificación iguales o inferiores a
56,33 puntos, y los 20 alumnos restantes (el otro 50%) tienen una calificación superior
a 56,33 puntos
3. Moda (Mo) (Valor Modal o Promedio Típico)
La moda es el valor que ocurre más frecuentemente en una serie de datos
1.3.1. Para Datos Sin Agrupar
Ejemplo:
a) El conjunto: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 6 tiene la Mo = 1
b) El conjunto: 4, 8, 12, 15, 26, 35 no tiene moda
c) El conjunto: 1, 3, 5, 5, 5, 7, 7, 9, 9, 9, 11 tiene dos modas, 5 y 9 es una distribución
“Bimodas”.
Aplicación de la función de Excel en la Moda Para Datos Sin Agrupar
Se ingresan los datos desde la celda A2 hasta la A12 y se la función
MODA.VARIOS(A2:A12)
1.3.2. Para Datos Agrupados
Cuando los datos se agrupan en una tabla de distribución de frecuencias, el
modo es el punto medio o marca de clase que contiene la mayor frecuencia.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 106/146
Estadística General 2012
106 Mg. Miguel Angel Macetas Hernández
21
1i1 j
dd
dCLMo
Se Calcula con la Siguiente Formula
Donde
Lj-1 = Límite inferior del Intervalo Modal
C j = Amplitud del intervalo Modal
d1 = n j – n j –1
d2 = n j – n j+1
Ejemplo
Calcular el puntaje de rendimiento más frecuente en la línea de acción
educativa de Lenguaje de una muestra de 40 alumnos de un determinado
centro educativo
Intervalos de ClasesFrecuencia
Absolutas
(Li-1 Li ] ni
I1 16 – 27 n1 = 3
I2 27 – 38 n2 = 5
I3 38 – 49 n3 = 10
I4 49 – 60 n4 = 3
I5 60 – 71 n5 = 8
I6 71 – 82 n6 = 7
I7 82 – 93 n7 = 4
Total 40
Reemplazando los valores obtenidos en la formula:
Interpretación La Moda indica que la calificación más frecuente en los 40
alumnos es 42,5833 puntos, o también la mayoría de los alumnos tienen una
calificación aproximados a los 42,5833 puntos.
IMo=
L j-1
n j-1
n j+1
n j
5833,42310510
5101138Mo
5833,42310510
5101138Mo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 107/146
Estadística General 2012
107 Mg. Miguel Angel Macetas Hernández
Características de las Medidas de Posición Centrales
Media Aritmética
1. Es una medida totalmente numérica o sea sólo puede calcularse en datos de
características cuantitativas.2. En su cálculo se toman en cuenta todos los valores de la variable.
3. Es lógica desde el punto de vista algebraico.
4. La media aritmética es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmética es única, o sea, un conjunto de datos numéricos tiene una
y solo una media aritmética.
Mediana
1. En su cálculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lógica desde el punto de vista algebraico.
Moda
1. En su cálculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el método de
designación de los intervalos de clases.
3. No está definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 108/146
Estadística General 2012
108 Mg. Miguel Angel Macetas Hernández
EJERCICIOS PROPUESTOS
1. Una empresa grande de equipos deportivos está probando el efecto de dos planes
publicitarios sobre las ventas de los últimos 4 meses. Dadas las ventas que se ven
aquí, ¿cuál programa de publicidad parece producir el crecimiento promedio más
alto en ventas mensuales?
Mes Plan 1 Plan 2
Enero 1657,0 4735,0
Febrero 2008,0 5012,0
Marzo 2267,0 5479,0
Abril 3432,0 5589,0
2. Los estadísticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus
servicios. El número de comidas diarias que suministran aparece en la siguiente
tabla de frecuencia. Calcular la media, mediana y la moda e intérprete.
Número de comidas por día Número de días
0 - 5 3
5 - 10 6
10 - 15 5
15 - 20 8
20 - 25 2
25 - 30 3
3. Bill Karl compró 20 acciones a $ 15 cada una, 50 acciones a $20 cada una,100
acciones a $30 cada una y 75 acciones a $35 cada una. ¿Cuál es el precio
promedio por acción?.
4. Dado el siguiente cuadro estadístico con ancho de clase constante igual a 20.
Determine la media de los datos.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 109/146
Estadística General 2012
109 Mg. Miguel Angel Macetas Hernández
si
L L i X
ni Ni iin X
880
1950
35 1800
13200)
4 70
5. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el
siguiente histograma de frecuencias, entonces la nota promedio del curso es:
6. En una encuesta sobre los ingresos anuales en miles de soles de un grupo de
familias se obtuvo la siguiente información:
si
L L in
10 – 30 20
30 – 50
50 – 70
70 - 90 20
Además, 54 x y 5/1/ 32 nn , calcular el número de familias con ingreso no
menos de 50 mil soles.
7. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que
la moda es 60 y pertenece al tercer intervalo.
si L L
in
16 – 32 6
0
2
4
6
8
10
12
14
16
4 6 8 10 12 14
N ú m e r o d e A l u m n o s
Notas
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 110/146
Estadística General 2012
110 Mg. Miguel Angel Macetas Hernández
32 – 48 n
48 – 64 8
64 – 80 3n
80 - 96 3
8. Dada la siguiente distribución de frecuencias, calcular el valor de “n” sabiendo que
la mediana vale 6.61 y que pertenece al quinto intervalo.
si
L L in
20 – 30 3
30 – 40 1
40 – 50 2
50 – 60 6
60 – 70 n
9. El salario promedio mensual pagado a los trabajadores de una compañía es de 200
dólares. Los salarios promedios mensuales pagados a hombres y mujeres de la
compañía son 210 y 150 respectivamente. Determinar el porcentaje de hombres y
mujeres que trabajan en la compañía.
10. Las ganancias diarias de los establecimientos de un centro comercial se presentan
en una tabla de frecuencias con 6 intervalos de clase y se sabe que: la mínima
ganancia es de $6, el rango es 36, el promedio de ganancias diarias es $25.14, el
50% de los establecimientos ganan más de 25.58 dólares diarios, H2=0.15,
N2=120, h3=0.25, H5=0.93, n4=304, n2=2n1. Reconstruir la distribución de todas las
frecuencias y hallar la ganancia más frecuente y la ganancia promedio.
11. Una compañía minera tiene 100 trabajadores. Para los nombrados el haber
máximo es 450 dólares y el mínimo 60 dólares. Hay un 5% de eventuales (en
prueba) que trabajan ad-honorem o perciben compensaciones inferiores a $60.
Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan
haberes inferiores a $400. Con esta información, calcule las medidas de tendencia
central posibles.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 111/146
Estadística General 2012
111 Mg. Miguel Angel Macetas Hernández
12. La siguiente distribución muestra la producción diaria de un pozo de petróleo (en
barriles) durante n días. Halle la medida de tendencia central más adecuada y
explique por qué su uso.
Producción Porcentaje
Menos de 206 20 %
206 – 214 25%
214 – 222 18%
222 – 230 15%
230 – 238 13%
Más de 238 9%
13. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg. ¿
Cuántos estudiantes hay en cada grupo?.
14. En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15
estudiantes mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad
media de la clase?.
15. Las temperaturas registradas en una ciudad, en grados Fahrenheit (°F), fueron: 51,60, 58, 62, 57, 49, 52, 62, 61 y 63. Determinar la Media en grados centígrados (°C)
sabiendo que: C=(5/9)(F-32).
16. De una muestra de tamaño tres se sabe: la suma de los cubos de las tres
observaciones es 1971, la media aritmética es 7 y la mediana es 6. Calcular el
valor de cada una de las observaciones.
17. Cien estudiantes divididos en cuatro grupos A, B, C y D dan un examen y obtienen
un promedio general de 72 (calificación centesimal). Los puntajes medios de los
grupos A, B, C son 75, 62 , 80, respectivamente. Los registros del grupo D se
extraviaron; pero se sabe que en el grupo A están el 40% del total de alumnos, en
el grupo B un cuarto del total, en el grupo C habían 15 alumnos más que en el
grupo D. Determinar el promedio del grupo D.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 112/146
Estadística General 2012
112 Mg. Miguel Angel Macetas Hernández
18. En una empresa el sueldo promedio por trabajador es de 360 dólares mensuales,
los trabajadores manuales constituyen el 40% del total y reciben el ¼ del monto
dela planilla, ¿cuánto recibe en promedio cada trabajador manual?.
19. Los costos de fabricación, en soles, de diez objetos son los siguientes: 9.35, 9.46,
9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es
3 veces su costo de fabricación menos 5 soles, calcular la utilidad media por objeto.
20. De las edades de cuatro personas, se sabe que la media es igual a 24 años, la
mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.
21. Para calcular el suministro de agua que una ciudad requiere mensualmente, se
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros
cúbicos; 11.2, 21.5, 16.4, 19.7, 14.6, 16.9, 32.2, 18.2, 13.1. 23.8, 18.3, 15.5, 18.8,
22.7, 14.0. Si en la ciudad hay 5,000 familias, ¿cuántos metros cúbicos de agua se
requieren mensualmente si el consumo promedio por familia permanece igual?.
22. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo más 10 soles a
cada uno. Si la empresa dispone a lo más de S/. 94,000 para pagar sueldos, ¿cuálalternativa es más conveniente?.
23. Al calcular la media de 125 datos, resultó 42. Un chequeo posterior mostró que en
lugar del valor 12.4 se introdujo 124. Corregir la media.
24. De una central telefónica salieron 70 llamadas de menos de 3 minutos
promediando 2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de3 minutos, promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos
promediando 15 minutos. Calcular la duración promedio de todas las llamadas.
25. Cuatro fábricas A, B, C y D, producen un mismo objeto. La fábrica B produce el
doble de C, la D 10% menos que la C y la A el 60% menos que la B. Los costos de
producción (en dólares) por unidad de estas fábricas son respectivamente: 0.2, 0.3,
0,2, y 0.5. Calcular el precio medio de venta si se quiere ganar el 20% por unidad.
26. El sueldo medio de los obreros de una fábrica es de $286.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 113/146
Estadística General 2012
113 Mg. Miguel Angel Macetas Hernández
a) ¿Que porcentajes de hombres y mujeres trabajan en la fábrica si sus sueldos
medios respectivos son $300 y $260?.
b) Si el 60% de los obreros tienen menos de 30 años y percibe el 20% del total de
los sueldos, ¿cuánto es el sueldo medio de los obreros de al menos 30 años?
27. En una empresa donde el sueldo medio es de $400 se incrementa un personal
igual al 25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3
meses más tarde se incrementan cada sueldo en 20%, más 30$, ¿cuánto es el
nuevo salario medio?.
28. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 07,
08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del número de alumnosrespectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. ¿Cuánto es la media, la mediana y la
moda de las notas?, ¿qué valor escogería como el promedio?.
29. Los sueldos en una empresa varían de $300 a $800 distribuidos en forma simétrica
en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos en el primer,
segundo y tercer intervalo respectivamente. Calcule los diferentes indicadores de
tendencia central.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 114/146
Estadística General 2012
114 Mg. Miguel Angel Macetas Hernández
4. Media Geométrica: G X , G La media geométrica proporciona una medida precisa de un cambio porcentual
promedio en una serie de números.
Se utiliza con más frecuencia para calcular la tasa de crecimiento porcentual
promedio de series de datos, a través del tiempo.
Es una medida de tendencia central por lo general menor que la media aritmética
salvo en el extraño caso en que todos los incrementos porcentuales sean iguales,
entonces las dos medias serán iguales.
Se le define como la raíz enésima del producto de “n” valores. Cuando los datos
son bastantes o cantidades grandes, para facilitar el cálculo se lo debe simplificar
pero sin alterar su naturaleza, para lo cual se puede utilizar los logaritmos de base
10.
CÁLCULO DE LA MEDIA GEOMÉTRICA:
a) Datos Originales:
nn
i
nnG Xi x x x X
1
1
21 ,...,
b) Datos agrupados
n
l
ni
m
i
n n
m
nnG Xi x x x X m
....,1
2121
Aplicando logaritmos tenemos:
Xi Xinin
X
m
i
G loglog11
Entonces:
xG X
log10
La media geométrica se utiliza los datos tienen crecimiento geométrico: población, montos de
capital, producción
1.3.3. Propiedad:G X < X
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 115/146
Estadística General 2012
115 Mg. Miguel Angel Macetas Hernández
Ejemplo
La media geométrica es útil en el cálculo de tasas de crecimiento; por ejemplo, si el
crecimiento de las ventas en un pequeño negocio son 3%, 4%,8%,9% y 10%, hallar la media
de crecimiento.
Respuesta: 6.128%
Utilizando logaritmo
Empleando Excel se calcula insertando la función MEDIA.GEOM.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 116/146
Estadística General 2012
116 Mg. Miguel Angel Macetas Hernández
Calcular la tasa de crecimiento promedio a la que ha variado las ventas de cierto producto
con base a la siguiente tabla:
Mes Enero Febrero Marzo Abril Mayo Junio
Ventas 500 550 600 700 800 850
Solución:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los
obtenidos el mes anterior.
Mes VentasPorcentaje del
mes anterior
Enero 500
Febrero 550 550/500=1,100
Marzo 600 600/550=1,091
Abril 700 700/600=1,167
Mayo 800 800/700=1,143
Junio 850 850/800=1,063
Calculando la media geométrica se obtiene:
Restando 1 para convertirlo a un incremento mensual promedio da 1,112-1 =0,112, o un
incremento promedio de 11,2% para el período de 6 meses.
Comprobación:
Mes Ventas Ventas calculadas con G
Enero 500Febrero 550 500 x 1.112 = 556,000
Marzo 600 556 x 1.112 = 618,272
Abril 700 618,272 x 1.112 = 687.518
Mayo 800 687,518 x 1,112 = 764.52
Junio 850 764.52 x 1.112 = 850.146
Se puede observar que el valor de 850.146 calculado con la media geométrica es
semejante al valor de venta real de 850, por lo tanto el valor calculado para la media
geométrica está correcto.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 117/146
Estadística General 2012
117 Mg. Miguel Angel Macetas Hernández
Para Datos Agrupados en Tablas de Frecuencias
Se emplea la siguiente ecuación:
∑
Donde:
ni = frecuencia absoluta de cada dato xi
Ejemplo
Calcular la media geométrica para las siguientes calificaciones de Estadística:
xiin
4 5
6 8
8 9
9 10
10 8
Solución: Se llena la siguiente tabla, realizando los cálculos respectivos:
xi ni log xi log x
i ni
4 5 0.602 3.010
6 8 0.778 6.225
8 9 0.903 8.128
9 10 0.954 9.542
10 8 1.000 8.000
Total 40 34.906
Se aplica la siguiente ecuación para obtener la respuesta.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 118/146
Estadística General 2012
118 Mg. Miguel Angel Macetas Hernández
5. Media Armónica: H X , H La media armónica se define como el recíproco de la media aritmética de los
recíprocos
PROPIEDADES
Es un promedio que se utiliza para el cálculo del costo promedio y todo tipo de variables
expresadas en tasas o porcentajes. como por ejemplo: velocidad/distancia,
productividad/tiempo, etc
La media armónica no está definida en el caso de la existencia en el conjunto de
valores nulos.
Cuando la unidad constante o unidad de evaluación es igual a la unidad del numerador
de una razón, se usa el promedio armónico, y si es igual a la unidad del denominador se usa el
promedio aritmético.
CÁLCULO DE LA MEDIA ARMÓNICA:
a) Datos Originales:
n
i
H
Xi
n X
1
1
Ejemplo:
La velocidad de producción de azúcar de tres máquinas procesadoras son 0,5, 0,3 y 0,4
minutos por kilogramo. Hallar el tiempo promedio de producción después de una jornada de
4800 minutos del proceso
Solución:Como en la razón minutos/kilogramos (min/kg) cada máquina trabaja 4800 min, la razón
contante es el tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador,
por lo tanto se debe emplear el promedio armónico
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 119/146
Estadística General 2012
119 Mg. Miguel Angel Macetas Hernández
Empleando Excel se calcula insertando la función MEDIA.ARMO
b) Datos Agrupados:
Se emplea cualquiera de las siguientes ecuacion
n
i
H
Xi
ni
n X
1
Propiedad:
H X < G X < X
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran en
realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en
realizar la obra un obrero tipo (un obrero promedio).
Tiempo Obreros
4 4
5 5
6 7
7 2
9 2
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 120/146
Estadística General 2012
120 Mg. Miguel Angel Macetas Hernández
Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuación
n
i
H
Xi
ni
n X
1
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran
para resolver una prueba de Estadística determinados estudiantes. Calcular el tiempo
promedio que se demora en resolver la prueba un estudiante tipo.
Tiempo Estudiantes
[40-50) 4
[50-60) 8
[60-70) 10
[70-80) 7
[80-90] 11
Solución: Realizando los cálculos respectivos se obtiene:
ni xi ni/xi
[40-50) 4 45 0,089
[50-60) 8 55 0,145
[60-70) 10 65 0,154
[70-80) 7 75 0,093
[80-90] 11 85 0,129
Total 40 0,611
Aplicado la ecuación se obtiene:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 121/146
Estadística General 2012
121 Mg. Miguel Angel Macetas Hernández
IV. CAPITULO Estadígrafos de Tendencia No central
4.1.Estadígrafos de Tendencia No central
La medida de posición no central son valores cuyas posiciones en las series ordenadas
de los datos permiten dividir a estos en grupos, cada grupo contiene igual número
(porcentaje). A estas medidas se conocen con el nombre genérico de cuant i les . Los
cuantiles más importantes son los cuartiles
A. Los Cuartiles
Para Datos No Agrupados
La posición o ubicación de los cuartiles se encuentra aplicando la siguiente ecuación:
Donde
n = Número total de datos
K = Número del cuartil
Ejemplo
Encuentre los cuartiles dada la siguiente distribución, y represéntelos gráficamente
mediante un diagrama de caja y bigotes: 6, 9, 9, 12, 12, 12, 15 y 17
Solución:
Para calcular los cuartiles se ordena los datos de menor a mayor
6 9 9 12 12 12 15 17
Aplicando la ecuación para el cuartil uno se obtiene:
[ ]
Como la posición del cuartil 1 es 2.5, su valor es el promedio de los datos segundo y
tercero
O también la posición 2.5 dice que el cuartil 1 está ubicado al 50% del trayecto
comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1=
9+0.5 (9-9) = 9
Interpretación: Este resultado indica que el 25% de los datos es inferior a 9
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 122/146
Estadística General 2012
122 Mg. Miguel Angel Macetas Hernández
En Excel se calcula insertando la función CUARTIL.INC
Aplicando la ecuación para el cuartil dos se obtiene:
[ ]
O también la posición 4.5 dice que el cuartil 2 está ubicado al 50% del trayectocomprendido entre el cuarto dato, que es 12 y el quinto dato que también es 12, es
decir,
Q2= 12+0,5(12-12) = 12
Interpretación: Este resultado indica que el 50% de los datos es inferior a 12
Aplicando la ecuación para el cuartil tres se obtiene:
[ ]
O también la posición 6,5 dice que el cuartil 2 está ubicado al 50% del trayecto
comprendido entre el doceavo dato, que es 12 y el quinceavo dato que 15, es decir,
Q3= 12+0,5(15-12)
Q3= 12+0.5 (3)=12+1,5=13,5
Interpretación: Este resultado indica que el 75% de los datos es inferior a 13,5
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 123/146
Estadística General 2012
123 Mg. Miguel Angel Macetas Hernández
B. Para elaborar un diagrama de caja y bigotes es necesario saber:
Un diagrama de caja y bigotes es una representación gráfica que ayuda a visualizar
una distribución de datos: caja desde Q1 a Q3 (50% de los datos), y bigotes el
recorrido (distancia desde valor mínimo hasta el valor máximo).
Para elaborar un diagrama de caja se procede de la siguiente manera:
a) Se marca los valores de la serie de datos sobre el eje horizontal o vertical.
b) Se ubica sobre el eje el valor mínimo, primer cuartil, mediana o segundo cuartil,
tercer cuartil y el valor máximo.
c) Se construye un rectángulo (caja) paralelo al eje, de longitud desde Q1 a Q3 y
anchura arbitraria.
De acuerdo al ejemplo ilustrativo se tiene:
Valor mínimo = 6
Q1 = 9
Q2 = 12
Q3 = 13,5
Valor máximo = 17
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 124/146
Estadística General 2012
124 Mg. Miguel Angel Macetas Hernández
n j
j
1J
j1i jn
N4
jn
CLQ
Datos agrupados
Los cuartiles son estadígrafos de posición que dividen al total de las observaciones,
debidamente ordenados o tabulados, en cuatro partes de igual tamaño.
Para calcular los cuartiles se utiliza la siguiente formula
DondeL j-1 = Límite inferior del Intervalo del CuartilC j = Amplitud del intervalo Cuartill j = El número de Cuartil j = 1, 2 y 3n = Número total de observaciones o datos.N j = Es un inmediato superior a
4
jn
N j-1 = Es una Ni inmediata inferior a 4 jn
n j = Es el n j que le corresponde al Intervalo
a) Primer Cuartil (Q1)
Calcular el puntaje de rendimiento mediano en la línea de acción educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aquí n = 40 y j =1 luego se compara con los N i se obtiene que 10,observando
En la tabla este valor no coincide con algún Ni, está entre 8 y 10, es decir: 8 < 10 <
18
Intervalos declases
Frecuencia Absolutas
Frecuencias Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 – 27 n1 = 3 N1 = 3
I2 27 – 38 n2 = 5 N2 = 8
I3 38 – 49 n3 = 10 N3 = 18
I4 49 – 60 n4 = 3 N4 = 21
I5 60 – 71 n5 = 8 N5 = 29
I6 71 – 82 n6 = 7 N6 = 36
I7 82 – 93 n7 = 4 N7 = 40
Total 40
10
4
40x1 jn
4
IQ1=
N j-1
N j
L j-1
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 125/146
Estadística General 2012
125 Mg. Miguel Angel Macetas Hernández
24010
8101138Q1 ,
n j
Reemplazando los valores obtenidos en la fórmula:
Interpretación Que el 25% del total de alumnos, es decir 10 de ellos tienen una puntuación
inferior o igual a 40,2 puntos, y los 30 restantes, o sea el 75% de trabajadores, tienen un
puntaje superior a 40,2 puntos.
b) Segundo Cuartil (Q2)
Calcular el puntaje de rendimiento mediano en la línea de acción educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aquí n = 40 y j =2 luego se compara con los N i se obtiene que 20,observando
En la tabla este valor no coincide con algún Ni, está entre 18 y 21, es decir:
18 < 20 < 21
Intervalos declases
Frecuencia Absolutas
Frecuencias Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 – 27 n1 = 3 N1 = 3
I2 27 – 38 n2 = 5 N2 = 8
I3 38 – 49 n3 = 10 N3 = 18
I4 49 – 60 n4 = 3 N4 = 21
I5 60 – 71 n5 = 8N5 = 29
I6 71 – 82 n6 = 7 N6 = 36
I7 82 – 93 n7 = 4 N7 = 40
Total 40
Reemplazando los valores obtenidos en la fórmula:
20440x2 jn
4
IQ2=
N j-1
N j
L j-1
33563
1840x2
11492
Q 4 ,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 126/146
Estadística General 2012
126 Mg. Miguel Angel Macetas Hernández
n j
Interpretación Que el 50% del total de alumnos, es decir 20 de ellos tienen una puntuación
inferior o igual a 56,33 puntos, y los 20 restantes, o sea el 50% de trabajadores, tienen un
puntaje superior a 56,33 puntos.
c) Tercer Cuartil (Q3)Calcular el puntaje de rendimiento mediano en la línea de acción educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aquí n = 40 y j =3 luego se compara con los Ni se obtiene que
30, observando en la tabla este valor no coincide con algún N i, está entre 29 y 36, es
decir:
29 < 30 < 36
Intervalos declases
Frecuencia Absolutas
Frecuencias Absolutas
Acumuladas
(Li-1 Li ] ni Ni
I1 16 – 27 n1 = 3 N1 = 3
I2 27 – 38 n2 = 5 N2 = 8
I3 38 – 49 n3 = 10 N3 = 18
I4 49 – 60 n4 = 3 N4 = 21
I5 60 – 71 n5 = 8 N5 = 29
I6 71 – 82 n6 = 7 N6 = 36
I7 82 – 93 n7 = 4 N7 = 40
Total 40
Reemplazando los valores obtenidos en la fórmula:
Interpretación Que el 75% del total de alumnos, es decir 30 de ellos tienen una puntuación
inferior o igual a 39,57 puntos, y los 10 restantes, o sea el 25% de trabajadores, tienen unpuntaje superior a 39,57 puntos.
30
4
40x3 jn
4
IQ3=
N j-1
N j
L j-1
57397
2940x3
11713
Q 4
,
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 127/146
Estadística General 2012
127 Mg. Miguel Angel Macetas Hernández
C. Deciles
Definición
Son cada uno de los 9 valores D1, D2, D3, D4, D5, D6, D7, D8, D9 que dividen a la
atribución de los datos 10 partes iguales.
El primer decil es igual al décimo percentil (D 1=P1), el segundo decil es igual a
veinteavo percentil (D2=P20), y así sucesivamente.
Para Datos No Agrupados
La posición o ubicación de los deciles se encuentra aplicando la siguiente ecuación
Donden = Número total de datos
K = Número del cuartil
Ejemplo
Ejemplo:
Calcular el quinto decil de la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17
Solución:
Para calcular los deciles se ordena los datos de menor a mayor.
6 9 9 12 12 12 15 17
Aplicando la ecuación para el quinto decil se obtiene:
[
]
O también la posición 4,5 dice que el decil 5 está ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que también es 12, es
decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 128/146
Estadística General 2012
128 Mg. Miguel Angel Macetas Hernández
j
J
ji jn
N jn
C L D1
110
Como D5 es igual a P50 se introduce la función PERCENTIL.INC
Datos Agrupados en Tablas de Frecuencia
Se emplea la misma ecuación utilizada en el cálculo de los deciles para datos sin
agrupar.
Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuación:
Donde
L j-1 = Límite inferior del Intervalo de clase del decilC j = Amplitud del intervalo Decil j = El número de Decil j = 1, 2, 3,…,9 n = Número total de observaciones o datos.N j = Es un inmediato superior a
10
jn
N j-1 = Es una Ni inmediata inferior a10
jn
n j = Es el n j que le corresponde al Intervalo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 129/146
Estadística General 2012
129 Mg. Miguel Angel Macetas Hernández
D. Percentiles o Centiles
Son cada uno de los 99 valores P1, P2, P3,……..P99 que dividen atribución de los
datos en 100 partes iguales.
Datos No Agrupados
La posición o ubicación de los percentiles se encuentra aplicando la siguiente
ecuación:
Donde:
n = número total de datos
k = número del percentil
Ejemplo:Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en
kg) 80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solución:
Se ordena los datos de menor a mayor se tiene:
65 65 67 68 70 72 72 73 78 80
1) Cálculo del percentil de orden 20 se obtiene:
[ ]
En Excel se obtiene un valor aproximado insertando la función PERCENTIL.INC
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 130/146
Estadística General 2012
130 Mg. Miguel Angel Macetas Hernández
j
J
ji jn
N jn
C L P 1
1
100
Cálculo del percentil de orden 33 se obtiene:
[ ]
Datos Agrupados en Tablas de Frecuencia
Se emplea la misma ecuación utilizada en el cálculo de los percentiles para datos sin
agrupar.
c) Para Datos Agrupados en Intervalos
Se emplea la siguiente ecuación:
Donde
L j-1 = Límite inferior del Intervalo de clase del Percentil
C j = Amplitud del intervalo Percentil
j = El número de Percentil j = 1, 2, 3,…,99
n = Número total de observaciones o datos.
N j = Es un inmediato superior a100
jn
N j-1 = Es una Ni inmediata inferior a100
jn
n j = Es el n j que le corresponde al Intervalo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 131/146
Estadística General 2012
131 Mg. Miguel Angel Macetas Hernández
EJERCICIOS
1. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la
nación reportadas aparecen en la siguiente tabla de frecuencias. Calcule e
interprete la media, la mediana y la moda. Además, calcule e interprete: Q1, Q2, D10,
D60, P15, P90.
Edades Frecuencias
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
2. La siguiente información corresponde al consumo mensual en combustible
destinado a calefacción, expresado en miles de $, en una muestra aleatoria de
hogares de un barrio de Santiago, durante los meses de invierno:
Consumo($miles) Nº de casos
4 – 6 176 – 8 26
8 – 10 14
10 – 12 9
12 –14 11
a. ¿Qué consumo deja bajo sí al 25% de los consumos más bajos?
b. ¿Qué consumo deja sobre sí al 15% de los consumos más altos?3. La siguiente distribución corresponde a la recaudación de impuestos de 40
contribuyentes. (Recaudación de impuestos en miles de pesos).
[L i −1 − L
i ] xi ni a) ¿Cuál es la recaudación correspondiente a
cuartil 1? Interprétela.
b) ¿Cuál es la recaudación correspondiente al
Percentil 65? Interprétela.
c) ¿Bajo qué recaudación están el 20% de lasrecaudaciones menores?
50- 70 60 2
70- 90 80 15
90 - 110 100 8
110 - 130 120 12130 150 140 3
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 132/146
Estadística General 2012
132 Mg. Miguel Angel Macetas Hernández
2
QQQ 13
V. CAPITULO Medidas de Dispersión
5.1. Medidas de dispersión
Las medidas de dispersión permiten calcularla representatividad de una medida de
posición, para lo cual será preciso cuantificar la distancia de los diferentes valores de
la distribución respecto a dicha medida. A tal distancia es a lo que, en términos
estadísticos, denominaremos variabilidad o dispersión de la distribución. Las medidas
de dispersión tienen como finalidad estudiar hasta qué punto, para una determinada
distribución de frecuencias, las medidas de tendencia central o de posición son
representativas como síntesis de toda la información de la distribución. Medir la
representatividad de una medida de posición equivale a cuantificar la separación de
los valores de la distribución respecto a dicha medida. Entre los estadígrafos de
Dispersión de mayor uso se tiene:
A. Recorrido o rango (R)
El recorrido do un conjunto de observaciones es simplemente la diferencia entre el
mayor y menor valor de la variable.
En datos no agrupados:
R = Xmax – Xmin
B. Recorrido Semi Cuartil (Q)
La desviación cuartil de un conjunto de datos está definido por
Donde Q1 y Q3 son el primer y tercer cuartil de los datos. A veces se usa el
"Recorrido Intercuartil Q3 – Q1". El recorrido semi-intercuartil o desviación cuartil,da una idea de la dispersión del 50% de los datos centrales.
C. Varianza (s2)
Es el estadígrafo de dispersión más importante. y expresa el grado de dispersión
de las observaciones respecto a la media aritmética. Se denota por s 2; V(X); V(Y);
2; etc.
La varianza se define como:
"La varianza es la media o promedio del cuadrado de las desviaciones de la
variable respecto a su media".
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 133/146
Estadística General 2012
133 Mg. Miguel Angel Macetas Hernández
1n
nxxs
i
2
i2
1n
n
nxnx
s
2
ii
i
2
i2
1769157140 40
1030432652
s
2
2
,
,
La expresión de la definición, también se escribe:
Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) 0
b) V (k) = 0c) V (x + k) = V(x)
d) V (kx) = K2 V(X)
Si tenemos una muestra tamaño n la dividimos en r sub muestras determinando en
cada una de ellas sus respectivas medias, entonces la media total se determina por la
formula siguiente:
n
ni X X
n
niS
X
n
i
t
r
i
T
1
1
1
2)(
Intravarianza + Intervarianza
[Li-1 – Li) Xi ni xi ni i
2
i nx
0,2 – 7,2 3,7 3 11,1 41,07
7,2 – 14,2 10,7 5 53,5 572,45
14,2 – 21,2 17,7 8 141,6 2506,32
21,2 – 28,2 24,7 5 123,5 3050,4528,2 – 35,2 31,7 10 317 10048,9
35,2 – 42,2 38,7 4 154,8 5990,76
42,2 – 49,2 45,7 5 228,5 10442,45
Total 40 1030 32652,4
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 134/146
Estadística General 2012
134 Mg. Miguel Angel Macetas Hernández
sXV
100x
SCV
%,
,
,6874644648
7525
10053712CV
D. Desviación Estándar o Típica (s)
La desviación estándar o típica, se define como la raíz cuadrada de la varianza
5370221121769157 ,,
Es uno de los estadígrafos de dispersión de mayor uso, en si cual las unidades de
la variable ya no están elevadas al cuadrado. La desviación estándar, al igual que
la varianza, es no negativa (s ≥ 0), puesto que es la raíz cuadrada positiva de la
varianza. A mayor dispersión le corresponderá una mayor desviación estándar.
NOTA: En general, los estadígrafos de dispersión se usa para comparar dos o más
distribuciones o poblaciones. A mayor dispersión o heterogeneidad entre losvalores o elementos de una población, le corresponde un valor mayor para
el estadígrafo de dispersión.
E. Coeficiente de Variación (CV)
Está definido por la expresión:
El valor se expresa en términos porcentuales. Una regla empírica, cuando el CV
< 33% los datos no presentan dispersión en los datos recolectados ó los datos
son más homogéneos
Datos presentan dispersión
0%<CV<5%, Altamente representativa.
5%<CV<10%, Representativa de su serie.
10%<CV<15%, moderadamente representativa
15%<CV<30%, Bajo grado de representatividad.
CV>30%, No tiene ningún grado de representatividad
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 135/146
Estadística General 2012
135 Mg. Miguel Angel Macetas Hernández
MoMe
X
MoMe
X
VI. CAPITULO Estadígrafos de Deformación
Asimetría.-Es el grado de deformación de la curva representativa de una distribución de frecuencias
con respecto a la vertical que pasa por la abscisa de la media aritmética; se mide a
través del Coeficiente de Asimetría.
A. Relación Entre La Media, Mediana y Moda
La distribución de frecuencias de un conjunto de datos puede ser simétrica o
asimétrica.
B. Distribución Simétrica
Una distribución es simétrica cuando su grafica semeja una de las tres curvas:
Curva hipotéticaNormal
Curva hipotética enU
Curva hipotéticaRectangular
Curva Unimodal
Curva Bimodal
Curva sin moda Me = X = Mo X = Me X = Me
Distribución Positivamente Asimétrica
Es una distribución donde los valores extremos son observaciones mayores. La
grafica es semejante a la siguiente curva hipotética.
Distribución Negativa Asimétrica Es una distribución donde los valores extremos son observaciones menores. Lagrafica presenta una prolongación hacia la izquierda, como la siguiente curvahipotética.
Curva Positivamente Asimétrica (o Curva
con Sesgo Positivo).
Curva Unimodal
Mo < Me < X
Curva Negativa Asimétrica (o Curva con
Sesgo Negativo).
Curva Unimodal
Mo > Me > X
Me = X = Mo X = Me X = MeMo Mo
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 136/146
Estadística General 2012
136 Mg. Miguel Angel Macetas Hernández
Mo = 3 Me – 2 X
Relación Emperica Entre Media, Mediana y Moda
Cuando la distribución es casi simétrica, se puede utilizar la fórmula de la moda
empírica dad por: Moda = 3(Mediana) – 2(Media)
C. Importancia de la Asimetría.-
El conocimiento de la asimetría es importante por el hecho de que la teoría estadística
se basa a menudo en el supuesto de una distribución normal. Por lo tanto una medida
de asimetría de una distribución es necesario para preservarnos de las consecuencias
de esta suposición (La condición necesaria de una distribución normal es que sea
simétrica).
D. Coeficiente de Asimetría.
Consideramos varias fórmulas para el cálculo de la medida de asimetría:
Coeficiente de Asimetría en base a Momentos.
sn
n ) x- x( = A 3
i
3
im1
S
Primero y segundo coeficiente de asimetría de PEARSON
A.S
MoXAS1
; Denominado primer coeficiente de Parson.
B.S
)MeX(3AS2
; Denominado segundo coeficiente de Pearson.
Coeficiente de Asimetría cuartílico o de ARTHUR BOWLEY
13
123
QQ2QAS
Decisión:
As=0, entonces la distribución es simétrica.
As<0, entonces la distribución es asimétrica (-)
As>0, entonces la distribución es asimétrica (+)
E. Kurtosis o Apuntamiento.-
Es la mayor o menor altura de la curva representativa de una distribución de
frecuencias en el punto o abscisa correspondiente a la media aritmética.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 137/146
Estadística General 2012
137 Mg. Miguel Angel Macetas Hernández
j
1J
j1ir n
N100
rn
CLP
KURTOSIS EN FUNCIÓN DE MOMENTOS:
media : x ; M
M =
sn
n ) x- x( = K
22
4
4
i
4
im1
Decisión:
K=3, Entonces la distribución posee una curva mesocúrtica (Normal).
K<3, Entonces la distribución posee una curva platicúrtica.
K>3, Entonces la distribución posee una curva leptocúrtica.
KURTOSIS EN FUNCIÓN DE CUARTILES Y PERCENTILES.
1090
13
2 P P
QQ K
Donde:
Los percentil P90 y P10 se calcula con lasiguiente fórmula:
Decisión:
K=0.263, la distribución es mesocúrtica.
K<0.263, la distribución es platicúrtica.
K>0.263, la distribución es leptocúrtica.
L j-1=Limite inferior del Intervalo del Percentil
C j =Amplitud del intervalo Percentilico
r = El número de Percentill r = 1,2,3,…,99
n = Número total de observaciones o datos.
N = Es un inmediato su erior a100
jn
100
jn
D. Leptocúrtica
D. Mesocúrtica (Normal )
D. Platicúrtica
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 138/146
Estadística General 2012
138 Mg. Miguel Angel Macetas Hernández
Ejemplo. Calcular el grado de asimetría y kurtosis de la distribución del nivel de glucosa de los60 varones adultos evaluados. Los cálculos son organizados en la tabla, de modoque reemplazando datos en fórmula se tiene:
Distribución del Nivel de Glucosa de 60 varones adultos
(Li-1 Li] xi n Xini X2ni i
3
i n)XX( i
4
i n)XX(
35 45 40 5 200 8000 -158773.1481 5027816.358
45 55 50 7 350 17500 -71199.0741 1542646.605
55 65 60 11 660 39600 -17467.5926 203788.5802
65 75 70 14 980 68600 -64.8148 108.0246914
75 85 80 8 640 51200 4629.6296 38580.24691
85 95 90 7 630 56700 43134.2593 790794.7531
95 105 100 4 400 40000 90981.4815 2577808.642
105 115 110 4 440 48400 225314.8148 8637067.901
Total 60 4300 330000 116555.556 18818611.111
Coeficiente Asimetría =3
8
1
3)(
n
n xii
=3)076.19(*60
56.116555 = 0.2799,
Coeficiente Kurtosis =4
8
1
4
*
)(
n
n xii
=4)076.19(*60
1111.18818611 = 2.3686
Por tanto se puede afirmar que la distribución empírica es: Aprox. Simétrica, puesto que AS = 0.28 0
Platicúrtica, puesto que K = 2.37 < 3.Entonces se puede concluir que dicha distribución difiere ligeramente de la normal.2.4. Aplicaciones de las medidas en datos univariados
Ejemplo 1. Los siguientes datos constituyen las vidas útiles en horas. de una muestraaleatoria de 60 bombillas de luz de 100 watts.
807 811 620 660 817 732 747 823 844 907660 753 1050 918 857 867 675 880 878 890881 872 869 841 847 833 829 827 822 811766 787 923 792 803 933 947 717 817 7531056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891a) Clasifique convenientemente con Anchos de Clase iguales y trace el Polígono de
Frecuencias Absolutas.b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas útiles oscilan
entre 700 y 1000 horas.c) Encuentre los límites que sub-clasifiquen las bombillas en tres categorías con referencia
a su duración. El 15 % más durables en la categoría A El 15 % menos .durables en la categoría C. El resto en la categoría B
SoluciónCálculos previos para elaborar la tabla Recorrido (R) =1088 – 620 = 468
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 139/146
Estadística General 2012
139 Mg. Miguel Angel Macetas Hernández
Elegimos el número de Intervalos (m) = Tomamos m = 6 intervalos
Determinar la amplitud de los intervalos (C)
a) Clasifique convenientemente con Anchos de Clase iguales
CUADRO Nº 01DISTRIBUCIÓN DE DATOS CONSTITUYEN LAS VIDAS ÚTILES EN HORAS. DE UNA
MUESTRA ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS.
Vida útil en horas
[Li-1 – Li>
Marcade
clase
Númerode
Bombillas
Frecuencia Acumulada
Simple
FrecuenciaRelativa
FrecuenciaRelativa
Acumuladaxi ni Ni hi Hi
[620 – 698> 659 4 4 0,0667 0,0667[698 – 776> 737 7 11 0,1167 0,1833[776 – 854> 815 23 34 0,3833 0,5667
[854 – 932> 893 15 49 0,2500 0,8167[932 – 1010> 971 5 54 0,0833 0,9000[1010 – 1088> 1049 6 60 0,1000 1,0000
Total 60 1,0000
El Polígono de Frecuencias Absolutas.Para graficar el polígono de frecuencias se realiza algunos cálculos
Vida útil en horas
[Li-1 – Li>
Marca declase
Número deBombillas
xi ni
581 0[620 – 698> 659 4[698 – 776> 737 7[776 – 854> 815 23[854 – 932> 893 15[932 – 1010> 971 5[1010 – 1088> 1049 6
1127 0Total 60
GRAFICO Nº 01POLÍGONO DE FRECUENCIA DE LA VIDA ÚTIL EN HORAS DE UNA MUESTRAALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS
0
4
7
23
15
56
00
5
10
15
20
25
581 681 781 881 981 1081
N ú m e r o d e b o m b i l l a s
Vida promedio en horas de bombillas de luz de 100 watts.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 140/146
Estadística General 2012
140 Mg. Miguel Angel Macetas Hernández
b) Una vez clasificadas; determine el porcentaje de bombillas cuyas vidas útiles oscilanentre 700 y 1000 horas.
Vida útil en horas
[Li-1 – Li>
Número deBombillas
FrecuenciaRelativa
FrecuenciaRelativa
ni hi hi %[620 – 698> 4 0,0667 6,667[698 – 776> 7 0,1167 11,667
[776 – 854> 23 0,3833 38,333[854 – 932> 15 0,2500 25,000[932 – 1010> 5 0,0833 8,333[1010 – 1088> 6 0,1000 10,000
Total 60 1,0000 100,000Calculamos el número de observaciones pedido:
698 a 776 11,66667 78 11,6667
698 a 700 x 2 xPara encontrar el valor 698 a 700 = 11,6666667 – 0,2991453 = 11,3675214
932 a 1010 8,3333 78 8,333
932 a 1000 x 68 xPara encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 =81,966% El 15 % más durables en la categoría A
Basta calcular el percentil 15 y el percentil 85
Ejemplo 2. En la siguiente distribución de frecuencias relativas calcular:a) Las desviación cuartillitab) Discutir el sesgo y la kurtosisTiempo 0 → 3 3 → 6 6 → 9 9 → 12 12 → 15 15 → 18
hi 0,04 0,06 0,40 0,38 0,10 0,02Solución
Tiempo Xi hi Hi xi hi xi2 hi
0 → 3 1,5 0,04 0,04 0,06 0,093 → 6 4,5 0,06 0,10 0,27 1,215
6 → 9 7,5 0,40 0,50 3,00 22,5
9 → 12 10,5 0,38 0,88 3,99 41,895
12 → 15 13,5 0,10 0,98 1,35 18,225
15 → 18 16,5 0,02 1,00 0,33 5,445Total 1 9 89,37
Directamente de la tabla: media aritmética 9iih x x
Varianza 37,8937,89 2222 X h xS ii
Desviación estándar S = 2,89309523
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 141/146
Estadística General 2012
141 Mg. Miguel Angel Macetas Hernández
Medio
40%
Bajo
45%
Alto
15%
a) Las desviación cuartillita
b) Discutir el sesgo y la kurtosis
No podemos concluir que la distribución sea simétrica. En efecto, como la media está a laderecha de la moda la distribución es sesgada a la derecha y usando el primer Coeficientede Pearson tenemos:
Como Sk > 0 la distribución es ligeramente sesgada a la derecha
Como es K>0.263, puede considerarse la distribución que es Leptocúrtica
Ejemplo 3. Al investigar el nivel socioeconómico en los valores: Bajo (B), Medio (M), Alto(A),20 familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Construir la distribución de frecuencias y trazar su gráfica.
Nivelsocioeconómico
FrecuenciaAbsoluta
FrecuenciaRelativa
Medio 8 40,0Bajo 9 45,0 Alto 3 15,0Total 20 100
89
3
0
2
46
8
10
Medio Bajo Alto N ú m e r o d e F a m i l i a s
Nivel Socioecónomico
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 142/146
Estadística General 2012
142 Mg. Miguel Angel Macetas Hernández
VII. CAPITULO Regresión y Correlación Lineal
Regresión y Correlación Lineal
Son dos herramientas para investigar la dependencia de una variable dependiente Y en
función de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, también se llama regresor orespuesta
X = Variable independiente, también se llama variable explicativa, regresor o predictor
Regresión lineal - La relación entre X y Y se representa por medio de una línea recta
Regresión curvilinea - La relación entre X y Y se representa por medio de una curva.
La ecuación de la recta es la siguiente:
El término de error es la diferencia entre los valores reales observados Y i y los valores
estimados por la ecuación de la recta. Se trata de que estos sean mínimos, para lo cual
se utiliza el método de mínimos cuadrados.
Se trata de minimizar la suma de todos los errores o residuos:
Las fórmulas resultado de la minimización de lo cuadrados del error se aplicarán en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la recta de regresión
poblacional
2. Las varianzas de los errores son las mismas en todos los valores de X
(Homoscedasticidad) en caso contrario se tiene (Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algún patrón definido.
estimadaregresiónde Modelo X bbY
muestraladedatosenbaseCone X bbY
poblaciónlaenbaseCon X Y
...................
.................
.............
10
*
10
10
e b b
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 143/146
Estadística General 2012
143 Mg. Miguel Angel Macetas Hernández
El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la
fuerza de la relación entre las variables X y Y, puede asumir valores entre -1 y 1 para
correlación negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra
que la variable presión tiene una correlación positiva con el rendimiento de una caldera,
se deben buscar soluciones al problema mediante acciones asociadas con la variable
presión; de lo contrario, sería necesario buscar la solución por otro lado.
Se identifican tres medidas de desviación como sigue:
Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo
está relacionado con su número. Calcular el coeficiente de correlación y graficar. Los datos
de tiempo tomados para n = 25 servicios se muestran a continuación:
X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X) 2 (Yi-Y)2 Yest Error
2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 144/146
Estadística General 2012
144 Mg. Miguel Angel Macetas Hernández
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
Sxy Sxx Syy = SST SSE
X
promedio Y Promedio
Sxy Sxx Syy
Si todos los puntos estuvieran completamente sobre la recta la ecuación lineal sería
y = a + bx. Como la correlación no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los cálculos tomando las sumas de
cuadrados siguientes se muestran a continuación:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
Las ecuaciones para el cálculo manual son las siguientes:
XX
XY
S
S
X Xi
Y Yi X Xi
b
211 )(
))((ˆ
b = 2.902704421
X Y
Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 145/146
Estadística General 2012
145 Mg. Miguel Angel Macetas Hernández
X Y n
X Y b
ii b
b b ˆ
ˆˆ
1
00
= 5.114515575
Las sumas de cuadrados son:
2)( Y Y SST i 6,105.9447
22 ))*1(()ˆ( iiii X bboY Y Y SSE 220.0926
SSE SST SSR 5,885.8521
El coeficiente de determinación r 2
y el coeficiente de correlación r se calculan acontinuación:
SST
SSR
SST
SSE SST
SST
SSE r
)(12 = 0.9639
El coeficiente de determinación indica el porcentaje de la variación total que es explicada
por la regresión.
2r r = 0.9816
El coeficiente de correlación proporciona el nivel de ajuste que tienen los puntos a la línea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlación r es
un número entre –1 (correlación negativa evidente) y +1 (correlación positiva evidente), y r
= 0 indicaría correlación nula.
El coeficiente de correlación r = 0.98 por lo cual tenemos suficiente evidencia estadística
para afirmar que el tiempo de atención está relacionado con el número de servicios
atendidos.
7/17/2019 Estadistica Elemental
http://slidepdf.com/reader/full/estadistica-elemental-568c7722d19d8 146/146
Estadística General 2012
EJERCICIOS:
1. La energía consumida en un proceso depende del ajuste de máquinas que se realice,
realizar una regresión cuadrática con los datos siguientes y responder las preguntas.
Cons_energía Ajuste Máq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.736.2 29.1
a. Trazar un diagrama de dispersión
b. Obtener la ecuación de regresión lineal y cuadrática y comparar
c. Estimar el consumo de energía para un ajuste de máquina de 20 con regresión
cuadrática
d. Obtener los intervalos de predicción y de confianza para un ajuste de máquina de 20
e. Obtener el coeficiente de correlación y de determinación