Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
Asignatura: Estadística Descriptiva
Docente:Ing. Priscila Crespo Ayala
Semestre: Quinto
2
Ing. Priscila E. Crespo Ayala, Mgs.
G U I A D E E S T U D I O S
CARRERA: Tecnología Superior en Redes y Telecomunicaciones
NIVEL: Tecnológico
TIPO DE CARRERA: Tradicional
NOMBRE DE LA ASIGNATURA: Estadística Descriptiva
CODIGO DE LA ASIGNATURA: RT-S5-ESDE
PRE – REQUISITO: Costos y Presupuestos
CO – REQUISITO: Sin correquisito
TOTAL HORAS: 64
Componente Docencia: 36 horas
Componente Práctica: 18 horas
Componente Autónomo: 10 horas
SEMESTRE: Quinto
PERIODO ACADÉMICO: Junio 2020 – Noviembre 2020
MODALIDAD: Presencial
DOCENTE RESPONSABLE: Ing. Priscila Esperanza Crespo Ayala, Mgs.
Copyright©2020 Instituto Superior Tecnológico Ismael Pérez Pazmiño. All rights reserved.
Estadística Descriptiva
3
INDICE
PRESENTACIÓN ................................................................................................................................ 5
SYLLABUS DE LA ASIGNATURA .................................................................................................. 7
ORIENTACIONES PARA EL USO DE LA GUÍA DE ESTUDIOS ............................................. 19
DESARROLLO DE ACTIVIDADES ............................................................................................... 21
Unidad didáctica I: .......................................................................................................................... 21
Título de la Unidad Didáctica I: Análisis Estadístico. ............................................................. 21
Actividades de Aprendizaje de la Unidad Didáctica I: .............................................................. 22
Actividad de Aprendizaje 1 de la Unidad Didáctica I: ............................................................... 22
Actividad de Aprendizaje 2 de la Unidad Didáctica I: ............................................................... 23
Actividad de Aprendizaje 3 de la Unidad Didáctica I: ............................................................... 27
Actividad de Aprendizaje 4 de la Unidad Didáctica I: ............................................................... 34
Actividad de Aprendizaje 5 de la Unidad Didáctica I: ............................................................... 36
Actividades de Auto – evaluación de la Unidad Didáctica I: .................................................... 39
Actividad de Evaluación de la Unidad Didáctica I: .................................................................... 40
Unidad didáctica II: ......................................................................................................................... 41
Título de la Unidad Didáctica II: Estadística descriptiva. ...................................................... 41
Actividades de Aprendizaje de la Unidad Didáctica II: ............................................................. 42
Actividad de Aprendizaje 1 de la Unidad Didáctica II: .............................................................. 42
Actividad de Aprendizaje 2 de la Unidad Didáctica II: .............................................................. 43
Actividad de Aprendizaje 3 de la Unidad Didáctica II: .............................................................. 44
Actividad de Aprendizaje 4 de la Unidad Didáctica II: .............................................................. 50
Actividad de Aprendizaje 5 de la Unidad Didáctica II: .............................................................. 55
Actividades de Auto – evaluación de la Unidad Didáctica II: ................................................... 61
Actividad de Evaluación de la Unidad Didáctica II: ................................................................... 61
Unidad didáctica III ......................................................................................................................... 62
Título de la Unidad Didáctica III: Análisis Combinatorio ....................................................... 62
Actividades de Aprendizaje de la Unidad Didáctica III: ............................................................ 63
Actividad de Aprendizaje 1 de la Unidad Didáctica III: ............................................................. 63
Actividad de Aprendizaje 2 de la Unidad Didáctica III: ............................................................. 64
Actividad de Aprendizaje 3 de la Unidad Didáctica III: ............................................................. 65
Actividad de Aprendizaje 4 de la Unidad Didáctica III: ............................................................. 67
4
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 5 de la Unidad Didáctica III: .............................................................71
Actividades de Auto – evaluación de la Unidad Didáctica III: ..................................................78
Actividad de Evaluación de la Unidad Didáctica III: ..................................................................78
Unidad didáctica IV .........................................................................................................................79
Título de la Unidad Didáctica IV: Teoría de la probabilidad ..................................................79
Actividades de Aprendizaje de la Unidad Didáctica IV: ............................................................80
Actividad de Aprendizaje 1 de la Unidad Didáctica IV:.............................................................80
Actividad de Aprendizaje 2 de la Unidad Didáctica IV:.............................................................84
Actividades de Auto – evaluación de la unidad IV: .................................................................115
Actividad de Evaluación de la Unidad Didáctica IV: ...............................................................116
Unidad didáctica V ........................................................................................................................117
Título de la Unidad Didáctica V: Distribuciones discretas especiales .............................117
Actividades de Aprendizaje de la Unidad Didáctica V: ...........................................................118
Actividad de Aprendizaje 1 de la Unidad Didáctica V: ............................................................118
Actividad de Aprendizaje 2 de la Unidad Didáctica V: ............................................................119
Actividad de Aprendizaje 3 de la Unidad Didáctica V: ............................................................120
Actividad de Aprendizaje 4 de la Unidad Didáctica V: ............................................................124
Actividades de Auto – evaluación de la Unidad Didáctica V: ................................................129
Actividad de Evaluación de la Unidad Didáctica V: ................................................................129
Estadística Descriptiva
5
PRESENTACIÓN
La presente Guía Didáctica de Estudios de Estadística Descriptiva, pretende servir
como herramienta de orientación a los estudiantes de la carrera de Tecnología en
Redes y Telecomunicaciones. Este documento trata de proporcionar información
sobre el seguimiento de la materia antes mencionada, proporcionando un camino
adecuado para lograr los objetivos propuestos por el estudiante desde el inicio del
semestre.
Este escrito recoge información importante y actualizada de diversos autores que
facilitan la comprensión de esta valiosa asignatura, es una guía de estudios, diseñada
como herramienta facilitadora del proceso de enseñanza aprendizaje, cumpliendo así
con los objetivos propuestos para el quinto semestre de Tecnología en Redes y
Telecomunicaciones.
Para un mejor manejo de esta guía está distribuida en unidades de estudio, que a
continuación detallo:
• UNIDAD I. Análisis estadístico
• UNIDAD II. Estadística Descriptiva.
• UNIDAD III. Análisis Combinatorio.
• UNIDAD IV. Teoría de la Probabilidad.
• UNIDAD V Distribuciones Discretas Especiales
Teniendo en cuenta que la esencia de la asignatura es 30% teórica y 70% práctica,
se distribuirán en cada una de las unidades ejercicios y talleres prácticos que ayuden
a poner en práctica el conocimiento teórico, las instrucciones serán diseñadas de tal
forma que el estudiante pueda de manera sencilla resolver y cumplir con el propósito
de cada una de las unidades de estudio.
Otra herramienta que utilizaremos en el diseño de este documento son las Tic's ya
que por medio de esta aplicación el estudiante tendrá acceso a la información en
cualquier lugar donde se encuentre, además se podrá contar con la asesoría del
docente en cualquier duda con respecto a cada tema citado en este documento,
logrando conseguir el conocimiento significativo, razón de ser de esta guía de
Estadística Descriptiva.
6
Ing. Priscila E. Crespo Ayala, Mgs.
Información General
Los conceptos y temas de la estadística se utilizan en la actualidad en un gran número
de ocupaciones, constituyen una parte integral de las actividades de investigación en
distintas áreas del saber humano. El profesional que entienda de estadística puede
leer con inteligencia la literatura que sobre su campo de acción va apareciendo día a
día. Con frecuencia escuchamos en los medios de difusión comentarios como los
siguientes:
• Se ha demostrado estadísticamente que el mayor porcentaje de las ventas de
automóviles se registran en el primer trimestre del año.
• La explotación de petróleo crudo en el último trimestre del año ascendió a 285
millones de barriles, cuyo producto fue de 3698 millones de dólares.
• Estadísticamente se ha demostrado que el huevo produce el colesterol en las
personas que consumen mucho este producto.
La estadística es una rama de las matemáticas aplicadas que surgió por la necesidad
concreta que el hombre tiene de conocer la resolución de problemas relacionados con
la recolección, procesamiento, análisis e interpretación de datos numéricos cuyo
conocimiento le permitirá tomar decisiones acertadas.
La asignatura de Estadística, permitirá al estudiante interpretar información y obtener
conclusiones de una realidad para solucionar los problemas que se presentan y se
viven en la actualidad socio-económica.
Estadística Descriptiva
7
SYLLABUS DE LA ASIGNATURA
I. DATOS INFORMATIVOS
NOMBRE DE LA CARRERA: Tecnología en Redes y Telecomunicaciones
ESTADO DE LA CARRERA: Vigente _X_ No vigente solo para registro de títulos _
NIVEL: Tecnológico
TIPO DE CARRERA: Tradicional
NOMBRE DE LA SIGNATURA: Estadística Descriptiva
CÓD. ASIGNATURA: RT-S5-ESDE
PRE – REQUISITO: Costos y Presupuestos
CO – REQUISITO: Ninguno
TOTAL HORAS: 64
Componente docencia: 36
Componente de prácticas de aprendizaje: 18
Componente de aprendizaje autónomo: 10
SEMESTRE: Quinto PARALELO: A
PERIODO ACADÉMICO: Noviembre 2019 – abril 2020 (IIPA 2019)
MODALIDAD: Presencial
DOCENTE RESPONSABLE: Ing. Priscila Esperanza Crespo Ayala Mgs.
II. FUNDAMENTACIÓN
La Estadística Descriptiva es una asignatura Teórica- Práctica, que busca que
el estudiante use el razonamiento lógico y crítico en soluciones de problemas
de sistemas en la vida cotidiana.
En cuanto a la importancia de esta disciplina en redes y telecomunicaciones
juega un papel muy significativo pues constituye una herramienta fundamental
para el análisis y toma de decisiones de las actividades que realiza el futuro
profesional en esta área.
Por consiguiente el problema surge a partir de la necesidad del análisis de una
estructura sistemática y lógica de la informática que necesita de conceptos
estadísticos para la toma de decisiones y se emplean conceptos que son
esencialmente cuantitativos y cualitativos de la estadística con aplicación en la
informática.
Con este acercamiento surge el objeto de estudio de esta asignatura es: resolver
problemas de distribución de frecuencias y representaciones gráficas con la
aplicación de fórmulas de razonamiento lógico matemático para dinamizar la
toma de decisiones.
8
Ing. Priscila E. Crespo Ayala, Mgs.
El objetivo general es calcular medidas de tendencia central y otras medidas
descriptivas con honestidad para el sustento teórico científico, técnicas
inferenciales y formulación respectiva que permiten procesos del pensamiento
creativo y abstracto, manipulación de información estadística, presentadas a
través de gráficas y análisis de la información estudiada.
III. OBJETIVOS ESPECÍFICOS
Unidad I.- Definir los diferentes conceptos empleados en estadística con
integridad.
Unidad II.- Representar gráficamente los resultados de la investigación
estadística con honestidad y tolerancia.
Unidad III.- Calcular el número de arreglos diferentes que se pueden hacer con
una colección de objetos, con respeto.
Unidad IV.- Desarrollar técnicas de conteo y teoría de probabilidades, con
compromiso.
Unidad V.- Calcular medidas de ubicación y descriptivas en una distribución de
probabilidades, con responsabilidad.
IV. CONTENIDOS
Sistema General de conocimientos
Unidad I: Análisis Estadístico
Unidad II: Estadística descriptiva
Unidad III: Análisis combinatorio
Unidad IV: Teoría de la probabilidad
Unidad V: Distribuciones discretas especiales
Sistema General de Habilidades
Unidad I: Definir los diferentes conceptos empleados en estadística, mediante
el análisis de varios autores para aplicarlos a problemas de la vida empresarial
y cotidiana.
Unidad II: Representar gráficamente los resultados de la investigación
estadística mediante la recolección de datos para el análisis e interpretación de
resultados.
Estadística Descriptiva
9
Unidad III.- Calcular el número de arreglos diferentes que se pueden hacer con
una colección de objetos, mediante fórmulas y expresiones analíticas que
permitan el cálculo de probabilidades para una oportuna toma de decisiones.
Unidad IV.- Desarrollar técnicas de conteo y teoría de probabilidades mediante
fórmulas de permutaciones y combinatoria adquiriendo un orden espacial y un
grado mayor de certeza para la toma de decisiones futuras.
Unidad V.- Calcular medidas de ubicación y descriptivas en una distribución de
probabilidades a través de los constructos teóricos y los algoritmos de resolución
para que se adopte los criterios más adecuados en la factibilidad de un proyecto.
Sistema General de Valores
Unidad I.- Integridad en el análisis de los diferentes conceptos.
Unidad II.- Honestidad y tolerancia en los resultados de la investigación estadística.
Unidad III.- Respeto en la aplicación del método para tabular datos.
Unidad IV.- Compromiso en la aplicación de los conceptos.
Unidad V.- Responsabilidad en la construcción de ideas con los resultados
obtenidos.
V. PLAN TEMÁTICO
DESARROLLO DEL PROCESO CON TIEMPO
EN HORAS
TEMAS DE LA ASIGNATURA C CP S CE T L E THP TI THA
Análisis estadístico
3 3 3 1 10 2 12
Estadística Descriptiva
3 4 3 1 11 2 13
Análisis Combinatorio
3 3 3 1 10 2 12
Teoría de la probabilidad 3 4 2 1 10 2 12
Distribuciones Discretas
Especiales
2
4
4
1
11
2
13
EXAMEN FINAL 2 2 2
Total de horas 14 18 15 7 54 10 64
10
Ing. Priscila E. Crespo Ayala, Mgs.
Leyenda:
C – Conferencias.
S – Seminarios.
CP – Clases prácticas.
CE – Clase encuentro.
T – Taller.
L – Laboratorio.
E - Evaluación.
THP – Total de horas presenciales.
TI – Trabajo independiente.
THA – Total de horas de la asignatura.
VI. SISTEMA DE CONTENIDOS POR UNIDADES DIDÁCTICAS
Unidad I: ANÁLISIS ESTADÍSTICO
Objetivo: Definir los diferentes conceptos empleados en estadística con
integridad.
Sistema de
conocimientos
Sistema de habilidades Sistema de Valores
1.1. Introducción al Análisis
Estadístico.
1.2. Naturaleza de la
Estadística.
1.3. El muestreo Estadístico.
1.4. Escalas de Medición
1.5. La investigación
Estadística.
Definir el análisis
estadístico.
Describir la naturaleza
estadística.
Demostrar la fórmula del
muestreo estadístico.
Explicar las escalas de
medición.
Distinguir la investigación
estadística.
Integridad en el análisis
de los diferentes
conceptos.
Estadística Descriptiva
11
Unidad II: ESTADÍSTICA DESCRIPTIVA
Objetivo: .- Representar gráficamente los resultados de la investigación
estadística, honestidad y tolerancia.
Sistema de
conocimientos
Sistema de habilidades Sistema de Valores
2.1. Definición de Estadística
Descriptiva.
2.2. Representación Tabular
de Datos.
2.3. Distribución de
Frecuencias.
2.4. Medidas de Tendencia
central.
2.5. Medidas de dispersión.
Identificar la estadística
descriptiva.
Tabular datos estadísticos.
Aplicar la distribución de
frecuencias.
Calcular las medidas de
tendencia central y obtener
resultados.
Formular las medidas de
dispersión y representar
los resultados para el
análisis e interpretación de
la información.
Honestidad y tolerancia
en los resultados de la
investigación
estadística.
Unidad III: ANÁLISIS COMBINATORIO
Objetivo: Calcular el número de arreglos diferentes que se pueden hacer con
una colección de objetos, con respeto.
12
Ing. Priscila E. Crespo Ayala, Mgs.
Sistema de
conocimientos
Sistema de habilidades Sistema de Valores
3.1. Análisis Combinatorio.
3.2. Principios de
Multiplicación.
3.3. Diagrama de árbol.
3.4. Permutaciones.
3.5. Combinaciones.
Distinguir el análisis
combinatorio.
Demostrar los principios de
la multiplicación.
Aplicar el diagrama de
árbol.
Realizar permutaciones.
Calcular combinaciones
estadísticas.
Respeto en la aplicación
del método para tabular
datos.
Unidad IV: TEORÍA DE LA PROBABILIDAD
Objetivo: Desarrollar técnicas de conteo y teoría de probabilidades, con
compromiso.
Sistema de
conocimientos
Sistema de habilidades Sistema de Valores
4.1. Conceptos
Fundamentales.
4.2. Distribución de
Probabilidad
4.2.1 Probabilidad empírica
4.2.2 Probabilidad clásica
4.2.3 Probabilidad subjetiva
4.2.4Reglas de las
probabilidades.
4.2.5 Regla de la adición
4.2.6 Regla de la
multiplicación
Aplicar los conceptos
fundamentales de la teoría
de la probabilidad.
Identificar la distribución de
la probabilidad.
Medir la probabilidad de un
suceso en base a las
reglas establecidas.
Compromiso en la
aplicación de los
conceptos.
Estadística Descriptiva
13
Unidad V: DISTRIBUCIONES DISCRETAS ESPECIALES.
Objetivo: Calcular medidas de ubicación y descriptivas en una distribución de
probabilidades, con responsabilidad.
Sistema de
conocimientos
Sistema de habilidades Sistema de Valores
5.1. Distribución uniforme.
5.2. Distribución de Bernoulli
5.3. Distribución binomial.
5.4. Distribución de Poisson
Calcular la media, la
varianza y la desviación
estándar de una
distribución uniforme de
probabilidades.
Aplicar la media,
varianza y desviación
estándar de una
distribución de Bernoulli
de probabilidad.
Describir las
características de la
distribución binomial.
Calcular las
probabilidades
empleando la
distribución poisson.
Responsabilidad en la
construcción de ideas
con los resultados
obtenidos.
VII. ORIENTACIONES METODOLÓGICAS Y DE ORGANIZACIÓN DE LA
ASIGNATURA.
El proceso de enseñanza – aprendizaje de la asignatura, se soporta en el desarrollo
de clases magistrales del contenido en general, acompañado por casos prácticos,
talleres de aplicación, procesos de simulaciones en Excel y aplicación de los
contenidos.
14
Ing. Priscila E. Crespo Ayala, Mgs.
El estudiante aplicará todos los elementos conceptuales y teóricos en general a lo
largo del proceso de aprendizaje de la presente cátedra y mantendrá a su disposición
el aporte profesional permanente del docente para la construcción de una actitud
crítica y objetiva sobre aspectos matemáticos en las decisiones de sistemas. Habrá
tres documentos pedagógicos básicos que permiten evidenciar los resultados de las
actividades del trabajo autónomo y de grupos, desarrollados a partir del sílabo de la
asignatura.
Carpeta con trabajos extra-clase e intra-clase, grupales (hasta 3 a 5 alumnos).
Desarrollo de ejercicios aplicados a la teoría. Carpeta de trabajos autónomos. En
especial consultas sobre temas especiales y que hayan sido sustentados
demostrando su dominio.
Registro de avance académico. Revisión de trabajos extra-clase, trabajos autónomos,
lecciones orales en el aula, pruebas escritas y exámenes escritos. Evidencia el
cumplimiento y la calidad del trabajo.
Obligación de los alumnos entregar al profesor la producción requerida para la
evaluación.
Los métodos utilizados son:
Método Reproductivo:
Método Explicativo y Método Ilustrativo: El alumno se apropia de conocimientos
elaborados y los reproduce mediante modos de actuación. El docente explica y dirige
la clase mientras el estudiante atiende y asimila los conocimientos. El estudiante
ilustra a través de ejemplos la temática inferida.
Método de Exposición Problemática: Es un método intermedio, pues supone la
asimilación de la información elaborada y de elementos de la actividad creadora. Se
establecen grupos de trabajo, facilita cierta información y permite al estudiante que
contribuya con su creatividad, ejemplifica los algoritmos de resolución de problema y
se colabora con el estandarte para la creación de su propio ejercicio.
Método Productivo:
Método Heurístico o de Búsqueda parcial de Método Investigativo. - Permite al
estudiante alcanzar conocimientos nuevos, como resultado de la actividad creadora.
El docente estimula a la investigación, y con dicha información realiza talleres de
producción textual y estimula al mismo a crear sus propios ejercicios.
Las Técnicas de Enseñanza se detallan a continuación:
Estadística Descriptiva
15
Del interrogatorio: En el uso de preguntas y respuestas para obtener información y
puntos de vista de aplicación de lo aprendido, mediante esta técnica se pretende
despertar y conservar el interés, se exploran experiencias, capacidad, criterio de los
estudiantes y comunicación de ellos.
Del redescubrimiento: Realizar un aprendizaje satisfactorio y efectivo en el cual el
estudiante observa, piensa y realiza.
De la discusión dirigida: Realizar un análisis, una confrontación, una clasificación de
hechos, situaciones, experiencias, problemas, con presencia de docente. Se centra
en la discusión, en el cual se obtienen conclusiones positivas o valederas.
Operatoria: Consiste en realizar actividades de operaciones que permitan el
razonamiento y la comprensión facilitando el aprendizaje.
De la resolución de problemas: Permite solucionar problemas matemáticos mediante
un orden lógico, secuencial, práctico y de razonamiento.
Lluvia de ideas: El grupo actúa en un plano de confianza, libertad e informalidad y sea
capaz de pensar en alta voz, sobre un problema, tema determinado y en un tiempo
señalado.
Diálogos simultáneos: Lograr la participación de un gran grupo, dividido en parejas,
respecto a un tema de estudio, trabajo, tarea o actividad.
Del informe o trabajo escrito: En elaborar pasos para trabajos escritos con estilo
propio.
VIII. RECURSOS DIDÁCTICOS
Básicos: Marcadores, borrador, pizarra de tiza líquida.
Audiovisuales: Computador, proyector, celulares inteligentes, tabletas, laptops, Pen
drive.
Técnicos: Materiales de apoyo complementarios, Sistemas de ejercicios de
aplicación práctica, documentos de apoyo, separatas, texto básico, guías de
observación, amauta.
16
Ing. Priscila E. Crespo Ayala, Mgs.
IX. SISTEMA DE EVALUACIÓN DE LA ASIGNATURA
El sistema de evaluación será sistemático y participativo, con el objetivo de adquirir
las habilidades y destrezas cognitivas e investigativas que garanticen la calidad e
integridad de la formación profesional.
Para la respectiva evaluación se valorará la gestión de aprendizaje propuestos por el
docente, la gestión de la práctica y experimentación de los estudiantes, y la gestión
de aprendizaje que los estudiantes propondrán mediante la investigación.
Se tomó como referencia el Reglamento del Sistema Interno de Evaluación Estudiantil
para proceder a evaluar la asignatura, de esta manera se toma como criterio de
evaluación la valoración de conocimientos adquiridos y destrezas evidenciadas dentro
del aula de clases en relación a la labor que un auditor de sistemas realiza.
Cada alumno deberá demostrar lo aprendido en cada una de las unidades
académicas, y de esta manera esté apto para desenvolvimiento profesional.
Por ello desde el primer día de clases, se presentará las unidades didácticas y los
criterios de evaluación del proyecto final. Se determinará el objeto de estudio, que en
este caso es la realización de problemas de distribución de frecuencias y
representaciones gráficas para el razonamiento lógico matemático en la modelización
de situaciones que permitan dinamizar la toma de decisiones.
Se explica a los estudiantes que el semestre se compone de dos parciales con una
duración de diez semanas de clases cada una, en cada parcial se evaluará sobre
cinco puntos las actividades diarias de las clases, trabajos autónomos, trabajos de
investigación, actuaciones en clases y talleres; sobre dos puntos un examen de parcial
que se tomará en la semana diez y semana veinte. De esta manera cada parcial tendrá
una nota total de siete puntos como máximo.
El examen final se llevará a cabo mediante la ejecución de un proyecto integrador de
asignaturas y tiene una valoración de tres puntos. Por consiguiente, el alumno podrá
obtener una nota total de diez puntos.
Estadística Descriptiva
17
El proyecto integrador del presente semestre corresponde a la elaboración de un
manual de políticas y seguridad para los recursos de hardware y software en las
instituciones públicas y privadas.
Por tal motivo, la asignatura de Estadística Descriptiva contribuirá en el proyecto
integrador mediante la aplicación de entrevistas, encuestas para la tabulación de
datos y la obtención de información valedera que permita una eficiente interpretación
de los resultados y oportuna toma de decisiones determinando con ello además la
factibilidad del proyecto.
Los parámetros de evaluación del presente proyecto o actividad de vinculación de la
asignatura, se clasifican en parámetros generales que serán los mismos en todas las
asignaturas y en parámetros específicos que corresponde únicamente a la asignatura;
la cual se detallan a continuación:
Parámetros Generales
- Redacción y desarrollo del manual y artículo científico. 1,00
- Desenvolvimiento y dominio en la exposición. 0,50
TOTAL
1,50
Parámetros Específicos
- Veracidad en la información recolectada a través de encuestas o entrevistas
0,50
- Tabulación de los datos aplicando los conocimientos estadísticos. 1,00
TOTAL 1.50
Una vez que el estudiante exponga su proyecto integrador y defienda las preguntas
propuestas por el tribunal, será notificado en ese momento la nota obtenida y se
procederá a la respectiva firma de constancia.
Dentro de las equivalencias de notas se clasifican de la siguiente manera:
10,00 a 9,50: Excelente
9,49 a 8,50: Muy bueno
8,49 a 8,00: Bueno
7,99 a 7,00: Aprobado
6,99 a menos: Reprobado
18
Ing. Priscila E. Crespo Ayala, Mgs.
Los estudiantes deberán alcanzar un puntaje mínimo de 7,00 puntos para aprobar la
asignatura, siendo de carácter obligatorio la presentación del proyecto integrador.
Si el estudiante no alcance los 7,00 puntos necesarios para aprobar la asignatura,
deberá presentarse a un examen supletorio en la cual será evaluado sobre diez puntos
y equivaldrá el 60% de su nota final, el 40% restante corresponde a la nota obtenida
en acta final ordinaria de calificaciones.
Aquellos estudiantes que no podrán presentarse al examen de recuperación son
quienes estén cursando la asignatura por tercera ocasión, y aquellos que no hayan
alcanzado la nota mínima de 2,50/10 en la nota final o aquellos que hubiesen
reprobado por faltas del 25% o más en la asignatura impartida.
El estudiante no conforme con la nota del proyecto integrador podrá solicitar mediante
oficio una recalificación y obtendrá respuesta del mismo en un plazo no mayor a tres
días hábiles.
El docente tendrá un plazo de 48 horas para socializar las calificaciones obtenidas
luego se asentará en las actas finales y se procederá a recoger la firma de los
estudiantes.
Los proyectos presentados serán sometidos a mejoras o corrección si el caso lo
amerita con la finalidad de ser presentadas en la feria de proyectos científicos que el
Instituto Tecnológico Superior Ismael Pérez Pazmiño lanzará cada año.
X. BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA
➢ Crespo Ayala, Priscila. Guía de Estudio de Estadística Descriptica Machala: Instituto Superior Tecnológico Ismael Pérez Pazmiño, 2019.
➢ Guarín Salazar Norberto, Estadística Aplicada, 2002, Colombia, Universidad Nacional de Colombia.
➢ Levin, Richard I; Rubin, David S. Estadística para Administración y Economía, Séptima edición, 2004, México, Editorial Pearson Educación.
➢ Lind D, Marchal W, Wathen S. Estadística aplicada a los Negocios y la Economía, decimoquinta edición, 2012, México, Mc. Graw Hill Editores.
➢ Vergara Juan, Quezada Victor, Estadística Básica con aplicaciones en Ms Excel, Cartagena, Colombia. 2014.
Estadística Descriptiva
19
ORIENTACIONES PARA EL USO DE LA GUÍA DE ESTUDIOS
Antes de empezar con nuestro estudio, debes tomar en cuenta lo siguiente:
1. Todos los contenidos que se desarrollen en la asignatura contribuyen a tu
desarrollo profesional, ética investigativa y aplicación en la sociedad.
2. El trabajo final de la asignatura será con la aplicación de la metodología de
investigación científica.
3. En todo el proceso educativo debes cultivar el valor de la constancia porque
no sirve de nada tener una excelente planificación y un horario, si no eres
persistente.
4. Para aprender esta asignatura no memorices los conceptos, relaciónalos con
la realidad y tu contexto, así aplicarás los temas significativos en tu vida
personal y profesional.
5. Debes leer el texto básico y la bibliografía que está en el syllabus sugerida
por el docente, para aprender los temas objeto de estudio.
6. En cada tema debes realizar ejercicios, para ello debes leer el texto indicado
para después desarrollar individual o grupalmente las actividades.
7. A continuación te detallo las imágenes que relacionadas a cada una de las
actividades:
Imagen
Significado
Sugerencia
Talleres
Reflexión
20
Ing. Priscila E. Crespo Ayala, Mgs.
Subir Tareas al
Aula Virtual
Amauta
Apunte clave
Foro
Resumen
Evaluación
8. Ánimo, te damos la bienvenida a este nuevo periodo académico.
Estadística Descriptiva
21
DESARROLLO DE ACTIVIDADES
Unidad didáctica I:
Título de la Unidad Didáctica I: Análisis Estadístico.
Introducción de la Unidad Didáctica I:
El campo de la estadística toca nuestras vidas de muchas maneras. Desde las rutinas
diarias en nuestros hogares hasta la responsabilidad de hacer funcionar las ciudades
más grandes, las estadísticas están por doquier.
Las compañías de comunicaciones utilizan estadísticas para optimizar los recursos de
las redes, mejorar el servicio y reducir la rotación de clientes obteniendo un insight
más preciso de los requisitos de los suscriptores.
Mire a su alrededor. Desde el tubo de pasta dental en su baño hasta los aviones que
vuelan sobre su casa, se ven cientos de productos y procesos todos los días que han
sido mejorados a través del uso de la estadística.
La base de la estadística es poder considerar un conjunto de datos y calcular valores
estadísticos o trazar gráficas, pero hay que tomar en cuenta que es mucho más
importante comprender las circunstancias que se están investigando, las variables
implicadas, porque se está investigando el problema y se aprende a cuestionar los
datos y los resultados estadísticos.
La experiencia y situaciones de la vida diaria constituyen la base para comprender la
estadística ya que esta trata sobre la descripción del mundo que nos rodea y nos
proporciona métodos para analizar los resultados de experimentos efectuados, pero
también indica cómo se pueden efectuar los experimentos de manera eficaz para
disminuir los efectos de la variación y tener mayor probabilidad de llegar a
conclusiones correctas.
Objetivo de la Unidad Didáctica I:
Definir los diferentes conceptos empleados en estadística con integridad.
22
Ing. Priscila E. Crespo Ayala, Mgs.
Organizador Gráfico de la Unidad didáctica I:
Actividades de Aprendizaje de la Unidad Didáctica I:
Actividad de Aprendizaje 1 de la Unidad Didáctica I:
1.1. Introducción al Análisis estadístico
La estadística recoge, ordena y analiza datos para estudiar las características o el
comportamiento de un colectivo.
Es el conjunto de métodos científicos ligados a la toma, organización, recopilación,
presentación y análisis de datos, tanto para la deducción de conclusiones como para
tomar decisiones razonables de acuerdo con tales análisis.
¿Qué es el análisis estadístico? Es la ciencia de recopilar, explorar y presentar
grandes cantidades de datos para descubrir
patrones y tendencias implícitos.
. Por ejemplo:
Los fabricantes utilizan las estadísticas para
incorporar calidad en telas preciosas, para dar
ANALISIS ESTADÍSTI CO
El muestreo estadístico
Escalas de mediciónLa investigación
estadística
Las estadísticas se aplican
todos los días – en la
investigación, la industria y el
gobierno para volvernos más
científicos acerca de las
decisiones que se necesitan
tomar
Estadística Descriptiva
23
prosperidad a la industria de las líneas aéreas y para ayudar a los guitarristas a
producir música hermosa.
Los investigadores mantienen a los niños sanos utilizando estadísticas para analizar
datos de la producción de vacunas virales, lo cual garantiza consistencia y seguridad.
El análisis estadístico, a menudo, se utiliza para explorar los datos, por ejemplo, para
examinar la distribución de valores para un atributo en particular o para encontrar
valores atípicos (valores extremadamente altos o bajos). Contar con esta información
es útil cuando se definen clases y rangos en un mapa, cuando se reclasifican datos o
cuando se buscan errores.
Otro uso del análisis estadístico es resumir los datos. Por lo general, esto se realiza
por categorías, como calcular el área total en cada categoría de uso del suelo.
También se pueden crear resúmenes espaciales, como calcular la elevación promedio
para cada cuenca hidrográfica. El resumen de los datos es útil para comprender mejor
las condiciones de un área de estudio.
El análisis estadístico también se utiliza para identificar y confirmar los patrones
espaciales, tales como el centro de un grupo de entidades, la tendencia direccional o
si las entidades forman clusters. Aunque los patrones pueden ser evidentes en un
mapa, podría ser difícil tratar de sacar conclusiones desde un mapa; la forma en que
se clasifican y simbolizan los datos puede oscurecer o exagerar los patrones. Las
funciones estadísticas analizan los datos subyacentes y proporcionan una medida que
se puede utilizar para confirmar la existencia y la fortaleza del patrón.
Actividad de Aprendizaje 2 de la Unidad Didáctica I:
1.2. Naturaleza de la Estadística.
Los primeros estudiosos de la estadística se dedicaron, por lo general, a la recolección
y exposición de datos útiles para el Estado, de ahí se derivó el nombre estadística.
Por ejemplo recolectaban datos sobre nacimientos y decesos, para auxiliar a los
encargados del reclutamiento militar; sobre enfermedades, para ayudar a quienes se
Realice un resumen mínimo de 5 líneas
correspondiente el análisis estadístico.
24
Ing. Priscila E. Crespo Ayala, Mgs.
ocupaban de la salud pública, y acerca de exportaciones, importaciones, ingresos y
egresos, y gastos para facilitar la recaudación de impuestos.
La Estadística consiste en la colección, presentación, análisis y utilización de datos
numéricos para facilitar la toma de decisiones acertadas frente a una incertidumbre
que plantean la economía, la administración y otras ciencias sociales y físicas.
La estadística es una rama de la ciencia, encargada del diseño y aplicación de
métodos para recolectar, organizar, analizar y hacer deducciones a partir de ellos.
La estadística proporciona una metodología para evaluar y juzgar
las discrepancias entre la realidad y la teoría. Además de su papel
instrumental, el estudio de la estadística es importante para
entender las posibilidades y limitaciones de la investigación
experimental, para diferenciar las conclusiones que pueden
obtenerse de los datos de aquellas que carecen de base empírica
y en definitiva para desarrollar un pensamiento crítico y
antidogmático ante la realidad.
Supóngase que nos confrontamos con un conjunto de mediciones u observaciones
obtenidas de la realidad. Tal conjunto representa usualmente un complejo de datos
del que es posible extraer una cantidad de información casi ilimitada. Por ejemplo, los
salarios semanales de un grupo de obreros del acero pueden producir información de
las siguientes clases: el salario total recibido por el grupo, el salario más alto, el salario
más bajo, el salario más frecuente, el rango de los salarios, el salario medio, el número
de los salarios inferiores a $ 75.00, el número de los salarios superiores a $100.00, el
número entre $75,00 y $125.00, etc. La tarea del investigador es seleccionar algunos
procedimientos y medidas mediante los cuales se pongan de relieve los aspectos
significantes de los datos dados. Estos aspectos pueden obtenerse mediante la
clasificación, construcción de gráficas y cálculo de promedios.
En la actualidad
con la ayuda de la
informática y la
tecnología el
tratamiento
estadístico de la
información se
hace más sencillo.
Existen varias definiciones de estadística,
investigue un concepto y analícelo
Estadística Descriptiva
25
Por lo que los datos estadísticos son un conjunto de números de una misma
características, que pueden ser organizados, comparados, analizados e interpretados,
además encontramos la Unidad Estadística, que es persona, elemento u objeto que
se va a estudiar. Y esta unidad estadística posee características, que son las
propiedades, rasgos, cantidades o cualidades. Estas estas características las
obtenemos en base a observaciones, que no son más que información recopilada de
la unidad estadística elemental, en relación con la característica de interés (Análisis
estadístico), si la unidad estadística es el trabajador y característica su salario una
observación sería que gana $600,00. Por lo que se pueden tener observaciones para
varias características diferentes en una misma unidad.
Cuando se realiza el análisis estadístico, tenemos la Población, que es un conjunto
de personas o cosas objeto de investigación estadística, es el total de unidades de
estudio. La población puede ser finita, que significa que tiene un número limitado de
elementos (Situación existente en un momento dado). La Población infinita está
formada por un número ilimitado de elementos. (Proceso o experimiento, puede
repetirse indefinidamente, sin delimitación de tiempo).
Un mismo conjunto de unidades de estudio puede tener diferentes poblaciones según
sea característica de interés.
Ejemplo:
POBLACIÓN • Todos los empleados actuales de la empresa ABC. SA.
• Salarios percibidos por los empleados en un cierto periodo
• Número de hijos vivos de las familias de los empleados
UNIDAD DE ESTUDIO • Un empleado de la empresa ABC. SA.
CARACTERÍSTICA • Ingreso familiar
• Nivel educativo
• Composición numérica de las familias
OBSERVACIONES • Ingreso familiar $600,00 mensuales
• Nivel educativo… primaria completa
• Composición familiar …. 5 personas.
Realice un organizador gráfico de los siguientes
conceptos: Datos estadísticos, unidad
estadística y población.
26
Ing. Priscila E. Crespo Ayala, Mgs.
Cuando vamos a hacer un estudio, no siempre se puede hacer uso de toda la población, por
lo que se tiene que recurrir al muestreo, es decir:
• Cuando la población es infinita o muy grande
• Población finita pero muy grande, incrementa el costo y tiempo
• Unidad de estudio se transforma o destruye. (Análisis de laboratorio)
Y nos damos cuenta que los resultados de muestra bien seleccionada, tamaño
razonable son precisos.
Para que la muestra sea representativa depende del tamaño de la muestra y de forma
de selección.
El tamaño de muestra depende de homogeneidad de los elementos de la población y
del grado de confianza en la inferencia.
EJEMPLOS DE VARIABLES
Unidad Elemental Característica Unidades de Medida Observación
Un estudiante Peso Kilogramos 64.5
Una casa Valor Dólares 156.000
Una casa Número de dormitorios Dormitorios 3
EJEMPLO DE ATRIBUTOS
Unidad Elemental Característica Observaciones
Un estudiante Clase de alumno Regular, Especial, Oyente
Una casa Condición de alquiler Amueblada, sin muebles
Un bombillo Condición Deteriorado, no deteriorado
Estadística Descriptiva
27
Actividad de Aprendizaje 3 de la Unidad Didáctica I:
1.3. El muestreo Estadístico.
El muestreo es el proceso de seleccionar un conjunto de individuos de una población
con el fin de estudiarlos y poder caracterizar el total de la población.
La idea es bastante simple. Imagina que queremos saber algo de un universo o
población, por ejemplo, qué porcentaje de los habitantes de Ecuador fuma
habitualmente. Una forma de obtener este dato sería contactar con todos los
habitantes de Ecuador (32 millones de personas) y preguntarles si fuman. La otra
forma sería seleccionar un subconjunto de individuos (por ejemplo, 1.000 personas),
preguntarles si fuman y usar esta información como una aproximación de la
información buscada. Pues bien, este grupo de 1.000 personas que me permiten
conocer mejor cómo se comportan el total de ecuatorianos es una muestra, y la forma
en que los seleccionamos es el muestreo.
En la definición anterior hemos introducido dos términos: Universo o población y
Muestra.
¿Por qué funciona el muestreo?
El muestreo es útil gracias a que podemos acompañarlo de un proceso inverso, que
llamamos generalización. Es decir, para conocer un universo lo que hacemos es:
1) Extraer una muestra del mismo.
Realice tres ejemplos de variables y tres ejemplos de
atributos con sus respectivas características, unidades de
medida y observación de acuerdo a lo revisado en clase.
28
Ing. Priscila E. Crespo Ayala, Mgs.
2) Medir un dato u opinión.
3) Proyectar en el universo el resultado observado en la muestra.
Esta proyección o extrapolación recibe el nombre de generalización de resultados.
La generalización de resultados añade cierto error al mismo. Imagina que tomamos
una muestra al azar de 1.000 personas de Ecuador y les preguntamos si fuman.
Obtengo que el 25% de la muestra fuma. La simple lógica nos dice que si de 1.000
ecuatorianos elegidos al azar el 25% fuma, este dato debería ser indicativo de lo que
obtendríamos si preguntásemos a los 122 millones de ecuatorianos. Ahora bien, el
azar podría haber hecho que haya escogido para mi muestra más fumadores de lo
que correspondería a la proporción exacta que hay en el universo o, por el contrario,
que en mi muestra los fumadores estén algo infra-representados. El azar podría hacer
que el porcentaje de fumadores en la población fuese algo diferente del 25% que
hemos observado en la muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la
generalización de resultados de un muestra a un universo conlleva aceptar que
cometemos cierto error, tal y como ilustra el siguiente esquema.
Afortunadamente, el error cometido al generalizar resultados puede acotarse gracias
a la estadística. Para ello se pueden usar dos parámetros: el margen de error, que
es la máxima diferencia que esperamos que haya entre el dato observado en mi
muestra y el dato real en el universo, y el nivel de confianza, que es el nivel de certeza
que tengo de que realmente el dato real esté dentro del margen de error.
Por ejemplo, en nuestro caso de fumadores ecuatorianos, si selecciono una muestra
de 471 individuos y les pregunto si fuman, el resultado que obtenga tendrá un margen
de error máximo de +-5% con un nivel de confianza del 97%. Esta forma de expresar
los resultados es la correcta cuando usamos muestreo.
Nivel de confianza 90% -> Z=1,645
Nivel de confianza 95% -> Z=1,96
Nivel de confianza 99% -> Z=2,575
Estadística Descriptiva
29
EL TAMAÑO DE LA MUESTRA
¿Qué tamaño de muestra necesito usar para estudiar cierto universo? Depende del
tamaño del universo y del nivel de error que esté dispuesto a aceptar, tal y como
explicábamos. Cuanta más precisión exija, mayor muestra necesito. Si quiero tener
una certeza absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que
ser tan grande como mi universo.
Pero el tamaño de la muestra tiene una propiedad fundamental que explica porqué el
muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad podría
resumirse como sigue: a medida que estudio universos mayores, el tamaño de
muestra que necesito cada vez representa un porcentaje menor de dicho universo.
Recapitulando vemos que para calcular el tamaño de muestra en este tipo de estudios
tenemos que conocer el tamaño de la población y fijar de antemano el nivel de
confianza y el error máximo que admitimos. Llamando N al tamaño de la población, el
tamaño de muestra, n, que necesitamos con un nivel de confianza 1- p y un error e se
puede calcular con la siguiente fórmula:
Siendo un valor de la distribución normal que se obtiene de una tabla y p la
proporción de individuos de la población que poseen la característica que se está
estudiando. Como ese dato es desconocido, se suele usar p=0.5 valor que maximiza
el producto p(1-p).
Lo que parece claro es que cuanto mayor sea el tamaño de la población mayor tendrá
que ser el tamaño de la muestra. La cuestión que nos ocupa es saber de qué forma
crece el tamaño de muestra en función del tamaño de la población si tenemos fijado
de antemano el nivel de confianza y el margen de error. Vamos a realizar algunos
cálculos para intentar hacernos una idea del asunto. Fijamos un nivel de confianza del
95% (con el cual α =0.05 y, por tanto, se sabe que y un error
del 5% (con lo que e=0.05):
Para una población de 100 personas, tenemos que el tamaño de muestra necesario
en este caso será:
30
Ing. Priscila E. Crespo Ayala, Mgs.
Es decir, con 100 personas deberíamos tomar una muestra de 80 individuos, casi la
población entera.
Veamos qué ocurre con 1000 personas:
Evidentemente el valor aumenta, 278 en esta ocasión, pero ya no está tan cerca del
tamaño total de la población como ocurría antes.
Para 10000 personas:
Sigue aumentando, pero como se puede ver ya aumenta mucho más despacio.
Hemos aumentado bastante el tamaño de la población, de 1000 a 10000, pero el
tamaño de muestra no llega a aumentar ni en 100 individuos.
Y veamos qué ocurre para 100000:
Aquí se ve mucho mejor. Pasando de una población de 10000 individuos a una de
100000 la muestra aumenta en 13 individuos.
De todo esto se deduce que para poblaciones pequeñas el tamaño de la muestra que
debemos tomar es bastante grande en comparación con dicha población (en
Estadística Descriptiva
31
ocasiones casi la población completa), pero para poblaciones de gran tamaño (todos
los habitantes de España, por ejemplo) basta con una muestra no demasiado grande
para obtener unos resultados estadísticamente fiables. O sea, que eso de que
necesitamos muchos individuos en una muestra para que los resultados sean buenos
no es del todo cierto.
¿Cuál sería en nuestro caso el tamaño máximo de una muestra? Pues el que
corresponda a una población con una gran cantidad de elementos. Podemos
obtenerlo tomando la expresión del tamaño de muestra como una función cuya
variable es N y calcular el límite de esa función cuando N tiende a infinito:
Es decir, que para poblaciones muy muy grandes necesitaremos tomar una muestra
de 385 personas para obtener buenos resultados para el nivel de confianza y el error
fijados de antemano (95% y 5% respectivamente).
La fórmula anterior podemos simplificarla cuando trabajamos con universos de
tamaño muy grande (se considera muy grande a partir de 100.000 individuos),
resultando lo siguiente:
Ejemplo: Retomando el caso anterior, tenemos una población de 136 millones de
ecuatorianos de entre 15 y 65 años, y queremos saber qué porcentaje de ellos vive
en un piso de propiedad, con un margen de error del 5% y un nivel de confianza del
95%. Supongamos que no tenemos ninguna información previa sobre cuál puede ser
el tanto por ciento de propietarios que podemos obtener en la encuesta. En este caso
podremos usar la fórmula simplificada pues 136 millones > 100.000, y usaremos
p=50% pues no tengo información previa sobre el resultado esperado:
n = 1,962 * 0,5 * (1 - 0,5) / 0,052 = 384,16
32
Ing. Priscila E. Crespo Ayala, Mgs.
Existen tres formas para seleccionar la muestra:
Aleatoria o al azar:- Muestreo simple al azar. Todos los elementos tienen la misma
probabilidad de ser seleccionados.
Intencional:- Se utiliza el juicio de una persona con expereiencia y conocimiento de
la población para la selección de los elementos.
Por conveniencia:- Por facilidad se escoge los elementos disponibles o más fáciles
de conseguir con el riesgo de que la muestra no sea representativa.
VENTAJAS E INCONVENIENTES DEL MUESTREO
VENTAJAS
• Necesitamos estudiar menos individuos, necesitamos menos recursos (tiempo
y dinero).
• La manipulación de datos es mucho más simple. Si con una muestra de 1.000
personas tengo suficiente, ¿para qué quiero analizar un fichero de millones de
registros?
DESVENTAJAS
• Introducimos error (controlado) en el resultado, debido a la propia naturaleza
del muestreo y a la necesidad de generalizar resultados.
• Tenemos el riesgo de introducir sesgos debido a una mala selección de la
muestra. Por ejemplo, si la forma en que seleccionamos individuos para la
muestra no es aleatoria, los resultados pueden verse seriamente afectados.
Estadística Descriptiva
33
VENTAJAS DEL MUESTREO ALEATORIO
• Elimina sesgos de selección porque la selección es aleatoria a diferencia de la
selección a intención o conveniencia.
• Produce errores aleatorios que son medibles utilizando modelos
probabilisticos. (Diferencia entre resultado de la muestra y el valor poblacional)
• El error de muestreo puede hacerse pequeño con aumentar el tamaño de la
muestra.
• La validez o precisión de una inferencia realizada a partir de una muestra
aleatoria es medible.
ATRIBUTOS Y VARIABLES
Variables:- Cuando una característica toma valores diferentes para cada unidad de
estudio de una población.
Tipos de variables:
Cuantitativas
Continuas:- cuando la variable puede tomar cualquier valor dentro de
un intervalo. (peso, edad).
Discretas:- cuando la variable puede tomar un determinado valor dentro
de un intervalo. , es decir, no hay decimales solo números enteros.
(número de hijos).
Cualitativas (Atributos):- Son lo que se puede observar del elemento de estudio
como color de ojos, estado civil.)
Realice un organizador gráfico, con los siguientes temas: Muestreo
estadístico, tamaño de la muestra, formas de muestra: ventajas y
desventajas, Variables y tipos de variables.
34
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 4 de la Unidad Didáctica I:
1.4. Escalas de Medición
. La medición es vital en el análisis estadístico. El análisis científico implica identificar
los fenómenos en estudio para poder describir su evolución cualitativa, y luego, la
medición de esos fenómenos, proporcionando así la característica de magnitud para
su conocimiento y previsión.
La medición puede definirse como la asignación de números a objetos y eventos de
acuerdo con ciertas reglas; la manera como se asignan esos números determina el
tipo de escala de medición.
Escala nominal. En esta escala las unidades observacionales (UO) se agrupan en
clases excluyentes según determinada propiedad, con lo que se define una partición
sobre el conjunto de tales unidades. Los números se usan como identificadores o
nombres. Cuando se estudia el desempleo de un país y se incluye la variable sexo,
se codifica masculino como 1 y femenino como 2, por ejemplo; los números1y2
representan categorías de datos: son simples identificadores y son completamente
arbitrarios. La operación matemática permitida es el conteo.
Escala ordinal: Surge a partir de la operación de ordenamiento; en esta escala se
habla de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está
cerca o lejos del segundo puesto. Los valores de la escala representan categorías o
grupos de pertenencia, con cierto orden asociado, pero no una cantidad mensurable.
La escala ordinal tiene las propiedades de identidad y magnitud. Los números
representan una cualidad que se está midiendo, y expresan si una observación tiene
más de la cualidad medida que otra UO. La distancia entre puntos de la escala no es
constante: no se puede determinar la distancia entre las categorías, sólo es
interpretable el orden entre sus valores. Ejemplos: situación socioeconómica, nivel
educativo.
Escala de intervalos. Esta escala representa magnitudes, con la propiedad de
igualdad de la distancia entre puntos de escala de la misma amplitud. Aquí puede
establecerse orden entre sus valores, hacerse comparaciones de igualdad, y medir la
distancia existente entre cada valor de la escala. El valor cero de la escala no es
absoluto, sino un cero arbitrario: no refleja ausencia de la magnitud medida, por lo que
Estadística Descriptiva
35
las operaciones aritméticas de multiplicación y división no son apropiadas. Cumple
con las propiedades de identidad, magnitud e igual distancia. La igual distancia entre
puntos de la escala significa que puede saberse cuántas unidades de más tiene una
UO comparada con otra, con relación a cierta característica analizada. Por ejemplo,
en la escala de temperatura centígrada puede decirse que la distancia entre 25° y
30°C es la misma que la existente entre 20° y 25° C, pero no puede afirmarse que una
temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad de calor se
refiere, debido a la ausencia de cero absoluto. Así, los valores numéricos en la escala
de temperatura centígrada se pueden expresar en valores de la escala Fahrenheit
mediante la ecuación C=a+bF (a= -17.778; b=5/9).
Escala de razón. Corresponde al nivel de medición más completo. Tiene las mismas
propiedades que la escala intervalos, y además posee el cero absoluto. Aquí el valor
cero no es arbitrario, pues representa la ausencia total de la magnitud que se está
midiendo. Con esta escala se puede realizar cualquier operación lógica
(ordenamiento, comparación) y aritmética. A iguales diferencias entre los números
asignados corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio. Ejemplos: longitud, peso, distancia, ingresos, precios.
Es importante tener siempre presente la escala de medición que se está usando, pues
no todos los procedimientos estadísticos son apropiados para cualquier análisis. En
general, como sabemos, las variables estadísticas se clasifican en variables continuas
o cuantitativas y variables discretas o cualitativas, según el nivel de escala en que
estén medidas. Las variables continuas se refieren a magnitudes medidas en escala
de intervalos o de razón, mientras que las variables discretas comprenden magnitudes
medidas en escalas de nivel nominal y ordinal.
36
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 5 de la Unidad Didáctica I:
1.5. La investigación Estadística
La investigación estadística es una actividad que apela a diversas técnicas con el
propósito de llegar a la esencia de la realidad.
El proceso de la investigación estadística implica una serie de pasos; pues lanzarse a
investigar sin un criterio previo o preparación adecuada puede demandar más tiempo
del programado.
El proceso de aplicación de la estadística implica una serie de pasos:
1. Selección y determinación de la población o muestra y las características
contenidas que se desean estudiar. En el caso de que se desee tomar una
muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo
a realizar (probabilístico o no probabilístico).
2. Obtención de los datos. Esta puede ser realizada mediante la observación
directa de los elementos, la aplicación de encuestas y entrevistas, y la
realización de experimentos.
3. Clasificación, tabulación y organización de los datos. La clasificación incluye el
tratamiento de los datos considerados anómalos que pueden en un momento
dado, falsear un análisis de los indicadores estadísticos. La tabulación implica
el resumen de los datos en tablas y gráficos estadísticos.
Existen diferentes tipos de escalas de medición, realice un breve
análisis de cada una.
Estadística Descriptiva
37
4. Análisis descriptivo de los datos. El análisis se complementa con la obtención
de indicadores estadísticos como las medidas: de tendencia central, dispersión,
posición y forma.
5. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos
que involucran elementos probabilísticos que permiten inferir conclusiones de
una muestra hacia la población (opcional).
6. Elaboración de conclusiones. Se construye el informe final.
Identifique y explique los pasos para el proceso de
Aplicación de la estadística.
38
Ing. Priscila E. Crespo Ayala, Mgs.
Análisis estadístico es resumir los datos.
La estadística es una rama de la ciencia, encargada del diseño y aplicación de métodos para
recolectar, organizar, analizar y hacer deducciones a partir de ellos.
Cuando se realiza el análisis estadístico, tenemos la Población (finita,infinita).
Cuando vamos a hacer un estudio, no siempre se puede hacer uso de toda la población, por lo
que se tiene que recurri al muestreo
Para que la muestra sea representativa depende del tamaño de la muestra y de forma de
selección.
Tamaño de la muestras, : a medida que estudio universos mayores, el tamaño de muestra que
necesito cada vez representa un porcentaje menor de dicho universo.
Existen tres formas para seleccionar la muestra: Aleatoria o al azar, Intencional, por
conveniencia.
El proceso de aplicación de la estadística implica una serie de pasos:
Selección y determinación de la población o muestra
Obtención de los datos
Clasificación, tabulación y organización de los datos
Análisis descriptivo de los datos
Análisis inferencial de los datos.
Elaboración de conclusiones
Estadística Descriptiva
39
Actividades de Auto – evaluación de la Unidad Didáctica I:
➢ Indique los usos del análisis estadístico.
➢ Genere su propia definición de estadística.
➢ Utilizando de base los cuadros de variables y atributos, realizar sus propios
ejemplos (3).
➢ Genere un ejemplo para aplicar la fórmula cuando se tiene una población
superior a 100.000.
➢ Escribir los pasos para el proceso de aplicación de la estadística.
Estadística, es el conjunto de métodos científicos ligados a la toma,
organización, recopilación, presentación y análisis de datos, tanto para
la deducción de conclusiones como para tomar decisiones razonables de
acuerdo con tales análisis.
El análisis estadístico, es la ciencia de recopilar, explorar y presentar
grandes cantidades de datos para descubrir patrones y tendencias
implícitos.
los datos estadísticos son un conjunto de números de una misma
características, que pueden ser organizados, comparados, analizados e
interpretados.
Población, es el total de unidades de estudio.(Finita, Infinita)
Un mismo conjunto de unidades de estudio puede tener diferentes
poblaciones según sea característica de interés.
El muestreo es el proceso de seleccionar un conjunto de individuos de
una población con el fin de estudiarlos y poder caracterizar el total de la
población.
La medición puede definirse como la asignación de números a objetos y
eventos de acuerdo con ciertas reglas
Escalas de medición (Nominal, ordinal, intervalos, razón
40
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Evaluación de la Unidad Didáctica I:
Este atento a la plataforma Amauta que se
subirá la actividad de evaluación final de la
Unidad Didáctica I.
Estadística Descriptiva
41
Unidad didáctica II:
Título de la Unidad Didáctica II: Estadística descriptiva.
Introducción de la Unidad Didáctica II:
Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos ayudan a
presentar los datos de modo tal que sobresalga su estructura. Hay varias formas
simples e interesantes de organizar los datos en gráficos que permiten detectar tanto
las características sobresalientes como las características inesperadas, el otro modo
de describir los datos es resumirlos en uno o dos números que pretenden caracterizar
el conjunto con la menor distorsión o pérdida de información posible.
Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué no
analizarlos directamente? En primer lugar porque las computadoras no son
demasiado hábiles solo son rápidas, hacen aquello para lo que están programadas y
actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán
procesados de modo inapropiado y ni usted ni la computadora se darán cuenta a
menos que realice previamente un análisis exploratorio de los datos.
Objetivo de la Unidad Didáctica II:
Representar gráficamente los resultados de la investigación estadística,
honestidad y tolerancia.
Organizador Gráfico de la Unidad Didáctica II:
ESTADISTICA DESCRIPTIVA
Representación tabular de datos
Distribución de frecuencias
Medidas de tendencia central y
de dispersión
42
Ing. Priscila E. Crespo Ayala, Mgs.
Actividades de Aprendizaje de la Unidad Didáctica II:
Actividad de Aprendizaje 1 de la Unidad Didáctica II:
2.1. Definición de Estadística descriptiva
(CECILIA SALAZAR P., 2018) “Es la parte de la estadística que permite analizar todo
un conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente
para ese conjunto. Para realizar este análisis se procede a la recolección y
representación de la información obtenida. Como ejemplo de estas estadísticas
podemos citar a aquellas que se obtienen generalmente en los deportes, en los
rendimientos académicos de los estudiantes de una determinada materia, en los
negocios al determinar las ventas obtenidas mensualmente en un determinado año
por una empresa en particular”.
Por lo que podemos decir que la Estadística Descriptiva, simplemente la utilizamos
para resumir de forma numérica o gráfica un conjunto de datos. Se restringe a describir
los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadística
descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en
dicha muestra, no se podrá generalizar la información hacia la población.
Explique con un ejemplo la definición de Estadística
Descriptiva.
Estadística Descriptiva
43
Actividad de Aprendizaje 2 de la Unidad Didáctica II:
2.2. Representación Tabular de Datos.
El principal objetivo de la estadística descriptiva es sintetizar conjuntos de datos
mediante tablas o gráficos resumen, con el fin de poder identificar el comportamiento
característico de un fenómeno y facilitar su análisis exhaustivo.
La presentación de datos estadísticos constituye en sus diferentes modalidades uno
de los aspectos de más uso en la estadística descriptiva. Porque cuando los datos
estadísticos se presentan a través de un conjunto de filas y de columnas que
responden a un ordenamiento lógico; es de gran importancia para el usuario ya que
constituye la forma más exacta de presentar las informaciones.
Una tabla consta de varias partes, las principales son las siguientes:
Título: Es la parte más importante del cuadro y sirve para describir todo el contenido
de este.
Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de
cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la
tabla.
Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que
aparecen en la tabla o cuadro y que no han sido explicados en otras partes.
Se la utiliza con el fin de hacer recopilaciones numéricas bien estructuradas y fáciles
de interpretar para sintetizar los datos. Expresar valores, magnitudes u otros datos por
medio de tablas. Es una ordenación de datos, los cuales se representan en una tabla
en donde se colocan las variables de acuerdo a intervalos por medio de los cuales se
analizan los datos.
44
Ing. Priscila E. Crespo Ayala, Mgs.
UNIDAD EDUCATIVA “LAS ROCAS”
PRODUCTO MUJERES PORCENTAJE DE
MUJERES QUE
COMPRARÍAN
HOMBRES PORCENTAJE DE
HOMBRES QUE
COMPRARÍAN
Comida 183 57% 182 72%
Artículos
Escolares
60 18% 51 20%
Bisutería 80 25% 520 8%
Total 323 100.00% 253 100.00%
Fuente: Alumnos de la Unidad Educativa “Las Rocas”, 2do Quimestre 2019
Ventajas de la tabulación:
• Fácil de leer.
• Un cuadro con su título se explica por sí mismo.
• Es más breve que el texto, elimina la necesidad de repetir las explicaciones.
• Permite presentar varios grupos de datos en un mismo cuadro.
• Se manejan valores exactos.
Actividad de Aprendizaje 3 de la Unidad Didáctica II:
2.3. Distribución de Frecuencias.
La organización de los datos constituye la primera etapa de su tratamiento, puesto
que facilita los cálculos posteriores y evita posibles confusiones. Realmente, la
organización de la información tiene una raíz histórica y, actualmente, con el desarrollo
de los medios informáticos, tiene menos importancia desde un punto de vista aplicado.
Cuando no existían ordenadores, o ni siquiera calculadoras, si se disponía de un
conjunto de datos, era necesario dotarlos de alguna estructura que permitiera
resumirlos y comprenderlos de una forma más o menos sencilla.
En base a la información
proporcionada en esta guía en
líneas anteriores, elabore una
tabla estadística con 5 productos,
diferentes a los del ejemplo citado
Estadística Descriptiva
45
La organización va a depender del número de observaciones distintas que se tengan
y de las veces que se repitan cada una de ellas. En base a lo anterior, se pueden
estructurar los datos de maneras diferentes.
Cuando se tiene un gran número de observaciones, pero muy pocas distintas, se
pueden organizar en una tabla de frecuencias, es decir, cada uno de los valores
acompañado de la frecuencia (también llamada frecuencia absoluta) con la que
aparece. Este es el tipo de tabla que acompaña a una variable discreta.
La frecuencia absoluta fi indica el número de veces que aparece un dato xi en el
estudio estadístico.
La frecuencia relativa hi es el cociente entre la frecuencia absoluta de un dato xi y
el número total de datos.
La frecuencia absoluta acumulada Fi es la suma de la frecuencia absoluta de un
dato xi y la de los datos menores que él.
Ejemplo:
En un centro recreativo para adultos mayores se realizó una encuesta a 25 personas
con el fin de saber cuántos días por semana van a este centro. En la encuesta se
obtuvieron los siguientes resultados:
5, 2, 3, 1, 2, 4, 5, 4, 2, 1, 5, 5, 3, 4, 2, 1, 4, 4, 5, 4, 5, 5, 5, 1, 3.
Los datos recogidos se organizan.
Número de días por semana 1 2 3 4 5
Número de personas 4 4 3 6 8
En esta tabla se observa que, por ejemplo, hay seis adultos mayores que van al centro
recreativo cuatro veces por semana; esto significa que la frecuencia absoluta del dato
“van cuatro veces por semana” es 6.
La siguiente tabla muestra las frecuencias absolutas, relativas y acumuladas de los
datos del Ejemplo.
46
Ing. Priscila E. Crespo Ayala, Mgs.
Datos Frecuencias
absolutas
Frecuencias
relativas
Frecuencias
absolutas
acumuladas
1 4 4/25=0.16 4
2 4 4/25=0.16 4+4= 8
3 3 3/25= 0.12 4+4+3= 11
4 6 6/25= 0.24 4+4+3+6= 17
5 8 8/25= 0.32 4+4+3+6+8= 25
Suma= 25 Suma= 1
En esta tabla, el valor 17 de la columna de frecuencias absolutas acumuladas indica
el número de personas que asisten como máximo cuatro días por semana al centro
recreativo.
En base al ejemplo citado en
líneas anteriores, elabore usted
su propio ejercicio, aplicando las
fórmulas correspondientes.
Estadística Descriptiva
47
Datos agrupados
Si una variable estadística es cuantitativa continua
o cuantitativa discreta con un número grande de
datos, conviene agrupar dichos datos en
intervalos o clases que tengan la misma amplitud,
es decir la misma cantidad de números en cada
intervalo.
En cada intervalo se toma un valor representativo
llamado marca de clase, que corresponde al valor
medio del intervalo. Para hallar la marca de clase, se suman los extremos del intervalo
y se divide el resultado entre dos.
A cuarenta estudiantes se les solicitó medir el tiempo (en minutos) que navegaron por
internet durante un fin de semana. Los resultados obtenidos ordenados de forma
ascendente son:
0, 15, 20, 35, 35, 38, 40, 45, 45, 45, 50, 55, 58, 65, 65, 70, 72, 90, 95, 100, 100, 110,
110, 110, 120, 125, 125, 130, 130, 130, 150, 160, 170, 175, 180, 185, 190, 195, 200,
220.
Calcular el número de clase o número de intervalos: - Existen varios métodos,
utilizaremos la siguiente fórmula:
2k >n
En donde n es el número de datos
K es el número de intervalos que estamos buscando
Para ubicar el valor de k que nos resuelve el ejercicio con n= 40. Utilizamos una tabla
de valores de k.
48
Ing. Priscila E. Crespo Ayala, Mgs.
Rango:- Para calcular el rango utilizamos la siguiente fórmula
R= Dato mayor – Dato menor
R= 220 – 0
R=220
Ancho del intervalo: - Debe ser mayor al Rango dividido para el número de clase.
i= 220/6
i= >36,7
En mi caso voy a escoger a 40.
i= 40
k 2k
1 2
2 4
3 8
4 16
5 32
6 64
7 128
8 256
9 512
10 1024
Seleccionamos
k= 6
Porque 26 > 40
Estadística Descriptiva
49
Tiempo
en
minutos
[0,40)
[40,80)
[80,120)
[120,160)
[160,200)
[200,240)
Marca de clase: - La marca de clase se halla dividiendo la suma de los extremos de
los intervalos entre 2.
Tiempo
en
minutos
Marca de
clase
[0,40) 20
[40,80) 6
[80,120) 100
[120,160) 140
[160,200) 180
[200,240) 220
Frecuencia Absoluta
Tiempo en
minutos
Marca
de clase
fi
frecuencia
absoluta
hi
(frecuencia
relativa)
Hi(%) Fi
Frecuencia
absoluta
acumulada
Hi
Frecuencia
relativa
acumulada
Hi%
[0,40) 20 6 6/40= 0.5 50 6 0.5 50
[40,80) 6 11 11/40= 0.2 20 17 0.7 70
[80,120) 100 7 7/40= 0.1 10 24 0.8 80
[120,160) 140 7 7/40= 0.1 10 31 0.9 90
[160,200) 180 7 7/40= 0.1 10 38 1 100
Marca de clase del primer intervalo
40 -20 = 20
2
Y se procede de igual manera para
los demás intervalos
50
Ing. Priscila E. Crespo Ayala, Mgs.
[200,240) 220 2 2/40= 0.0 0 40 1 100
total 40 1 100
Actividad de Aprendizaje 4 de la Unidad Didáctica II:
2.4. Medidas de Tendencia central
Media Aritmética: - La media aritmética o promedio de un conjunto de datos es el
cociente entre la suma de todos los datos y el número total de estos.
Ejemplo:
La primera columna de la Tabla muestra el tiempo semanal en horas que dedica a
navegar por internet un grupo de estudiantes; la segunda columna indica la frecuencia
absoluta de cada tiempo, y en la tercera se calcula el producto de cada tiempo por su
frecuencia.
Complete la tabla estadística de datos agrupados,
de acuerdo a los datos subidos por el docente en
la plataforma Amauta.
Estadística Descriptiva
51
Tiempo en horas Frecuencia absoluta Dato * frecuencia
3 3 3*3=9
4 5 4*5=20
5 15 5*15=75
6 6 6*6=36
7 4 7*4=28
8 2 8*2=16
Total 35 184
Por tanto, en promedio los estudiantes navegan por internet 184/35 = 5.26 horas
semanales.
Media Ponderada: - En ocasiones, no todos los datos de la variable tienen la misma
importancia. En tal caso, se multiplican los datos por distintos números, que se
denominan pesos y que modifican su valor.
Para calcular la media aritmética ponderada se
siguen estos pasos.
1. Se multiplica cada dato por su peso y se suman los
resultados.
2. Se divide la cantidad obtenida por la suma de los
pesos.
Plantee un ejercicio para resolver la media
aritmética en una tabla estadística, basándose en
el ejercicio revisado anteriormente.
52
Ing. Priscila E. Crespo Ayala, Mgs.
Ejemplo:
En un concurso, se asigna un puntaje a un ejercicio de salto y otro al tiempo de
ejecución, dándole una importancia de siete al primero y de tres al segundo. Clara
obtuvo nueve en salto y seis en tiempo de ejecución. ¿Cuál fue su puntuación final?
9 ∙ 7 + 6 ∙ 3
7 + 3=
81
10= 8.1
La puntuación de Clara es 8,1. El valor calculado es la media aritmética ponderada.
Media Aritmética de Datos Agrupados: - Para calcular la media aritmética o
promedio de un conjunto de datos agrupados, se deben calcular las marcas de clase
de los intervalos, luego se multiplican las marcas de clase por sus frecuencias
absolutas respectivas y finalmente, se divide la suma de estos productos por el total
de datos.
Ejemplo:
En la Tabla se registraron las estaturas de los estudiantes de octavo EGB de un
colegio.
Estatura (m) Número de
estudiantes
[1.40;1.45) 2
[1.45;1.50) 10
[1.50;1.55) 25
[1.55;1.60) 2
Plantee 3 ejercicios para encontrar la media
ponderada.
Estadística Descriptiva
53
Para calcular la media aritmética de este grupo de datos, se construye una tabla en la
que se agregan dos columnas más: marca de clase (xi) y producto entre xi y su
correspondiente frecuencia absoluta fi, como se muestra en la Tabla.
Estatura (m) Marca de clase
(xi)
Frecuencia
absoluta
(fi)
Marca *
Frecuencia
(xi * f)
[1.40;1.45) 1.425 2 2.85
[1.45;1.50) 1.475 10 14.75
[1.50;1.55) 1.525 25 38.125
[1.55;1.60) 1.575 5 7.875
Total 42 63.6
Entonces, la media aritmética de la estatura de los estudiantes de octavo EGB es:
63,6/42 = 1,51 m.
Moda Y Clase Modal: - La moda de un conjunto de datos es el dato que tiene la mayor
frecuencia absoluta. Si los datos están agrupados en clases, la clase de mayor
frecuencia es la clase modal; en este caso, el valor de la moda corresponde a la marca
de clase modal, es decir, al punto medio de la clase.
Ejemplo:
Las edades de los 550 estudiantes que usan como medio de transporte el bus escolar
para llegar al colegio, se presentan agrupadas en la Tabla.
Complete la tabla estadística de acuerdo a los
datos subidos por el docente en la plataforma
Amauta, para encontrar la media aritmética de
datos agrupados.
54
Ing. Priscila E. Crespo Ayala, Mgs.
Mediana Y Clase Mediana: - La mediana es el valor que ocupa la posición central de
todos los datos cuando estos están ordenados de menor a mayor. En un conjunto de
datos agrupados la mediana se encuentra en la clase mediana, para la cual la
frecuencia absoluta acumulada es el primer valor mayor o igual a la mitad del tamaño
de la muestra.
Edad Fi
[5,8) 220
[8,11) 115
[11,14) 87
[14,17) 83
[17,20) 45
Como la mayor frecuencia se
presenta en el intervalo [5, 8), esa se
considera la clase modal. La moda es
la marca de clase de este intervalo, es
decir, 6,5 años.
La moda no necesariamente es única, como sí lo son la
media y la mediana.
Si en un estudio estadístico el número de datos es impar,
la mediana es el valor central.
Si en el estudio estadístico el número de datos es par, la
mediana es la media aritmética de los dos valores
centrales.
Plantee un ejercicio para resolver la moda y clase
modal de una tabla estadística, basándose en el
ejercicio revisado anteriormente.
Estadística Descriptiva
55
Actividad de Aprendizaje 5 de la Unidad Didáctica II:
2.5. Medidas de dispersión
Rango: - El rango o recorrido de un conjunto de datos es la diferencia entre el mayor
y el menor valor de los datos. Si los datos están agrupados en clases, el rango se
calcula como la diferencia entre el extremo superior del último intervalo y el extremo
inferior del primero.
Ejemplo:
Los rangos de los salarios de las compañías de la situación inicial son:
Compañía A: $ 4 500 - $ 1 200 = $ 3 300
Compañía B: $ 2 600 - $ 2 300 = $ 300
Los puntos azules del diagrama de dispersión de la Figura representan los salarios de
la compañía A y los rojos, los de la compañía B.
Ejemplo:
56
Ing. Priscila E. Crespo Ayala, Mgs.
Las estaturas de los 64 estudiantes de octavo EGB de un colegio
se registran en la Tabla. Como el extremo superior del último
intervalo es 200 y el extremo inferior del primero es 150, el rango
de la distribución es 200 - 150 = 50 cm.
DESVIACIÓN MEDIA: - La desviación respecto a la media es la diferencia entre cada
valor de la variable estadística y la media aritmética.
Para calcular la desviación media de un conjunto de datos:
1. Se hallan las desviaciones respecto a la media: dato - media
2. Se calculan los valores absolutos de las desviaciones: |dato - media|
3. Se encuentra la media aritmética de los valores absolutos de las desviaciones.
Ejemplo:
Las estaturas, en centímetros, de los jugadores de dos equipos de baloncesto son:
Equipo A: 190, 192, 195, 198, 200
Equipo B: 170, 175, 195, 215, 220
Estatura media del equipo A: 190+192+195+198+200
5= 195 𝑐𝑚
Estatura media del equipo B: 170+175+195+215+220
5= 195 𝑐𝑚
Las tablas presentan las desviaciones con respecto a la media y sus valores
absolutos.
Estatura
(cm)
fi
[150,160) 18
[160,170) 24
[170,180) 14
[180,190) 7
[190,200) 1
Estadística Descriptiva
57
Las desviaciones medias de las estaturas de los equipos A y B son:
5 + 3 + 0 + 3 + 5
5=
16
5= 3,2 𝑐𝑚
25 + 20 + 0 + 20 + 25
5=
90
5= 18 𝑐𝑚
Como la desviación media del equipo B es mayor que la del equipo A, entonces las
estaturas de los integrantes del equipo B están más dispersas que las del equipo A,
como se observa en las figuras.
Equipo A
Datos Dato - media |Dato – media|
190 190-195= -5 5
192 192-195= -3 3
195 195-195= 0 0
198 198-195= 3 3
200 200-195=5 5
Suma= 16
Equipo B
Datos Dato - media |Dato – media|
170 170-195= -25 25
175 175-195= -20 20
195 195-195= 0 0
215 215-195= 20 20
220 220-195= 25 25
Suma= 90
Resuelva el ejercicio planteado por el docente
para encontrar la desviación media.
58
Ing. Priscila E. Crespo Ayala, Mgs.
Varianza Y Desviación Típica: - La varianza de una distribución estadística es la
media aritmética de los cuadrados de las desviaciones respecto de la media. Se
representa por s2 y está dada por la expresión:
La desviación típica s es la raíz cuadrada positiva de la varianza.
Ejemplo:
Halla la varianza y la desviación típica de las edades 4, 8, 2 y 9 cuya media es 5,75.
Primero, se completa la Tabla 5 incluyendo las desviaciones con respecto a la media
y sus cuadrados. De acuerdo con la definición, la varianza y la desviación típica de la
distribución son, respectivamente:
𝑠2 =32,75
4= 8,1875 => 𝑠 = √8,1875 = 2,86
En base a la información dada por el docente encuentre la varianza y
desviación típica.
La suma de las desviaciones respecto a la media
siempre es 0. Por ello, para hallar la dispersión de
los datos se recurre a la desviación media (valor
absoluto de las desviaciones respecto a la media)
o a la varianza (cuadrado de las desviaciones
respecto a la media).
Estadística Descriptiva
59
La Estadística Descriptiva, simplemente la utilizamos para resumir de forma numérica o gráfica un
conjunto de datos.
Tabulación de datos, cuando los datos estadísticos se presentan a través de un conjunto de filas y
de columnas que responden a un ordenamiento lógico.
La suma N de las frecuencias absolutas es igual al número de datos.
La suma de las frecuencias relativas siempre es igual a1. Estas expresan el porcentaje o tanto por
ciento de la población que tiene ese dato.
Cada uno de los intervalos en los que se agrupan los datos incluye el extremo izquierdo, pero no el
derecho.
En una tabla estadística usualmente la frecuencia absoluta se nota f i, la frecuencia relativa hi, la
frecuencia absoluta acumulada Fi y la frecuencia relativa acumulada Hi.
La media aritmética o promedio de un conjunto de datos está comprendida entre el menor y el
mayor de los datos del conjunto.
La moda no necesariamente es única, como sí lo son la media y la mediana.
Si en un estudio estadístico el número de datos es impar, la mediana es el valor central.
Si en el estudio estadístico el número de datos es par, la mediana es la medida aritmética de los dos
valores centrales.
Un diagrama de dispersión muestra los datos como un conjunto de puntos.
La suma de las desviaciones respecto a la media siempre es 0
60
Ing. Priscila E. Crespo Ayala, Mgs.
Estadística descriptiva es la parte de la estadística que permite analizar todo un
conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para
ese conjunto.
Tabulación es cuando los datos estadísticos se presentan a través de un conjunto de
filas y de columnas que responden a un ordenamiento lógico.
La frecuencia absoluta fi indica el número de veces que aparece un dato xi en el estudio
estadístico.
La frecuencia relativa hi es el cociente entre la frecuencia absoluta de un dato xi y el
número total de datos.
La frecuencia absoluta acumulada Fi es la suma de la frecuencia absoluta de un dato
xi y la de los datos menores que él. Fórmula para calcular el número de clase 2k>n.
Ancho del intervalo: - Debe ser mayor al Rango dividido para el número de clase.
Marca de clase: - La marca de clase se halla dividiendo la suma de los extremos de los
intervalos entre 2
MEDIDAS DE TENDENCIA CENTRAL
Media Aritmética: - La media aritmética o promedio de un conjunto de datos es el cociente
entre la suma de todos los datos y el número total de estos.
Media Ponderada: - En ocasiones, no todos los datos de la variable tienen la misma
importancia. En tal caso, se multiplican los datos por distintos números, que se denominan
pesos y que modifican su valor.
Media Aritmética De Datos Agrupados: - Para calcular la media aritmética o promedio
de un conjunto de datos agrupados, se deben calcular las marcas de clase de los
intervalos, luego se multiplican las marcas de clase por sus frecuencias absolutas
respectivas y finalmente, se divide la suma de estos productos por el total de datos
Moda Y Clase Modal: - La moda de un conjunto de datos es el dato que tiene la mayor
frecuencia absoluta. Si los datos están agrupados en clases, la clase de mayor frecuencia
es la clase modal; en este caso, el valor de la moda corresponde a la marca de clase
modal, es decir, al punto medio de la clase.
Mediana Y Clase Mediana: - La mediana es el valor que ocupa la posición central de
todos los datos cuando estos están ordenados de menor a mayor.
MEDIDAS DE DISPERSIÓN
Rango: - El rango o recorrido de un conjunto de datos es la diferencia entre el mayor y el
menor valor de los datos.
Desviación Media: - La desviación respecto a la media es la diferencia entre cada valor
de la variable estadística y la media aritmética.
Varianza Y Desviación Típica: - La varianza de una distribución estadística es la media
aritmética de los cuadrados de las desviaciones respecto de la media. Se representa por
s2
Estadística Descriptiva
61
Actividades de Auto – evaluación de la Unidad Didáctica II:
➢ Realizar un organizador gráfico de la distribución de frecuencias, medidas
de tendencia central, medidas de dispersión.
➢ Realizar un ejemplo de tabulación y aplicación de las frecuencias.
➢ Realizar dos ejercicios que impliquen lo revisado en la unidad II.
Actividad de Evaluación de la Unidad Didáctica II:
Este atento a la plataforma Amauta que se subirá
la actividad de evaluación final de la Unidad
Didáctica II.
62
Ing. Priscila E. Crespo Ayala, Mgs.
Unidad didáctica III
Título de la Unidad Didáctica III: Análisis Combinatorio
Introducción de la Unidad Didáctica III:
A menudo nos encontramos con preguntas del tipo ¿Qué proporción de...? ¿Cuál es
la probabilidad de...? ¿De cuántas maneras se puede...? Muchas veces, para
responder, se necesita un pensamiento sistemático y un poco de información
adicional; por ejemplo, ¿Cuántas rutas diferentes puedo usar para ir de Buenos Aires
a San Luis? o ¿De cuántas maneras pueden quedar los 3 primeros puestos en una
carrera de 6 caballos? Hay técnicas y principios matemáticos útiles en situaciones
variadas, pero muchas preguntas se pueden responder directamente, contando en
forma sistemática, es decir, listando todos los posibles resultados en un orden, para
luego contar cuántos son, o desarrollando reglas de conteo.
Objetivo de la Unidad Didáctica III:
Calcular el número de arreglos diferentes que se pueden hacer con una colección
de objetos, con respeto.
Organizador Gráfico de la Unidad Didáctica III:
ANALISIS COMBINATORIO
Principios de multiplicación y
diagrama de árbolPermutaciones Combinaciones
Estadística Descriptiva
63
Actividades de Aprendizaje de la Unidad Didáctica III:
Actividad de Aprendizaje 1 de la Unidad Didáctica III:
Análisis Combinatorio.
Por Análisis Combinatorio, o Combinatoria, se entiende aquella parte del Álgebra que
se ocupa del estudio y propiedades de los grupos que pueden formarse con unos
elementos dados, distinguiéndose entre sí:
• por el número de elementos que entran en cada grupo
• por el orden de colocación
Los m elementos de que se dispone para formar los grupos pueden ser distintos o
bien puede haber algunos iguales. En el primer caso, las agrupaciones formadas se
llaman ordinarias, las formadas en el segundo supuesto se denominan agrupaciones
con repetición.
Según los criterios empleados para la formación, las agrupaciones pueden ser de tres
tipos:
• variaciones
• permutaciones
• combinaciones
El análisis combinatorio permite, en relación al experimento planteado y sin perder
ningún caso, calcular los valores necesarios para aplicar la regla de Laplace:
𝑃 (𝐴) =𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑠𝑢𝑐𝑒𝑠𝑜 𝐴
𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Investigue una definición de análisis combinatorio y
de los tipos que existen.
64
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 2 de la Unidad Didáctica III:
Principios de Multiplicación.
El principio multiplicativo es una técnica que se utiliza para resolver problemas de
conteo para hallar la solución sin que sea necesario enumerar sus elementos. Es
conocido también como el principio fundamental del análisis combinatorio; se basa en
la multiplicación sucesiva para determinar la forma en la que puede ocurrir un evento.
Si un evento A se puede realizar de «m» formas diferentes y luego se puede realizar
otro evento B de «n» formas diferentes, el número total de formas en que pueden
ocurrir A y B es igual a m x n. Es decir, ambos eventos se realizan, primero uno y
luego el otro. El «y» indica multiplicación. Esto se conoce como principio de
multiplicación o principio fundamental del análisis combinatorio
Ejemplo:
¿De cuántas formas se puede vestir una persona que tiene 3 pantalones y 3 camisas?
Para vestirse, la persona se pone el pantalón y luego la camisa, es decir tiene 3 x 3 =
9 opciones diferentes de vestirse.
Ejemplo 2:
Un restaurante ofrece dentro de su menú diario dos tipos de sopa, tres tipos de carne,
dos tipos de ensalada, 5 variedades de bebidas y 3 opciones de postre.
Como estrategia de mercadeo, el dueño del restaurante quiere saber cuántas
posibilidades de menú diferentes puede ofrecer en un mismo día.
SOLUCIÓN:
En este caso el orden en que se establezcan las combinaciones no interesa, pero sí
el número de ellas. Además, no hay repetición de los elementos, pues para el menú
no se ofrece la combinación sopa-sopa-carne.
Así, por el principio de multiplicación se tiene que:
SOPA CARNE ENSALADA BEBIDA POSTRE TOTAL
2 * 3 * 2 * 5 * 3 180
Estadística Descriptiva
65
Por lo tanto, se pueden obtener 180 platos diferentes.
Ejemplo 3:
Una persona desea construir su casa, para lo cual considera que puede construir los
cimientos de su casa de cualquiera de dos maneras (concreto o block de cemento),
mientras que las paredes las puede hacer de adobe, adobón o ladrillo, el techo puede
ser de concreto o lámina galvanizada y por último los acabados los puede realizar de
una sola manera ¿cuántas maneras tiene esta persona de construir su casa?
Solución:
Considerando que r = 4 pasos
N1= maneras de hacer cimientos = 2
N2= maneras de construir paredes = 3
N3= maneras de hacer techos = 2
N4= maneras de hacer acabados = 1
N1x N2x N3x N4= 2 x 3 x 2 x 1 = 12 maneras de construir la casa
Actividad de Aprendizaje 3 de la Unidad Didáctica III:
Diagrama de árbol
Un diagrama de árbol es el dibujo que se usa para enumerar todos los resultados
posibles de una serie de experimentos en donde cada experimento se puede en un
número finito de maneras.
Con tres ejemplos explique el principio de
multiplicaci
66
Ing. Priscila E. Crespo Ayala, Mgs.
Un diagrama de árbol es una representación gráfica de un experimento que consta de
r pasos, donde cada uno de los pasos tiene un número finito de maneras de ser llevado
a cabo.
Ejemplos:
1) Un médico general clasifica a sus pacientes de acuerdo a: su sexo (masculino
o femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presión sanguínea
(Normal, Alta o Baja). ¿Mediante un diagrama de árbol diga en cuantas
clasificaciones pueden estar los pacientes de este médico?
2) Un hombre tiene tiempo de jugar ruleta cinco veces como máximo, él empieza
a jugar con un dólar, apuesta cada vez un dólar y puede ganar o perder en cada
juego un dólar, él se va a retirar de jugar si pierde todo su dinero, si gana tres
dólares (esto es si completa un total de cuatro dólares) o si completa los cinco
juegos, mediante un diagrama de árbol, diga cuántas maneras hay de que se
efectué el juego de este hombre.
Estadística Descriptiva
67
Actividad de Aprendizaje 4 de la Unidad Didáctica III:
Permutaciones.
Son eventos de tipo multiplicativo, donde el número de posibilidades va disminuyendo
y si importa el orden; una permutación es un arreglo de un conjunto de objetos en un
orden definido.
Hay dos tipos de permutaciones:
Se permite repetir: como la clave de una cerradura, podría ser "333".
Comente sobre el análisis del diagrama del árbol.
68
Ing. Priscila E. Crespo Ayala, Mgs.
Sin repetición: por ejemplo, los tres primeros en una carrera. No puedes quedar
primero y segundo a la vez.
1. Permutaciones con repetición
Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las
permutaciones posibles son:
n × n × ... (r veces) = nr
(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades
para la segunda elección, y así.)
Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y eliges 3
de ellos:
10 × 10 × ... (3 veces) = 103 = 1000 permutaciones
Así que la fórmula es simplemente:
nr
Permutaciones sin repetición
En este caso, se reduce el número de opciones en cada paso.
Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?
Después de elegir por ejemplo la "14" no puedes elegirla otra vez.
Donde n es el número de cosas que puedes
elegir, y eliges r de ellas
(Se puede repetir, el orden importa)
Estadística Descriptiva
69
Así que tu primera elección tiene 16 posibilidades, y tu siguiente elección tiene 15
posibilidades, después 14, 13, etc. Y el total de permutaciones sería:
16 × 15 × 14 × 13 ... = 20,922,789,888,000
Pero a lo mejor no quieres elegirlas todas, sólo 3 de ellas, así que sería solamente:
16 × 15 × 14 = 3360
Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.
¿Pero cómo lo escribimos matemáticamente? Respuesta: usamos la "función
factorial"
Así que si quieres elegir todas las bolas de billar las permutaciones serían:
16! = 20,922,789,888,000
Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo lo
escribimos? Hay un buen truco... dividimos entre 13!...
16 ∗ 15 ∗ 14 ∗ 13 ∗ 12 …
13 ∗ 12 …= 16 ∗ 15 ∗ 14 = 3360
¿Lo ves? 16! / 13! = 16 × 15 × 14
La fórmula se escribe:
70
Ing. Priscila E. Crespo Ayala, Mgs.
Ejemplo:
Nuestro "ejemplo de elegir en orden 3 bolas de 16" sería:
16!
(16 − 3)!=
16!
13!=
20,922,789,888,000
6,227,020,800= 3360
¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas?
10!
(10 − 2)!=
10!
8!=
3,628,800
40,320= 90
(Que es lo mismo que: 10 × 9 = 90)
Notación
En lugar de escribir toda la fórmula, la gente usa otras notaciones como:
P(n,r) = nPr = nPr = 𝑛!
(𝑛−𝑟)!
Estadística Descriptiva
71
Actividad de Aprendizaje 5 de la Unidad Didáctica III:
Combinaciones.
Una combinación de r elementos tomados de un conjunto de n elementos (r ≤ n ) es
una subconjunto no ordenado de los r elementos. El número de combinaciones de
tamaño r que se pueden seleccionar de n objetos distintos viene dado por la expresión:
𝐶𝑛,𝑟 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑟 + 1)
𝑟!=
𝑃𝑛,𝑟
𝑟!=
𝑛!
𝑟! ∙ (𝑛 − 𝑟)!= [
𝑛
𝑟]
También hay dos tipos de combinaciones (recuerda que ahora el orden no importa):
Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10)
Sin repetición: como números de lotería (2,14,15,27,30,33)
Combinaciones sin repetición
Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números
de la suerte (da igual el orden) ¡entonces has ganado!
La manera más fácil de explicarlo es:
Imaginemos que el orden sí importa (permutaciones), después lo cambiamos para que
el orden no importe.
Plantee un ejercicio con permutaciones con
repetición y otro sin repetición.
72
Ing. Priscila E. Crespo Ayala, Mgs.
Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se eligieron,
no el orden.
Ya sabemos que 3 de 16 dan 3360 permutaciones.
Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.
Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:
El orden si importa El orden no importa
1 2 3
1 3 2
2 1 3
2 3 1 1 2 3
3 1 2
3 2 1
Así que las permutaciones son 6 veces más posibilidades.
De hecho, hay una manera fácil de saber de cuántas maneras "1 2 3" se pueden
ordenar, y ya la sabemos. La respuesta es:
3! = 3 × 2 × 1 = 6
(Otro ejemplo: ¡4 cosas se pueden ordenar de 4! = 4 × 3 × 2 × 1 = 24 maneras distintas,
¡prueba tú mismo!)
Así que sólo tenemos que ajustar nuestra fórmula de permutaciones para reducir por
las maneras de ordenar los objetos elegidos (porque no nos interesa ordenarlos):
𝑛!
(𝑛 − 𝑟)! ∙
1
𝑟!=
𝑛!
𝑟! (𝑛 − 𝑟)!
Esta fórmula es tan importante que normalmente se la escribe con grandes paréntesis,
así:
Estadística Descriptiva
73
𝑛!
𝑟! (𝑛 − 𝑟)!= [
𝑛
𝑟]
donde n es el número de cosas que puedes elegir, y eliges r de ellas
(No se puede repetir, el orden no importa)
Y se la llama "coeficiente binomial".
Notación
Además de los "grandes paréntesis", la gente también usa estas notaciones:
C(n,r) = nCr = nCr = (𝑛
𝑟) =
𝑛!
𝑟!(𝑛−𝑟)!
Ejemplo
Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:
16!
3! (16 − 3)!=
16!
3! ∙ 13!=
20,922,789,888,000
6 ∙ 6,227,020,800= 560
O lo puedes hacer así:
16 ∙ 15 ∙ 14
3 ∙ 2 ∙ 1=
3360
6= 560
Es interesante darse cuenta de que la fórmula es bonita y simétrica:
Así que recuerda, haz las
permutaciones, después
reduce entre "r!"
... o mejor todavía...
¡Recuerda la fórmula!
74
Ing. Priscila E. Crespo Ayala, Mgs.
Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir 13
bolas de 16.
Combinaciones con repetición
Digamos que tenemos cinco sabores de helado: banana, chocolate, limón, fresa y
vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?
Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son:
{c, c, c} (3 de chocolate)
{b, l, v} (uno de banana, uno de limón y uno de vainilla)
{b, v, v} (uno de banana, dos de vainilla)
(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.
El orden no importa, ¡y sí puedes repetir!)
Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una
técnica especial para que lo averigües tú mismo.
Ahora puedes escribirlo como → ooo →→→ (la flecha es saltar, el círculo es tomar)
Imagina que el helado está en contenedores, podrías decir "sáltate el
primero, después 3 paladas, después sáltate los 3 contenedores
siguientes" ¡y acabarás con 3 paladas de chocolate!
Entonces es como si ordenaras a un robot que te trajera helado, pero
no cambia nada, tendrás lo que quieres.
Estadística Descriptiva
75
Entonces los tres ejemplos de arriba se pueden escribir así:
{c, c, c} (3 de chocolate): →ooo→→→
{b, l, v} (uno de banana, uno de limón y uno de vainilla): o→→o→→o
{b, v, v} (uno de banana, dos de vainilla): o→→→oo
OK, entonces ya no nos tenemos que preocupar por diferentes sabores, ahora
tenemos un problema más simple para resolver: "de cuántas maneras puedes ordenar
flechas y círculos"
Fíjate en que siempre hay 3 círculos (3 paladas de helado) y 4 flechas (tenemos que
movernos 4 veces para ir del contenedor 1º al 5º).
Así que (en general) hay r + (n-1) posiciones, y queremos que r de ellas tengan
círculos.
Esto es como decir "tenemos r + (n-1) bolas de billar y queremos elegir r de ellas". Es
decir, es como el problema de elegir bolas de billar, pero con números un poco
distintos. Lo podrías escribir así:
Es interesante pensar que podríamos habernos fijado en flechas en vez de círculos, y
entonces habríamos dicho "tenemos r + (n-1) posiciones y queremos que (n-1) tengan
flechas", y la respuesta sería la misma...
¿Qué pasa con nuestro ejemplo, cuál es la respuesta?
(5 + 3 − 1)!
3! (5 − 1)!=
7!
3! ∙ 4!=
5040
6 ∙ 24= 35
¡Uau, es un montón
de cosas que
absorber, quizás
tendrías que leerlo
otra vez para
entenderlo todo
bien!
76
Ing. Priscila E. Crespo Ayala, Mgs.
Por Análisis Combinatorio, o Combinatoria, se ocupa del estudio y propiedades de los
grupos que pueden formarse con unos elementos dados, distinguiéndose entre sí.
Principio de la multiplicación Fórmula:
N1x N2x N3x N4= 2 x 3 x 2 x 1 = 12
Diagrama de árbol
Es una representación gráfica de un experimento que consta de r pasos, donde cada
uno de los pasos tiene un número finito de maneras de ser llevado a cabo.
Permutaciones
Hay dos tipos de permutaciones: Se permite repetir, Sin repetición
! = significa que se multiplican números descendentes.
Combinaciones: no importa el orden.
Resuelva el ejercicio subido a la plataforma Amauta
por el docente, de combinaciones con repetición y
sin repetición.
Estadística Descriptiva
77
Principios de Multiplicación:
Sin que sea necesario enumerar sus elementos,
multiplicación sucesiva para determinar la forma en la
que puede ocurrir un evento.
N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12
Diagrama de árbol: dibujo que se usa para enumerar
todos los resultados posibles de una serie de
experimentos en donde cada experimento se puede en
un número finito de maneras.
Permutaciones: el número de posibilidades va
disminuyendo y si importa el orden
Tipos: se permite repetir
n x n … (r veces) = nr
no repetir.
𝒏!
(𝒏 − 𝒓)!
Combinaciones
El orden no importa.
Sin repetir
𝑛!
𝑟! (𝑛 − 𝑟)!= [
𝑛
𝑟]
Con repetición
78
Ing. Priscila E. Crespo Ayala, Mgs.
Actividades de Auto – evaluación de la Unidad Didáctica III:
1) Si se tiene una caja con 5 tornillos de diferente longitud y se extraen 3 tornillos de uno en uno con sustitución ¿Cuántas formas hay de seleccionar los tornillos?
2) Una caja fuerte tiene un clave, y su dueño, no la recuerda, hay 20 números posibles (0, 1, … 19) y debe elegir 6 de ellos.
3) Consideremos el conjunto A= {a,b,c,d,e}. Entonces las permutaciones de estos 5 elementos son:
4) Si tengo el 1,2,3,4,5. ¿Cuáles serían Las combinaciones sin repetición de dos elementos de esta muestra?
Actividad de Evaluación de la Unidad Didáctica III:
Este atento a la plataforma Amauta que se subirá la
actividad de evaluación final de la Unidad Didáctica
III.
Estadística Descriptiva
79
Unidad didáctica IV
Título de la Unidad Didáctica IV: Teoría de la probabilidad
Introducción de la Unidad Didáctica IV:
La teoría de la probabilidad es una herramienta matemática que establece un conjunto
de reglas o principios útiles para calcular la ocurrencia o no ocurrencia de fenómenos
aleatorios y procesos estocásticos.
En otras palabras, la teoría de la probabilidad está compuesta por todos los
conocimientos relativos al concepto de probabilidad. Se trata de un concepto, en
esencia, matemático. Así mismo, la probabilidad como rama de las matemáticas
constituye un instrumento para la estadística.
Objetivo de la Unidad Didáctica IV:
Desarrollar técnicas de conteo y teoría de probabilidades, con compromiso.
Organizador Gráfico de la Unidad Didáctica IV:
TEORIA DE LA PROBABILIDAD
Distribución de las probabilidades
Tipos de probabilidades
Reglas de la probabilidades
80
Ing. Priscila E. Crespo Ayala, Mgs.
Actividades de Aprendizaje de la Unidad Didáctica IV:
Actividad de Aprendizaje 1 de la Unidad Didáctica IV:
4.1. Conceptos Fundamentales.
El término Probabilidad se refiere al estudio del azar y la incertidumbre. En aquellas
situaciones en las cuáles se puede producir uno de varios resultados posibles, la
Teoría de la Probabilidad provee métodos para cuantificar la chance de ocurrencia de
cada uno de ellos.
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible
resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar
dichos resultados y saber si un suceso es más probable que otro. Con este fin,
introduciremos algunas definiciones:
Suceso
Es cada uno de los resultados posibles de una experiencia aleatoria.
Ejemplos:
Al lanzar una moneda salga cara.
Al lanzar un dado se obtenga 4.
Espacio muestral
Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo
representaremos por E (o bien por la letra griega Ω).
Ejemplos:
Espacio muestral de una moneda:
Estadística Descriptiva
81
E = {C, X}.
Espacio muestral de un dado:
E = {1, 2, 3, 4, 5, 6}.
Suceso aleatorio
Suceso aleatorio es cualquier subconjunto del espacio muestral.
Ejemplos:
Al tirar un dado un suceso sería salir par
Al tirar dos monedas un suceso sería sacar dos caras
Un ejemplo completo
Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas.
Calcular:
1. El espacio muestral.
E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n,b); (n,n,n)}
2. El suceso A = {extraer tres bolas del mismo color}.
A = {(b,b,b); (n,n,n)}
3. El suceso B = {extraer al menos una bola blanca}.
B = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n,b)}
4. El suceso C = {extraer una sola bola negra}.
C = {(b,b,n); (b,n,b); (n,b,b)}
TEN EN CUENTA
La mayoría de
experimentos aleatorios
se presentan en juegos,
concursos y
eventos naturales, entre
otros.
82
Ing. Priscila E. Crespo Ayala, Mgs.
Tipos de sucesos
• Suceso elemental: es el formado por un solo resultado.
• Suceso compuesto: es el formado por más de un resultado.
• Suceso seguro: es el que ocurre siempre en un determinado experimento.
• Suceso imposible: es el que nunca ocurre en un determinado experimento.
Los sucesos seguros se designan por E y los imposibles con Ø
Ejemplo
En el Mundial de Fútbol del 2018 se pueden presentar diferentes tipos de sucesos,
como se muestra en la Tabla:
Tipo de suceso El ganador del mundial será
Elemental El que ha ganado más copas mundiales.
A = {Brasil}
Compuesto El que ya ha sido campeón mundial.
B = {Brasil, Alemania, Italia, Argentina,
España, Inglaterra, Francia, Uruguay}
Seguro Uno de los equipos clasificados para el
Mundial de Fútbol 2022.
Imposible Un equipo no clasificado para el Mundial de
Fútbol 2022.C = Ø
Sucesos compatibles, incompatibles y contrarios
Dos sucesos son compatibles si tienen al menos un suceso elemental en común.
Dos sucesos son incompatibles si no tienen ningún suceso elemental en común.
Ejemplo
Estadística Descriptiva
83
Si se extrae al azar una bola de la urna de la Figura 2, es posible
determinar los siguientes sucesos:
H: “sacar una bola con el número 8”
G: “sacar una bola de color verde”
Estos dos sucesos son compatibles porque pueden
verificarse al mismo tiempo:
se puede extraer una bola de color verde que tenga el
número 8.
Por su parte, los sucesos P: “sacar una bola roja” y Q:
“sacar una bola con un número impar” son incompatibles,
porque cualquier bola que se extraiga de esa urna no
puede ser roja y tener un número impar al mismo tiempo.
Se llama suceso contrario de A al suceso que ocurre siempre que no ocurra A y se
expresa de la forma Ã. Los sucesos contrarios también se llaman complementarios.
Ejemplo
En el experimento que consiste en el lanzamiento de un dado cúbico con las caras
numeradas del 1 al 6, el suceso contrario a A: “salir número par” = {2, 4, 6} es el suceso
Ã: “salir número impar” = {1, 3, 5}.
Observa que si se verifica el suceso A no se verifica el suceso contrario à y viceversa.
Sucesos equiprobables
Los sucesos equiprobables son aquellos que tienen la misma probabilidad de ocurrir.
Ejemplo
En la Figura se muestra una urna con tantas bolas rojas como
azules. Los sucesos A: “sacar una bola roja” y B: “sacar una bola
azul” son equiprobables, ya que es igual de probable extraer una
bola roja o una bola azul de la urna.
El contrario del suceso
seguro (el espacio
muestral) es el suceso
imposible (el conjunto
vacío) y viceversa.
84
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 2 de la Unidad Didáctica IV:
4.2. Distribución de Probabilidad
Una distribución de probabilidad indica toda la gama de valores que pueden
representarse como resultado de un experimento si éste se llevase a cabo.
Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye
una herramienta fundamental para la prospectiva, puesto que se puede diseñar un
escenario de acontecimientos futuros considerando las tendencias actuales de
diversos fenómenos naturales.
Toda distribución de probabilidad es generada por una variable (porque puede tomar
diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede
ser de dos tipos: discreta o continua. Una variable aleatoria discreta es aquella
representada por números enteros, caracterizada por el límite de valores que puede
tomar. Por otro lado, una variable aleatoria continua no posee esta separación o
limitación, puede tomar cualquier valor dentro del límite establecido.
Tipos de distribución
El tipo de distribución depende del tipo de variable que se esté tratando. Existen
muchas, a continuación, las principales o más conocidas:
Para variables continuas: en el caso de que la variable aleatoria sea continua, la
distribución asociada es una distribución normal o de tipo Gaussiana.
Para variables discretas: en el caso de que la variable aleatoria sea discreta, pueden
existir varios tipos de distribuciones, las principales son la distribución binomial, la
distribución hipergeométrica y la distribución de Poisson (Se explicaran en el capítulo
siguiente)
Realice un organizador gráfico de la Teoría de la
probabilidad y los tipos de suceso.
Estadística Descriptiva
85
Distribución Normal
Es una de las más importantes en el área de estadística. Su desarrollo y explicación
se les atribuyen a diferentes investigadores, especialmente a Carl Friedrich Gauss.
Esta distribución considera dos parámetros, los cuales son el promedio o la media (μ)
y la desviación estándar (σ). Gracias a estos dos parámetros, tiene asociada una
ecuación, de la cual se desarrolla una gráfica conocida como campana de Gauss.
Esta gráfica es simétrica con respecto a la media y su apertura o ancho viene dada
por la desviación estándar. A su vez, en la gráfica se ve reflejada la distribución de la
probabilidad de la variable en estudio.
De esta distribución normal se desarrollan otros tres tipos de distribuciones:
T de Student
Ji-cuadrado
F de Fisher
Ejemplos de Distribución Normal
Algunos ejemplos donde puede darse una distribución normal son:
El efecto de un medicamento o fármaco.
El cambio de temperatura en una época del año específica.
Caracteres morfológicos como el peso o la estatura en un grupo de individuos.
T de Student
En probabilidad y estadística, es una distribución de probabilidad que surge del
problema de estimar la media de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño.
También se la llama teoría exacta del muestreo, ya que también la podemos utilizar
con muestras aleatorias de tamaño grande.
Para entender la distribución t Student es necesario conocer el concepto de “grados
de libertad”.
Para definir grados de libertad se hará referencia a la varianza maestral
86
Ing. Priscila E. Crespo Ayala, Mgs.
Esta fórmula está basada en n-1 grados de libertad. Esta terminología resulta del
hecho de que si bien S2 está basada en n cantidades x1 - ̅x, x2 - x̅, ̅x,… xn - ̅x, éstas
suman cero, así que especificar los valores de cualquier n -1 de las cantidades
determina el valor restante.
Por ejemplo, si n=4 y x1 -̅x = 8; x2 - ̅x = -6 y x4 - ̅x = -4, entonces automáticamente
tenemos x3 - x̅ = 2, así que sólo tres de las cuatro medidas de x1 - ̅x están libremente
determinadas, la otra debe tomar el valor que haga esta suma cero, es por esto que
solo tenemos 3 grados de libertad.
Grados de libertad = número de mediciones -1
Distribución de probabilidad t-Student
Una variable aleatoria se distribuye según el modelo de probabilidad t o T de Student
con k grados de libertad, donde k es un entero positivo, si su función de densidad es
la siguiente:
La gráfica de esta función de densidad es simétrica, respecto del eje de ordenadas,
con independencia del valor de k, y de forma algo semejante a la de una distribución
normal:
Estadística Descriptiva
87
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general
de la distribución t es similar a la de la distribución normal estándar: ambas son
simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media u
= o. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribución normal. A medida que el
número de grados de libertad tiende a infinito, la forma límite de la distribución t es la
distribución normal estándar.
88
Ing. Priscila E. Crespo Ayala, Mgs.
Propiedades de las distribuciones t.
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispersa que la curva normal estándar.
3. A medida que k aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que k -> 00, la secuencia de curvas t se aproxima a la curva normal
estándar.
Ejemplo:
Se desea saber si un instrumento de medición cualquiera está calibrado, desde el
punto de vista de la exactitud. Para ello se consigue un valor patrón y se lo mide 10
veces (por ejemplo: una pesa patrón para una balanza, un suero control para un
método clínico, etc.). Suponiendo que el resultado de estas mediciones arroja una
media de 52,9 y una desviación de 3, usando un patrón de valor 50, se debe
determinar si el instrumento está calibrado y la estimación de su error sistemático, si
es que se prueba su existencia (no se usan unidades para generalizar este ejemplo)
Estadística Descriptiva
89
Se trata de un ensayo de dos colas donde hay k - 1 = 9 grados de libertad. De la
tabla t-Student se obtienen los valores críticos para el 95% de t0,05,9 = 2,262, para el
99% de t 0,01,9 = 3,25 y para un nivel del 99,9% es t0,001,9 = 4,781. Lo que permite
establecer las zonas de aceptación y rechazo:
Mirando las zonas con los valores críticos, el valor de t cae en la de rechazo para el
95% y no alcanza para las otras. La conclusión es que se ha probado la existencia
de un error sistemático con una confianza del 95%.
90
Ing. Priscila E. Crespo Ayala, Mgs.
Ji-cuadrado
El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del
mismo nombre, sirve para someter a prueba hipótesis referidas a distribuciones de
frecuencias. En términos generales, esta prueba contrasta frecuencias observadas
con las frecuencias esperadas de acuerdo con la hipótesis nula.
Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su
distribución t de Student, nos han servido para someter a prueba hipótesis que
involucran a promedios y porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que
tiene distribución de probabilidad del mismo nombre, nos servirá para someter a
prueba hipótesis referidas a distribuciones de frecuencias.
En términos generales, esta prueba contrasta frecuencias observadas con las
frecuencias esperadas de acuerdo con la hipótesis nula
Ji- cuadrado como prueba de asociación
Supongamos que un investigador está interesado en evaluar la asociación entre uso
de cinturón de seguridad en vehículos particulares y el nivel socioeconómico del
conductor del vehículo. Con este objeto se toma una muestra de conductores a
quienes se clasifica en una tabla de asociación, encontrando los siguientes resultados:
Estadística Descriptiva
91
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel
socioeconómico? Usaremos un nivel de significación alfa=0,05.
Los pasos del análisis estadístico en este caso son los siguientes:
1. En primer lugar se debe plantear las hipótesis que someteremos a prueba
H0: “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.
H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables
analizadas son independientes.
2. En segundo lugar, obtener (calcular) las frecuencias esperadas
Estas son las frecuencias que debieran darse si las variables fueran independientes,
es decir, si fuera cierta la hipótesis nula.
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de
los casos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no lo usan. Esa
misma proporción se debería dar al interior de los tres grupos de nivel
socioeconómico, de manera que el cálculo responde al siguiente razonamiento: si de
94 personas 51 usan cinturón; de 21 personas, ¿cuántas debieran usarlo?
La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4. Este
procedimiento debe repetirse con todas las frecuencias del interior de la tabla.
El detalle de los cálculos es el siguiente:
Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6
Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2
Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2
92
Ing. Priscila E. Crespo Ayala, Mgs.
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así
tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.
3. En tercer lugar se debe calcular el estadístico de prueba
En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al comienzo,
compara las frecuencias que entregan los datos de la muestra (frecuencias
observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:
Donde oi representa a cada frecuencia observada y ei representa a cada frecuencia
esperada.
De este modo el valor del estadístico de prueba para este problema será:
Entonces x2 = 5,23. Este es el valor de nuestro estadístico de prueba que ahora,
siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar con
un valor de la tabla de probabilidades para ji-cuadrado (x2). Esta tabla es muy parecida
a la tabla t de student, pero tiene sólo valores positivos porque ji-cuadrado sólo da
Estadística Descriptiva
93
resultados positivos. Véase gráfico, que muestra la forma de la curva, con valores
desde 0 hasta infinito.
Dado que el estadístico ji cuadrada sólo toma valores positivos, la zona de rechazo
de la hipótesis nula siempre estará del lado derecho de la curva.
Uso de tabla ji-cuadrado
La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la
primera fila la probabilidad asociada a valores mayores a un determinado valor del
estadístico (véase gráfico de la tabla).
Los grados de libertad dependen del número de celdas que tiene la tabla de asociación
donde están los datos del problema y su fórmula de cálculo es muy sencilla:
Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)
Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad serán:
gl=(2-1)x(3-1)=2
Nótese que no se consideran la fila ni la columna de los totales.
94
Ing. Priscila E. Crespo Ayala, Mgs.
Tabla de ji-cuadrado.
Al comienzo elegimos un nivel de significación alfa=0,05. Entonces un valor de tabla
para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.
Por lo tanto, como en el gráfico vemos que 5,23 se encuentra a la izquierda de 5,99,
la probabilidad asociada a valores superiores a 5,23 es mayor que alfa (0,05).
Grados de
libertad
Estadística Descriptiva
95
Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso de
cinturón de seguridad” y “nivel socioeconómico” son independientes. Limitación: como
norma general, se exige que el 80% de las celdas en una tabla de asociación tengan
valores esperados mayores de 5.
Ji-cuadrado como prueba de bondad de ajuste
También se puede usar el estadístico ji-cuadrado para evaluar cuán buena puede
resultar una distribución teórica, cuando pretende representar la distribución real de
los datos de una muestra determinada. A esto se le llama evaluar la bondad de un
ajuste. Probar la bondad de un ajuste es ver en qué medida se ajustan los datos
observados a una distribución teórica o esperada.
Tomemos como ejemplo la distribución esperada para los individuos de una población
que son clasificados según grupo sanguíneo. Según estudios realizados en población,
se espera que dicha distribución, en porcentajes, sea la siguiente:
Ejemplo de distribución esperada.
96
Ing. Priscila E. Crespo Ayala, Mgs.
En una muestra de 150 dadores de sangre se encontró la siguiente distribución:
Ejemplo de distribución observada.
1. Las hipótesis del problema son:
H0: los datos se ajustan a la distribución teórica.
H1: los datos no se ajustan a la distribución teórica.
2. Siguiendo el esquema general de solución propuesto para las pruebas de hipótesis,
ahora corresponde elegir un nivel de significación
Elegimos entonces alfa=0,01. El estadístico de prueba será ji-cuadrado, cuya fórmula
es:
Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los
porcentajes esperados a la muestra de 150 casos podemos obtener las siguientes
frecuencias esperadas (ei):
Estadística Descriptiva
97
Ejemplo de frecuencias esperadas.
Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en este
caso: gl=4-1=3
Recordemos que la fila del total no se considera para los grados de libertad.
Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar
la diferencia entre ellas utilizando el estadístico ji-cuadrado. Si la diferencia entre
frecuencias observadas y esperadas es grande, significará que la hipótesis nula es
falsa, o sea, esta distribución no se ajusta a la distribución teórica y si, en cambio,
resulta que la diferencia entre frecuencias observadas y esperadas no es muy grande,
significará que la hipótesis nula es verdadera; por lo tanto, la distribución en la muestra
se ajusta a la distribución teórica y diremos que no hay significación estadística.
El valor del estadístico de prueba (x2) es una medida de la diferencia entre frecuencias
observadas y esperadas; por lo tanto, mientras mayor resulte, más fácil será rechazar
la hipótesis nula.
3. Se calcula el estadístico de prueba con los datos del ejemplo
4. Se compara este valor con el valor de ji-cuadrado de la tabla
El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad. Según
tabla, ese valor es 11,34.
98
Ing. Priscila E. Crespo Ayala, Mgs.
Al comparar el valor del estadístico de prueba (0,73) con el valor de tabla (11,34),
vemos que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia el centro de
la curva y que, por lo tanto, la probabilidad de valores mayores a él es muy superior
al nivel de significación alfa=0,01.
F de Fisher
Comparación de dos varianzas.
La necesidad de disponer de métodos estadísticos para comparar las varianzas de
dos poblaciones es evidente a partir del análisis de una sola población.
Frecuentemente se desea comparar la precisión de un instrumento de medición con
la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma
en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, Ϭ12 y Ϭ22,
utilizando la razón de las varianzas muestrales S2 1/S2 2. Si S2 1/S2 2 es casi igual a 1,
se tendrá poca evidencia para indicar que Ϭ12 y Ϭ2
2 no son iguales. Por otra parte, un
valor muy grande o muy pequeño para S21/S22, proporcionará evidencia de una
diferencia en las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-
cuadrada independiente, cada una dividida entre sus respectivos grados de libertad.
Esto es,
donde χ21 y χ2
2 son variables aleatorias ji-cuadrada independientes con grados de
libertad v1 y v2 respectivamente.
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha.
La distribución F es conocida como distribución de Fisher. Los valores de F se
encuentran tabulados para diferentes grados de significación y la forma de manejar
las tablas de F es similar a la que ya hemos visto para otras distribuciones. La tabla
de F la encontrarán en los materiales auxiliares.
Supóngase que se tiene interés en dos poblaciones normales independientes, donde
las varianzas de la población son desconocidas. Se desea probar la igualdad de las
dos varianzas. Ya vimos que para poder comparar las medias de estas dos
poblaciones se utiliza la distribución t de Student, en la cual podemos tener varianzas
Estadística Descriptiva
99
iguales o diferentes en la población (Caso de comparación de dos medias con
varianza poblacional desconocida). Nuestro estadístico de prueba es:
Este caso es la comparación de dos muestras en cuanto a sus varianzas y tenemos
tres posibles casos:
Ejemplo:
La variabilidad en la cantidad de grasa presente en un lote de un complemento
dietético, utilizada para un proceso de fabricación de un alimento, depende del origen
del complemento. Un fabricante que recibe el complemento de dos proveedores 1 y
2, hizo una comparación analizando muestras de ambos proveedores. Muestras de
n1=10 y n2=16 mediciones de dos lotes produjeron las varianzas:
S21=1.25 y S2
2=0.5
¿Presentan los datos evidencia suficiente para indicar que la variabilidad en el
contenido de grasa es menor para el producto que se recibe del proveedor 2? Realice
una prueba con un a= 0.05.
100
Ing. Priscila E. Crespo Ayala, Mgs.
Solución.
Tenemos nuestras hipótesis:
La Fcalc = 1.25/0.5 = 2.5
Como 2.5 < 2.5876 no se rechaza Ho, y se concluye con un ∞= 0.05 que no existe
suficiente evidencia para decir que la variabilidad del contenido de grasa del
complemento del proveedor 2 es menor que la del complemento suministrado por el
proveedor 1.
Investigue sobre la distribución de probabilidad y sus
diferentes tipos.
Estadística Descriptiva
101
4.2.1 Probabilidad empírica
La probabilidad empírica se obtiene en base a resultados obtenidos de un evento o
experimento, esta probabilidad se basa en la frecuencia con la que cierto resultado
suceda. Para poder calcular una probabilidad empírica es necesario realizar el evento
o experimento unas cuantas ocasiones, porque esta probabilidad se calcula
analizando los resultados anteriormente obtenidos.
Ejemplo:
Encontrar probabilidad empírica
Para encontrar la probabilidad empírica de un suceso se usará el ejemplo de lanzar
una moneda al aire, Hay que aclarar que, al inicio de los eventos, ambas caras tienen
la misma probabilidad de salir es decir 50% cada cara: 1 resultado a obtener / 2
posibles resultados = 0.5
Luego de lanzar la moneda en 60 ocasiones, se obtienen los siguientes resultados.
Resultado Ocasiones que salió
Cara 26
Cruz 34
Con estos resultados ya se puede pasar al siguiente paso que es obtener la
probabilidad empírica, para ello se hace uso de la siguiente ecuación.
Rf = resultados favorables
Tr = Total de resultados
Probabilidad = Rf / Tr
Ahora sabiendo esto, se puede calcular la probabilidad empírica con los resultados
anteriores.
Probabilidad de salir cara
102
Ing. Priscila E. Crespo Ayala, Mgs.
P(cara) = 26 / 60 * 100%
P(cara) = 0.4333 * 100%
P(cara) = 43.33%
Probabilidad de salir cruz
P(cruz) = 34 / 60 * 100%
P(cruz) = 0.5666 * 100%
P(cruz) = 56.66%
Ejemplo
Si se toma un dado y se lanza al aire la probabilidad que tiene cada lado de salir es
de 16.7% al inicio del experimento, por lo que cualquier lado tiene las mismas
posibilidades, pero si este experimento se realizara 80 veces y los resultados fueran
los siguientes...
Lado Ocasiones que salió Porcentaje
1 10 12,5%
2 11 13,75%
3 13 16,25%
4 16 20%
5 18 22,5%
6 12 15%
Con estos resultados se puede observar que lado que empíricamente es más probable
que salga es el lado con cinco puntos, porque de 80 intentos salió en 18 ocasiones,
dicho de otra manera, salió el 22.5% de las ocasiones que se lanzó el dado, que fue
la probabilidad más alta.
Desarrolle un ejemplo para demostrar la
probabilidad empírica.
Estadística Descriptiva
103
4.2.2 Probabilidad clásica
Es el número de resultados favorables a la presentación de un evento dividido entre
el número total de resultados posibles. Asignación de probabilidad "a priori", si
necesidad de realizar el experimento.
La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio
muestral tiene la misma probabilidad de ocurrir.
Fórmula para obtener la probabilidad clásica o teórica:
EJEMPLO:
¿Cuál es la probabilidad de obtener un número mayor que 3, en el lanzamiento de un
dado? Si E: 4, 5, 6, entonces el número de resultados favorables es n (E) = 3.
Si S: 1, 2, 3, 4, 5, 6, entonces el número total de resultados posibles es (S) = 6.
Por lo tanto:
Describa lo que entiende por probabilidad clásica.
104
Ing. Priscila E. Crespo Ayala, Mgs.
4.2.3 Probabilidad subjetiva
Se basan en las creencias e ideas en que se realiza la evaluación de las
probabilidades y se define como en aquella que un evento asigna el individuo
basándose en la evidencia disponible (el individuo asigna la probabilidad en base a su
experiencia).
La probabilidad subjetiva puede tener forma de frecuencia relativa de ocurrencia
anterior o simplemente puede consistir en una conjetura inteligente N.
Para clarificar lo antes dicho un ejemplo muy común es el pronóstico del tiempo,
muchos individuos como nosotros realizamos una predicción personal de cómo serán
las condiciones climáticas para el día, basadas más en nuestra experiencia personal
pero que muchas veces sustentamos en experiencia de eventos pasados.
La asignación de probabilidad subjetiva se da generalmente cuando los eventos
ocurren solo 1 vez y a lo máximo unas cuantas veces más.
Sin embargo, en las organizaciones a pesar de que es común tomar decisiones en
base a la probabilidad subjetiva la mayoría de las veces esta se respalda con datos
futuros estadísticos.
Ejemplo:
Si pasas por la casa del vecino hay un perro que es probable que te muerda, debido
a que a mí me mordió cuando pasé por ahí.
4.2.4 Reglas de las probabilidades
Probabilidad total
Sean A y B dos sucesos definidos en el experimento E, cada uno de los cuales puede
presentarse o no cada vez que se realiza el experimento. Plantee estos dos sucesos
en cada uno de los experimentos dados.
Nos interesa considerar el suceso aparición de “al menos uno de ellos”
Es decir, el suceso se cumplirá si aparece A, si lo hace B o si lo hacen ambos.
Para calcular esta probabilidad se pueden presentar dos casos:
Estadística Descriptiva
105
Se puede obtener para tres sucesos y luego generalizar más.
106
Ing. Priscila E. Crespo Ayala, Mgs.
Probabilidad condicional
Hay situaciones en las que interesa calcular la probabilidad de sucesos que tienen
cierta información con respecto a un experimento. Dicha información reduce el
espacio muestra original a uno de sus subconjuntos. De esta forma la probabilidad de
un suceso será diferente si se tiene o no información adicional. Así, por ejemplo, un
animal elegido de aquellos que están vacunados tendrá una probabilidad mayor de no
contraer la enfermedad que aquel seleccionado entre el conjunto total de animales.
Este tipo de probabilidad se denomina probabilidad condicional y se expresa:
P(A / B) que se lee: probabilidad de que habiendo ocurrido B ocurra A, o probabilidad
de A habiendo ocurrido B.
Estadística Descriptiva
107
Probabilidad compuesta o conjunta
La probabilidad condicional estudiada nos conduce a observar reglas de probabilidad
para sucesos conjuntos, es decir, la probabilidad de que dos o más sucesos
aparezcan al mismo tiempo.
Dado que:
Se debe introducir en este momento un concepto nuevo: el de sucesos
independientes.
Dos sucesos se dicen independientes si la probabilidad de ocurrencia de uno no es
afectada por la ocurrencia del otro. Luego
4.2.5 Regla de la adición
La regla de adición o regla de la suma, establece que, si tenemos un evento A y un
evento B, la probabilidad de que ocurra el evento A o el evento B se calcula de la
siguiente manera:
108
Ing. Priscila E. Crespo Ayala, Mgs.
Fórmula
P(A⋃B) = P(A) + P(B) − P(A⋂B)
Donde:
P(A) : probabilidad de que ocurra el evento A.
P(B) : probabilidad de que ocurra el evento B.
P(A⋃B) : probabilidad de que ocurra el evento A o el evento B.
P(A⋂B) : probabilidad de que ocurra el evento A y el evento B a la vez.
¿Y si los eventos son mutuamente excluyentes?
Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo tiempo,
es decir, si no tienen elementos comunes.
Por ejemplo, sacar una carta al azar de una bajara, y obtener un 5 y un 7, son eventos
mutuamente excluyentes, ya que no hay ninguna carta que tenga un 5 y un 7 al mismo
tiempo.
Entonces P(A⋂B) = 0
Por lo tanto, partiendo de la misma fórmula, obtendríamos la siguiente expresión:
P(A⋃B) = P(A) + P(B) − P(A⋂B)
P(A⋃B) = P(A) + P(B) − 0
P(A⋃B) = P(A) +P(B)
Ejemplo:
La probabilidad de que un día cualquiera, Carlos almuerce pollo frito es de 0,4. La
probabilidad de que almuerce hamburguesa es de 0,3; mientras que la probabilidad
de que almuerce pollo frito y hamburguesa el mismo día es de 0,1. Calcula la
probabilidad de que un día cualquiera, Carlos almuerce pollo frito o hamburguesa.
Solución:
Estadística Descriptiva
109
Definimos nuestras probabilidades:
Probabilidad de que Carlos almuerce pollo frito: P(A) = 0,4.
Probabilidad de que Carlos almuerce hamburguesa: P(B) = 0,3.
Probabilidad de que Carlos almuerce pollo frito y hamburguesa el mismo día:
P(A⋂B) = 0,1.
Probabilidad de que Carlos almuerce pollo frito o hamburguesa:
P(A⋃B) = ?
Ahora, aplicamos nuestra fórmula:
P(A⋃B) = P(A) + P(B) − P(A⋂B)
P(A⋃B) = 0,4 + 0,3 − 0,1
P(A⋃B) = 0,6
Ejemplo:
La probabilidad de que al tirar un dado, salga 1, es de 1/6. La probabilidad de que
salga 3, es de 1/6. Calcular la probabilidad de que al tirar un dado, salga 1 o 3.
Solución:
Definimos nuestros eventos:
Probabilidad de que salga 1: P(A) = 1/6.
Probabilidad de que salga 3: P(B) = 1/6.
Probabilidad de que salga 1 y 3 al mismo tiempo P(A⋂B) = 0. Este valor es cero, dado
que son eventos mutuamente excluyentes. Si sale 1, ya no puede salir 3.
Probabilidad de que salga 1 o 3: P(A⋃B) = ?
Ahora, aplicamos nuestra fórmula:
110
Ing. Priscila E. Crespo Ayala, Mgs.
4.2.6 Regla de la multiplicación.
Si A y B son dos eventos independientes en un experimento de probabilidad, entonces
la probabilidad que ambos eventos ocurran simultáneamente es:
En caso de los eventos dependientes, la probabilidad que ambos eventos ocurran
simultáneamente es:
(La notación significa "la probabilidad de B , dado que A ha ocurrido".)
Ejemplo:
Suponga que saca dos cartas de un paquete de cartas una después de la otra, sin
reemplazar la primera carta. ¿Cuál es la probabilidad de que la primera carta sea un
as y la segunda carta sea una de espadas?
Los dos eventos son eventos dependientes porque la primera carta no es
reemplazada.
Realice un ejemplo de probabilidad subjetiva, reglas
de las probabilidades y reglas de adición.
Estadística Descriptiva
111
Explique con un ejemplo en que consiste la regla de la
multiplicación.
112
Ing. Priscila E. Crespo Ayala, Mgs.
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir
en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable
que otro.
La mayoría de experimentos aleatorios
se presentan en juegos, concursos y
eventos naturales, entre otros.
Distribución de Probabilidad
Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de
un experimento si éste se llevase a cabo
Probabilidad empírica
La probabilidad empírica se obtiene en base a resultados obtenidos de un evento o experimento
Probabilidad clásica
Probabilidad subjetiva
Reglas de la probabilidad
Probabilidad total
Probabilidad Condicional
Probabilidad Compuesta
Reglas de la Adición
P(A⋃B) = P(A) + P(B) − P(A⋂B)
Regla de la multiplicación
Estadística Descriptiva
113
El término Probabilidad se refiere al estudio del azar y la incertidumbre. En aquellas
situaciones en las cuáles se puede producir uno de varios resultados posibles, la Teoría
de la Probabilidad provee métodos para cuantificar la chance de ocurrencia de cada uno
de ellos.
Espacio muestral: Es el conjunto de todos los posibles resultados de una experiencia
aleatoria, lo representaremos por E (o bien por la letra griega Ω).
Sucesos aleatorios: Suceso aleatorio es cualquier subconjunto del espacio muestral.
Tipos de sucesos
• Suceso elemental: es el formado por un solo resultado.
• Suceso compuesto: es el formado por más de un resultado.
• Suceso seguro: es el que ocurre siempre en un determinado experimento.
• Suceso imposible: es el que nunca ocurre en un determinado experimento.
Distribución de Probabilidad
Una distribución de probabilidad indica toda la gama de valores que pueden representarse
como resultado de un experimento si éste se llevase a cabo.
Tipos de distribución
Para variables continuas: en el caso de que la variable aleatoria sea continua, la
distribución asociada es una distribución normal o de tipo Gaussiana.
Para variables discretas: en el caso de que la variable aleatoria sea discreta, pueden existir
varios tipos de distribuciones, las principales son la distribución binomial, la distribución
hipergeométrica y la distribución de Poisson.
Probabilidad empírica
Se obtiene en base a resultados obtenidos de un evento o experimento, esta probabilidad
se basa en la frecuencia con la que cierto resultado suceda. Para poder calcular una
probabilidad empírica es necesario realizar el evento o experimento unas cuantas
ocasiones, porque esta probabilidad se calcula analizando los resultados anteriormente
obtenidos.
114
Ing. Priscila E. Crespo Ayala, Mgs.
Rf = resultados favorables
Tr = Total de resultados
Probabilidad = Rf / Tr
Probabilidad clásica
La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio muestral
tiene la misma probabilidad de ocurrir.
Probabilidad subjetiva
Se basan en las creencias e ideas en que se realiza la evaluación de las probabilidades y
se define como en aquella que un evento asigna el individuo basándose en la evidencia
disponible (el individuo asigna la probabilidad en base a su experiencia).
Reglas de las probabilidades
Probabilidad total
Probabilidad condicional
Hay situaciones en las que interesa calcular la probabilidad de sucesos que tienen cierta
Estadística Descriptiva
115
Actividades de Auto – evaluación de la unidad IV:
Tres monedas son lanzadas al azar. La probabilidad de que se obtengan
Exactamente dos caras son:
a. 1/3
b. 3/8
c. 1/2
d. 2/3
Si P(A) = 0.3 y P (B) = 0.4 donde A y B son eventos mutuamente excluyentes,
Entonces la probabilidad de que A y B ocurran simultáneamente es:
a. 0
b. 0.12
c. 0.58
d. 0.7
Sea P(A) = 0.2 y P(B) = 0.5, donde A y B son independientes, entonces
P(A o B) =
a. 0
b. 0.1
c. 0.6
d. 0.7
Utilice la siguiente información para contestar las preguntas.
Sea S = {a, b, c, d, e, f} el espacio muestral de un experimento. Considere
A = { c, d, f} y B = {a, b, c, f} dos eventos del anterior espacio muestral.
La regla de adición o regla de la suma, establece que, si tenemos un evento A y un evento
B, la probabilidad de que ocurra el evento A o el evento B se calcula de la siguiente manera:
P(A⋃B) = P(A) + P(B) − P(A⋂B)
Regla de la multiplicación.
Si A y B son dos eventos independientes en un experimento de probabilidad, entonces la
probabilidad que ambos eventos ocurran simultáneamente es:
116
Ing. Priscila E. Crespo Ayala, Mgs.
8. P(AUB) =
a. 2/6
b. 4/6
c. 5/6
d. 7/6
9. P(A∩ B) =
a. 2/6
b. 4/6
c. 5/6
d. 7/6
Un envase contiene 3 canicas rojas, 5 azules y 2 blancas. Las canicas son todas
iguales excepto en el color. Dos canicas son extraídas al azar y sin reemplazo del
envase. La probabilidad de que la segunda canica no sea roja dado que la primera no
fue roja es:
a. 7/9
b. 7/10
c. 6/9
d. 6/10
Actividad de Evaluación de la Unidad Didáctica IV:
Este atento a la plataforma Amauta que se subirá la
actividad de evaluación final de la Unidad Didáctica
IV.
Estadística Descriptiva
117
Unidad didáctica V
Título de la Unidad Didáctica V: Distribuciones discretas especiales
Introducción de la Unidad Didáctica V:
En teoría de la probabilidad y estadística, la distribución de probabilidad de una
variable aleatoria es una función que asigna a cada suceso definido sobre la variable
la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está
definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango
de valores de la variable aleatoria. También puede decirse que tiene una relación
estrecha con las distribuciones de frecuencia. De hecho, una distribución de
probabilidades puede comprenderse como una frecuencia teórica, ya que describe
cómo se espera que varíen los resultados.
La distribución de probabilidad está completamente especificada por la función de
distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria
sea menor o igual que x.
Objetivo de la Unidad Didáctica V:
Calcular medidas de ubicación y descriptivas en una distribución de
probabilidades, con responsabilidad.
Organizador Gráfico de la Unidad Didáctica V:
DISTRIBUCIONES DISCRETAS ESPECIALES
Distribución uniformeDistribución de
BernoulliDistribución binomial
y de poisson
118
Ing. Priscila E. Crespo Ayala, Mgs.
Actividades de Aprendizaje de la Unidad Didáctica V:
Actividad de Aprendizaje 1 de la Unidad Didáctica V:
5.1. Distribución uniforme.
La distribución Uniforme es el modelo (absolutamente) continuo más simple.
Corresponde al caso de una variable aleatoria que sólo puede tomar valores
comprendidos entre dos extremos a y b, de manera que todos los intervalos de una
misma longitud (dentro de (a, b)) tienen la misma probabilidad. También puede
expresarse como el modelo probabilístico correspondiente a tomar un número al azar
dentro de un intervalo (a, b).
Ejemplo:
Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la
probabilidad de que se haya detenido en los primeros 25 minutos luego de señalar la
hora en punto.
Intervalo: [0-60]
f(x) = 1
60−0=
1
60
P(x) = P(0 ≤ x ≤ 25)= ∫1
60 𝑑𝑥 =
5
12
25
0
Comente sobre la distribución uniforme
Estadística Descriptiva
119
Actividad de Aprendizaje 2 de la Unidad Didáctica V:
5.2. Distribución de Bernoulli
La distribución de Bernoulli (o distribución dicotómica), nombrada así por el
matemático y científico suizo Jakob Bernoulli, es una distribución de probabilidad
discreta, que toma valor 1 para la probabilidad de éxito (p) y valor 0 para la
probabilidad de fracaso (q=1-p).
Si X es una variable aleatoria que mide "número de éxitos", y se realiza un único
experimento con dos posibles resultados (éxito o fracaso), se dice que la variable
aleatoria X se distribuye como una Bernoulli de parámetro P.
Su fórmula es:
n es el número de pruebas.
k es el número de éxitos.
p es la probabilidad de éxito.
q es la probabilidad de fracaso.
El número combinatorio
Ejemplo:
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de
los lectores ya la han leído.
Un grupo de 4 amigos son aficionados a la lectura:
120
Ing. Priscila E. Crespo Ayala, Mgs.
1 ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas?
B(4, 0.2) p = 0.8 q = 0.2
2 ¿Y cómo máximo 2?
Actividad de Aprendizaje 3 de la Unidad Didáctica V:
5.3. Distribución binomial.
Fue desarrollada por Jacob Bernoulli, posee diversas aplicaciones en el área de
bioestadística, específicamente en la realización de experimentos, también es
conocida como distribución de Bernoulli. es una distribución de probabilidad discreta
que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli
independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los
ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico.
Un experimento o estudio tiene una distribución binomial cuando se cumplen las
siguientes condiciones:
En el experimento solo existen dos posibles resultados, el éxito o el fracaso.
La repetición del mismo experimento presenta un resultado que es independiente de
los resultados anteriores.
Demuestre con un ejemplo la distribución de
Bernoulli.
Estadística Descriptiva
121
La probabilidad del éxito o del fracaso es constante.
Cada experimento posee un mismo número de réplicas.
Ejemplos de Distribución Binomial
Se aplica a experimentos y relaciones en las áreas de medicina o biología, aunque
también puede ser aplicada en las finanzas y economía. Algunos ejemplos de su
aplicación son:
Si una persona presenta o no una enfermedad como cáncer, viruela, o hepatitis.
Si una mujer se encuentra o no embarazada.
Si la publicación de un artículo fue exitosa o no.
Propiedades de la distribución binomial
Para que una variable aleatoria se considere que sigue una distribución binomial, tiene
que cumplir las siguientes propiedades:
En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o
fracaso).
La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p.
La probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante
dado que la moneda no cambia en cada experimento y las probabilidades de sacar
cara es constate.
La probabilidad de fracaso ha de ser también constate. Esta se representa mediante
la letra q = 1-p. Es importante fijarse que, mediante esa ecuación, sabiendo p o
sabiendo q, podemos obtener la que nos falte.
El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto,
lo que ocurra en cada experimento no afecta a los siguientes.
Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo
tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda
salga cara y cruz al mismo tiempo.
122
Ing. Priscila E. Crespo Ayala, Mgs.
Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de
ocurrir. Si no se es hombre, se es mujer y si se lanza una moneda, si no sale cara ha
de salir cruz.
La variable aleatoria que sigue una distribución binomial se suele representar como
X~(n,p). n representa el número de ensayos o experimentos y p la probabilidad de
éxito.
La fórmula para calcular la distribución normal es:
Donde:
n = número de ensayos/experimentos
x = número de éxitos
p = probabilidad de éxito
q = probabilidad de fracaso (1-p)
Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino
que es un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente
formula:
El signo de exclamación en la expresión anterior, representa el símbolo de factorial.
Estadística Descriptiva
123
Ejemplo de distribución binomial
Imaginemos que un 80% de personas en el mundo han visto el partido de la final del
último mundial de futbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la
probabilidad de que 3 de ellos hayan visto?
Definamos las variables del experimento:
n = 4 (es el total de la muestra que tenemos)
x = número de éxitos, que en este caso es igual a 3, dado que buscamos la
probabilidad de que 3 de los 4 amigos lo hayan visto.
p = probabilidad de éxito (0,8)
q = probabilidad de fracaso (0,2). Este resultado se obtiene al restar 1-p.
Tras definir todas nuestras variables, simplemente sustituimos en la formula.
El numerador de la factorial se obtendría de multiplicar 4*3*2*1 = 24 y en el
denominador tendríamos 3*2*1*1 = 6. Por lo tanto, el resultado del factorial sería
24/6=4.
Fuera del corchete tenemos dos números. El primero sería 0,8^3=0,512 y el segundo
0,2 (dado que 4-3 = 1 y cualquier número elevado a 1 es el mismo).
Por tanto, nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100
tenemos que hay una probabilidad del 40,96% de que 3 de los 4 amigos hayan visto
el partido de la final del mundial.
Realice una investigación sobre Distribución binomial
Y explíquelo con un ejemplo.
124
Ing. Priscila E. Crespo Ayala, Mgs.
Actividad de Aprendizaje 4 de la Unidad Didáctica V:
5.4. Distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que se aplica
a las ocurrencias de algún suceso durante un intervalo determinado. Nuestra variable
aleatoria x representará el número de ocurrencias de un suceso en un intervalo
determinado, el cual podrá ser tiempo, distancia, área, volumen o alguna otra unidad
similar o derivada de éstas.
La probabilidad de nuestra variable aleatoria X viene dada por la siguiente expresión:
Donde:
Nuestra variable aleatoria discreta puede tomar los valores:
x=0,1,2,3 …
donde es la media del número de sucesos en el intervalo que estemos tomando, ya sea de tiempo, distancia, volumen, etc. Es importante entender que este valor es una media en el sentido estrictamente estadístico de la palabra y como tal se calculará mediante dicha expresión y no debe calcularse nunca con una regla de proporcionalidad o regla de tres.
Se debe cumplir la condición de normalización
La desviación típica es
Cuando realizamos un experimento contando sucesos y obtenemos un valor x, su
error vendrá determinado por la raíz de x.
La distribución de Poisson debe de cumplir los siguientes requisitos:
La variable discreta x es el número de ocurrencias de un suceso durante un intervalo
(esto es la propia definición que hemos dado anteriormente).
Las ocurrencias deben ser aleatorias y no contener ningún vicio que favorezca unas
ocurrencias en favor de otras.
Estadística Descriptiva
125
Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo que se
emplee.
¿Cuándo se usa la Distribución de Poisson?
La distribución de Poisson es particularmente importante ya que tiene muchos casos
de uso. Podemos poner como ejemplos de uso: la disminución de una muestra
radioactiva, la llegada de pasajeros de un aeropuerto o estación de trenes o
autobuses, los usuarios que se conectan a una web determinada por hora (es un caso
particularmente interesante que usa Googlee en sus métricas predictivas de visitantes
únicos a una web).
Distribución de Poisson como una aproximación a la Distribución Binomial
La distribución de Poisson se usa en ocasiones para aproximar la distribución
binomial. Existe un consenso en poder realizar esta aproximación cuando se
satisfagan las siguientes condiciones:
1. n ≥ 100
2. np ≤ 10
En caso de que hagamos la aproximación porque se cumplan ambas condiciones
vamos a necesitar el valor de \mu que lo calcularemos mediante la siguiente
expresión:
Ejemplo general de Poisson
Si un banco recibe en promedio por día 6 cheques sin fondos. ¿Cuáles son las
probabilidades de que reciba?
a) 4 cheques sin fondo en un día. b) 10 cheques sin fondos en cualquiera de dos días consecutivos.
Solución:
a) X – variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, etc.
126
Ing. Priscila E. Crespo Ayala, Mgs.
ꭅ = 6 cheques sin fondo por día
b) X = variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 0, 1, 2, 3, ….. etc., etc.
ꭅ = 6 X 2 = 12 cheque sin fondo en promedio que llegan al banco en dos días
consecutivos
NOTA: ꭅ siempre debe de estar en función de x siempre o dicho de otra forma, debe
hablar de lo mismo que x.
Comente sobre la distribución Poisson y en qué tipo de investigación se
aplica.
Estadística Descriptiva
127
Distribución uniforme.
Distribución de Bernoulli
Distribución binomial
Distribución de Poisson
128
Ing. Priscila E. Crespo Ayala, Mgs.
La distribución Uniforme es el modelo (absolutamente) continuo más simple.
Corresponde al caso de una variable aleatoria que sólo puede tomar valores
comprendidos entre dos extremos a y b, de manera que todos los intervalos
de una misma longitud (dentro de (a, b)) tienen la misma probabilidad.
La distribución de Bernoulli (o distribución dicotómica), nombrada así por el
matemático y científico suizo Jakob Bernoulli, es una distribución de probabilidad
discreta, que toma valor 1 para la probabilidad de éxito (p) y valor 0 para la
probabilidad de fracaso (q=1-p).
La distribución Binomial, es una distribución de probabilidad discreta que cuenta
el número de éxitos en una secuencia de n ensayos de Bernoulli independientes
entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un
experimento de Bernoulli se caracteriza por ser dicotómico.
La distribución de Poisson es particularmente importante ya que tiene muchos
casos de uso.
Estadística Descriptiva
129
Actividades de Auto – evaluación de la Unidad Didáctica V:
1) Una llamada telefónica llego a un conmutador en un tiempo, al azar, dentro de un periodo de un minuto. el conmutador estuvo ocupado durante 15 segundos en ese minuto. calcule la probabilidad de que la llamada haya llegado mientras el conmutador no estuvo ocupado.
2) Probabilidad de vida para pólizas de seguro
Un agente de seguros vende pólizas a cinco personas de la misma edad
y que disfrutan de buena salud.
Según las tablas actuales, la probabilidad de que una persona en estas condiciones
viva 30 años o más es 2/3.
Hállese la probabilidad de que, transcurridos 30 años, vivan:
1 Las cinco personas
2 Al menos tres personas
3 Exactamente dos personas
3) Si un almacén recibe en promedio por día 300. ¿Cuál es la probabilidad de que reciba, 230 en un día? ¿Qué reciba 500 personas en cualquiera de dos días consecutivos?
Actividad de Evaluación de la Unidad Didáctica V:
Este atento a la plataforma Amauta que se subirá
la actividad de evaluación final de la Unidad
Didáctica V.