Asignatura: Estadística Descriptiva Docente:Ing. Priscila ...instipp.edu.ec/instipp/assets/pdf/guias/redes/rt-s5-estadistica.pdf · Unidad V.-Calcular medidas de ubicación y descriptivas

Asignatura: Estadística Descriptiva

Docente:Ing. Priscila Crespo Ayala

Semestre: Quinto

2

Ing. Priscila E. Crespo Ayala, Mgs.

G U I A D E E S T U D I O S

CARRERA: Tecnología Superior en Redes y Telecomunicaciones

NIVEL: Tecnológico

TIPO DE CARRERA: Tradicional

NOMBRE DE LA ASIGNATURA: Estadística Descriptiva

CODIGO DE LA ASIGNATURA: RT-S5-ESDE

PRE – REQUISITO: Costos y Presupuestos

CO – REQUISITO: Sin correquisito

TOTAL HORAS: 64

Componente Docencia: 36 horas

Componente Práctica: 18 horas

Componente Autónomo: 10 horas

SEMESTRE: Quinto

PERIODO ACADÉMICO: Junio 2020 – Noviembre 2020

MODALIDAD: Presencial

DOCENTE RESPONSABLE: Ing. Priscila Esperanza Crespo Ayala, Mgs.

Copyright©2020 Instituto Superior Tecnológico Ismael Pérez Pazmiño. All rights reserved.

Estadística Descriptiva

3

INDICE

PRESENTACIÓN ................................................................................................................................ 5

SYLLABUS DE LA ASIGNATURA .................................................................................................. 7

ORIENTACIONES PARA EL USO DE LA GUÍA DE ESTUDIOS ............................................. 19

DESARROLLO DE ACTIVIDADES ............................................................................................... 21

Unidad didáctica I: .......................................................................................................................... 21

Título de la Unidad Didáctica I: Análisis Estadístico. ............................................................. 21

Actividades de Aprendizaje de la Unidad Didáctica I: .............................................................. 22

Actividad de Aprendizaje 1 de la Unidad Didáctica I: ............................................................... 22





Actividades de Auto – evaluación de la Unidad Didáctica I: .................................................... 39

Actividad de Evaluación de la Unidad Didáctica I: .................................................................... 40

Unidad didáctica II: ......................................................................................................................... 41

Título de la Unidad Didáctica II: Estadística descriptiva. ...................................................... 41

Actividades de Aprendizaje de la Unidad Didáctica II: ............................................................. 42

Actividad de Aprendizaje 1 de la Unidad Didáctica II: .............................................................. 42





Actividades de Auto – evaluación de la Unidad Didáctica II: ................................................... 61

Actividad de Evaluación de la Unidad Didáctica II: ................................................................... 61

Unidad didáctica III ......................................................................................................................... 62

Título de la Unidad Didáctica III: Análisis Combinatorio ....................................................... 62

Actividades de Aprendizaje de la Unidad Didáctica III: ............................................................ 63

Actividad de Aprendizaje 1 de la Unidad Didáctica III: ............................................................. 63




4


Actividad de Aprendizaje 5 de la Unidad Didáctica III: .............................................................71

Actividades de Auto – evaluación de la Unidad Didáctica III: ..................................................78

Actividad de Evaluación de la Unidad Didáctica III: ..................................................................78

Unidad didáctica IV .........................................................................................................................79

Título de la Unidad Didáctica IV: Teoría de la probabilidad ..................................................79

Actividades de Aprendizaje de la Unidad Didáctica IV: ............................................................80

Actividad de Aprendizaje 1 de la Unidad Didáctica IV:.............................................................80

Actividad de Aprendizaje 2 de la Unidad Didáctica IV:.............................................................84

Actividades de Auto – evaluación de la unidad IV: .................................................................115

Actividad de Evaluación de la Unidad Didáctica IV: ...............................................................116

Unidad didáctica V ........................................................................................................................117

Título de la Unidad Didáctica V: Distribuciones discretas especiales .............................117

Actividades de Aprendizaje de la Unidad Didáctica V: ...........................................................118

Actividad de Aprendizaje 1 de la Unidad Didáctica V: ............................................................118




Actividades de Auto – evaluación de la Unidad Didáctica V: ................................................129

Actividad de Evaluación de la Unidad Didáctica V: ................................................................129


5

PRESENTACIÓN

La presente Guía Didáctica de Estudios de Estadística Descriptiva, pretende servir

como herramienta de orientación a los estudiantes de la carrera de Tecnología en

Redes y Telecomunicaciones. Este documento trata de proporcionar información

sobre el seguimiento de la materia antes mencionada, proporcionando un camino

adecuado para lograr los objetivos propuestos por el estudiante desde el inicio del

semestre.

Este escrito recoge información importante y actualizada de diversos autores que

facilitan la comprensión de esta valiosa asignatura, es una guía de estudios, diseñada

como herramienta facilitadora del proceso de enseñanza aprendizaje, cumpliendo así

con los objetivos propuestos para el quinto semestre de Tecnología en Redes y

Telecomunicaciones.

Para un mejor manejo de esta guía está distribuida en unidades de estudio, que a

continuación detallo:

• UNIDAD I. Análisis estadístico

• UNIDAD II. Estadística Descriptiva.

• UNIDAD III. Análisis Combinatorio.

• UNIDAD IV. Teoría de la Probabilidad.

• UNIDAD V Distribuciones Discretas Especiales

Teniendo en cuenta que la esencia de la asignatura es 30% teórica y 70% práctica,

se distribuirán en cada una de las unidades ejercicios y talleres prácticos que ayuden

a poner en práctica el conocimiento teórico, las instrucciones serán diseñadas de tal

forma que el estudiante pueda de manera sencilla resolver y cumplir con el propósito

de cada una de las unidades de estudio.

Otra herramienta que utilizaremos en el diseño de este documento son las Tic's ya

que por medio de esta aplicación el estudiante tendrá acceso a la información en

cualquier lugar donde se encuentre, además se podrá contar con la asesoría del

docente en cualquier duda con respecto a cada tema citado en este documento,

logrando conseguir el conocimiento significativo, razón de ser de esta guía de

Estadística Descriptiva.

6


Información General

Los conceptos y temas de la estadística se utilizan en la actualidad en un gran número

de ocupaciones, constituyen una parte integral de las actividades de investigación en

distintas áreas del saber humano. El profesional que entienda de estadística puede

leer con inteligencia la literatura que sobre su campo de acción va apareciendo día a

día. Con frecuencia escuchamos en los medios de difusión comentarios como los

siguientes:

• Se ha demostrado estadísticamente que el mayor porcentaje de las ventas de

automóviles se registran en el primer trimestre del año.

• La explotación de petróleo crudo en el último trimestre del año ascendió a 285

millones de barriles, cuyo producto fue de 3698 millones de dólares.

• Estadísticamente se ha demostrado que el huevo produce el colesterol en las

personas que consumen mucho este producto.

La estadística es una rama de las matemáticas aplicadas que surgió por la necesidad

concreta que el hombre tiene de conocer la resolución de problemas relacionados con

la recolección, procesamiento, análisis e interpretación de datos numéricos cuyo

conocimiento le permitirá tomar decisiones acertadas.

La asignatura de Estadística, permitirá al estudiante interpretar información y obtener

conclusiones de una realidad para solucionar los problemas que se presentan y se

viven en la actualidad socio-económica.


7

SYLLABUS DE LA ASIGNATURA

I. DATOS INFORMATIVOS

NOMBRE DE LA CARRERA: Tecnología en Redes y Telecomunicaciones

ESTADO DE LA CARRERA: Vigente _X_ No vigente solo para registro de títulos _

NIVEL: Tecnológico

TIPO DE CARRERA: Tradicional

NOMBRE DE LA SIGNATURA: Estadística Descriptiva

CÓD. ASIGNATURA: RT-S5-ESDE

PRE – REQUISITO: Costos y Presupuestos

CO – REQUISITO: Ninguno

TOTAL HORAS: 64

Componente docencia: 36

Componente de prácticas de aprendizaje: 18

Componente de aprendizaje autónomo: 10

SEMESTRE: Quinto PARALELO: A

PERIODO ACADÉMICO: Noviembre 2019 – abril 2020 (IIPA 2019)

MODALIDAD: Presencial

DOCENTE RESPONSABLE: Ing. Priscila Esperanza Crespo Ayala Mgs.

II. FUNDAMENTACIÓN

La Estadística Descriptiva es una asignatura Teórica- Práctica, que busca que

el estudiante use el razonamiento lógico y crítico en soluciones de problemas

de sistemas en la vida cotidiana.

En cuanto a la importancia de esta disciplina en redes y telecomunicaciones

juega un papel muy significativo pues constituye una herramienta fundamental

para el análisis y toma de decisiones de las actividades que realiza el futuro

profesional en esta área.

Por consiguiente el problema surge a partir de la necesidad del análisis de una

estructura sistemática y lógica de la informática que necesita de conceptos

estadísticos para la toma de decisiones y se emplean conceptos que son

esencialmente cuantitativos y cualitativos de la estadística con aplicación en la

informática.

Con este acercamiento surge el objeto de estudio de esta asignatura es: resolver

problemas de distribución de frecuencias y representaciones gráficas con la

aplicación de fórmulas de razonamiento lógico matemático para dinamizar la

toma de decisiones.

8


El objetivo general es calcular medidas de tendencia central y otras medidas

descriptivas con honestidad para el sustento teórico científico, técnicas

inferenciales y formulación respectiva que permiten procesos del pensamiento

creativo y abstracto, manipulación de información estadística, presentadas a

través de gráficas y análisis de la información estudiada.

III. OBJETIVOS ESPECÍFICOS

Unidad I.- Definir los diferentes conceptos empleados en estadística con

integridad.

Unidad II.- Representar gráficamente los resultados de la investigación

estadística con honestidad y tolerancia.

Unidad III.- Calcular el número de arreglos diferentes que se pueden hacer con

una colección de objetos, con respeto.

Unidad IV.- Desarrollar técnicas de conteo y teoría de probabilidades, con

compromiso.

Unidad V.- Calcular medidas de ubicación y descriptivas en una distribución de

probabilidades, con responsabilidad.

IV. CONTENIDOS

Sistema General de conocimientos

Unidad I: Análisis Estadístico

Unidad II: Estadística descriptiva

Unidad III: Análisis combinatorio

Unidad IV: Teoría de la probabilidad

Unidad V: Distribuciones discretas especiales

Sistema General de Habilidades

Unidad I: Definir los diferentes conceptos empleados en estadística, mediante

el análisis de varios autores para aplicarlos a problemas de la vida empresarial

y cotidiana.

Unidad II: Representar gráficamente los resultados de la investigación

estadística mediante la recolección de datos para el análisis e interpretación de

resultados.


9

Unidad III.- Calcular el número de arreglos diferentes que se pueden hacer con

una colección de objetos, mediante fórmulas y expresiones analíticas que

permitan el cálculo de probabilidades para una oportuna toma de decisiones.

Unidad IV.- Desarrollar técnicas de conteo y teoría de probabilidades mediante

fórmulas de permutaciones y combinatoria adquiriendo un orden espacial y un

grado mayor de certeza para la toma de decisiones futuras.

Unidad V.- Calcular medidas de ubicación y descriptivas en una distribución de

probabilidades a través de los constructos teóricos y los algoritmos de resolución

para que se adopte los criterios más adecuados en la factibilidad de un proyecto.

Sistema General de Valores

Unidad I.- Integridad en el análisis de los diferentes conceptos.

Unidad II.- Honestidad y tolerancia en los resultados de la investigación estadística.

Unidad III.- Respeto en la aplicación del método para tabular datos.

Unidad IV.- Compromiso en la aplicación de los conceptos.

Unidad V.- Responsabilidad en la construcción de ideas con los resultados

obtenidos.

V. PLAN TEMÁTICO

DESARROLLO DEL PROCESO CON TIEMPO

EN HORAS

TEMAS DE LA ASIGNATURA C CP S CE T L E THP TI THA

Análisis estadístico

3 3 3 1 10 2 12


3 4 3 1 11 2 13

Análisis Combinatorio

3 3 3 1 10 2 12

Teoría de la probabilidad 3 4 2 1 10 2 12

Distribuciones Discretas

Especiales

2

4

4

1

11

2

13

EXAMEN FINAL 2 2 2

Total de horas 14 18 15 7 54 10 64

10


Leyenda:

C – Conferencias.

S – Seminarios.

CP – Clases prácticas.

CE – Clase encuentro.

T – Taller.

L – Laboratorio.

E - Evaluación.

THP – Total de horas presenciales.

TI – Trabajo independiente.

THA – Total de horas de la asignatura.

VI. SISTEMA DE CONTENIDOS POR UNIDADES DIDÁCTICAS

Unidad I: ANÁLISIS ESTADÍSTICO

Objetivo: Definir los diferentes conceptos empleados en estadística con

integridad.

Sistema de

conocimientos

Sistema de habilidades Sistema de Valores

1.1. Introducción al Análisis

Estadístico.

1.2. Naturaleza de la

Estadística.

1.3. El muestreo Estadístico.

1.4. Escalas de Medición

1.5. La investigación

Estadística.

Definir el análisis

estadístico.

Describir la naturaleza

estadística.

Demostrar la fórmula del

muestreo estadístico.

Explicar las escalas de

medición.

Distinguir la investigación

estadística.

Integridad en el análisis

de los diferentes

conceptos.


11

Unidad II: ESTADÍSTICA DESCRIPTIVA

Objetivo: .- Representar gráficamente los resultados de la investigación

estadística, honestidad y tolerancia.

Sistema de

conocimientos


2.1. Definición de Estadística

Descriptiva.

2.2. Representación Tabular

de Datos.

2.3. Distribución de

Frecuencias.

2.4. Medidas de Tendencia

central.

2.5. Medidas de dispersión.

Identificar la estadística

descriptiva.

Tabular datos estadísticos.

Aplicar la distribución de

frecuencias.

Calcular las medidas de

tendencia central y obtener

resultados.

Formular las medidas de

dispersión y representar

los resultados para el

análisis e interpretación de

la información.

Honestidad y tolerancia

en los resultados de la

investigación

estadística.

Unidad III: ANÁLISIS COMBINATORIO

Objetivo: Calcular el número de arreglos diferentes que se pueden hacer con

una colección de objetos, con respeto.

12


Sistema de

conocimientos


3.1. Análisis Combinatorio.

3.2. Principios de

Multiplicación.

3.3. Diagrama de árbol.

3.4. Permutaciones.

3.5. Combinaciones.

Distinguir el análisis

combinatorio.

Demostrar los principios de

la multiplicación.

Aplicar el diagrama de

árbol.

Realizar permutaciones.

Calcular combinaciones

estadísticas.

Respeto en la aplicación

del método para tabular

datos.

Unidad IV: TEORÍA DE LA PROBABILIDAD

Objetivo: Desarrollar técnicas de conteo y teoría de probabilidades, con

compromiso.

Sistema de

conocimientos


4.1. Conceptos

Fundamentales.

4.2. Distribución de

Probabilidad

4.2.1 Probabilidad empírica

4.2.2 Probabilidad clásica

4.2.3 Probabilidad subjetiva

4.2.4Reglas de las

probabilidades.

4.2.5 Regla de la adición

4.2.6 Regla de la

multiplicación

Aplicar los conceptos

fundamentales de la teoría

de la probabilidad.

Identificar la distribución de

la probabilidad.

Medir la probabilidad de un

suceso en base a las

reglas establecidas.

Compromiso en la

aplicación de los

conceptos.


13

Unidad V: DISTRIBUCIONES DISCRETAS ESPECIALES.

Objetivo: Calcular medidas de ubicación y descriptivas en una distribución de


Sistema de

conocimientos


5.1. Distribución uniforme.

5.2. Distribución de Bernoulli

5.3. Distribución binomial.

5.4. Distribución de Poisson

Calcular la media, la

varianza y la desviación

estándar de una

distribución uniforme de

probabilidades.

Aplicar la media,

varianza y desviación

estándar de una

distribución de Bernoulli

de probabilidad.

Describir las

características de la

distribución binomial.

Calcular las

probabilidades

empleando la

distribución poisson.

Responsabilidad en la

construcción de ideas

con los resultados

obtenidos.

VII. ORIENTACIONES METODOLÓGICAS Y DE ORGANIZACIÓN DE LA

ASIGNATURA.

El proceso de enseñanza – aprendizaje de la asignatura, se soporta en el desarrollo

de clases magistrales del contenido en general, acompañado por casos prácticos,

talleres de aplicación, procesos de simulaciones en Excel y aplicación de los

contenidos.

14


El estudiante aplicará todos los elementos conceptuales y teóricos en general a lo

largo del proceso de aprendizaje de la presente cátedra y mantendrá a su disposición

el aporte profesional permanente del docente para la construcción de una actitud

crítica y objetiva sobre aspectos matemáticos en las decisiones de sistemas. Habrá

tres documentos pedagógicos básicos que permiten evidenciar los resultados de las

actividades del trabajo autónomo y de grupos, desarrollados a partir del sílabo de la

asignatura.

Carpeta con trabajos extra-clase e intra-clase, grupales (hasta 3 a 5 alumnos).

Desarrollo de ejercicios aplicados a la teoría. Carpeta de trabajos autónomos. En

especial consultas sobre temas especiales y que hayan sido sustentados

demostrando su dominio.

Registro de avance académico. Revisión de trabajos extra-clase, trabajos autónomos,

lecciones orales en el aula, pruebas escritas y exámenes escritos. Evidencia el

cumplimiento y la calidad del trabajo.

Obligación de los alumnos entregar al profesor la producción requerida para la

evaluación.

Los métodos utilizados son:

Método Reproductivo:

Método Explicativo y Método Ilustrativo: El alumno se apropia de conocimientos

elaborados y los reproduce mediante modos de actuación. El docente explica y dirige

la clase mientras el estudiante atiende y asimila los conocimientos. El estudiante

ilustra a través de ejemplos la temática inferida.

Método de Exposición Problemática: Es un método intermedio, pues supone la

asimilación de la información elaborada y de elementos de la actividad creadora. Se

establecen grupos de trabajo, facilita cierta información y permite al estudiante que

contribuya con su creatividad, ejemplifica los algoritmos de resolución de problema y

se colabora con el estandarte para la creación de su propio ejercicio.

Método Productivo:

Método Heurístico o de Búsqueda parcial de Método Investigativo. - Permite al

estudiante alcanzar conocimientos nuevos, como resultado de la actividad creadora.

El docente estimula a la investigación, y con dicha información realiza talleres de

producción textual y estimula al mismo a crear sus propios ejercicios.

Las Técnicas de Enseñanza se detallan a continuación:


15

Del interrogatorio: En el uso de preguntas y respuestas para obtener información y

puntos de vista de aplicación de lo aprendido, mediante esta técnica se pretende

despertar y conservar el interés, se exploran experiencias, capacidad, criterio de los

estudiantes y comunicación de ellos.

Del redescubrimiento: Realizar un aprendizaje satisfactorio y efectivo en el cual el

estudiante observa, piensa y realiza.

De la discusión dirigida: Realizar un análisis, una confrontación, una clasificación de

hechos, situaciones, experiencias, problemas, con presencia de docente. Se centra

en la discusión, en el cual se obtienen conclusiones positivas o valederas.

Operatoria: Consiste en realizar actividades de operaciones que permitan el

razonamiento y la comprensión facilitando el aprendizaje.

De la resolución de problemas: Permite solucionar problemas matemáticos mediante

un orden lógico, secuencial, práctico y de razonamiento.

Lluvia de ideas: El grupo actúa en un plano de confianza, libertad e informalidad y sea

capaz de pensar en alta voz, sobre un problema, tema determinado y en un tiempo

señalado.

Diálogos simultáneos: Lograr la participación de un gran grupo, dividido en parejas,

respecto a un tema de estudio, trabajo, tarea o actividad.

Del informe o trabajo escrito: En elaborar pasos para trabajos escritos con estilo

propio.

VIII. RECURSOS DIDÁCTICOS

Básicos: Marcadores, borrador, pizarra de tiza líquida.

Audiovisuales: Computador, proyector, celulares inteligentes, tabletas, laptops, Pen

drive.

Técnicos: Materiales de apoyo complementarios, Sistemas de ejercicios de

aplicación práctica, documentos de apoyo, separatas, texto básico, guías de

observación, amauta.

16


IX. SISTEMA DE EVALUACIÓN DE LA ASIGNATURA

El sistema de evaluación será sistemático y participativo, con el objetivo de adquirir

las habilidades y destrezas cognitivas e investigativas que garanticen la calidad e

integridad de la formación profesional.

Para la respectiva evaluación se valorará la gestión de aprendizaje propuestos por el

docente, la gestión de la práctica y experimentación de los estudiantes, y la gestión

de aprendizaje que los estudiantes propondrán mediante la investigación.

Se tomó como referencia el Reglamento del Sistema Interno de Evaluación Estudiantil

para proceder a evaluar la asignatura, de esta manera se toma como criterio de

evaluación la valoración de conocimientos adquiridos y destrezas evidenciadas dentro

del aula de clases en relación a la labor que un auditor de sistemas realiza.

Cada alumno deberá demostrar lo aprendido en cada una de las unidades

académicas, y de esta manera esté apto para desenvolvimiento profesional.

Por ello desde el primer día de clases, se presentará las unidades didácticas y los

criterios de evaluación del proyecto final. Se determinará el objeto de estudio, que en

este caso es la realización de problemas de distribución de frecuencias y

representaciones gráficas para el razonamiento lógico matemático en la modelización

de situaciones que permitan dinamizar la toma de decisiones.

Se explica a los estudiantes que el semestre se compone de dos parciales con una

duración de diez semanas de clases cada una, en cada parcial se evaluará sobre

cinco puntos las actividades diarias de las clases, trabajos autónomos, trabajos de

investigación, actuaciones en clases y talleres; sobre dos puntos un examen de parcial

que se tomará en la semana diez y semana veinte. De esta manera cada parcial tendrá

una nota total de siete puntos como máximo.

El examen final se llevará a cabo mediante la ejecución de un proyecto integrador de

asignaturas y tiene una valoración de tres puntos. Por consiguiente, el alumno podrá

obtener una nota total de diez puntos.


17

El proyecto integrador del presente semestre corresponde a la elaboración de un

manual de políticas y seguridad para los recursos de hardware y software en las

instituciones públicas y privadas.

Por tal motivo, la asignatura de Estadística Descriptiva contribuirá en el proyecto

integrador mediante la aplicación de entrevistas, encuestas para la tabulación de

datos y la obtención de información valedera que permita una eficiente interpretación

de los resultados y oportuna toma de decisiones determinando con ello además la

factibilidad del proyecto.

Los parámetros de evaluación del presente proyecto o actividad de vinculación de la

asignatura, se clasifican en parámetros generales que serán los mismos en todas las

asignaturas y en parámetros específicos que corresponde únicamente a la asignatura;

la cual se detallan a continuación:

Parámetros Generales

- Redacción y desarrollo del manual y artículo científico. 1,00

- Desenvolvimiento y dominio en la exposición. 0,50

TOTAL

1,50

Parámetros Específicos

- Veracidad en la información recolectada a través de encuestas o entrevistas

0,50

- Tabulación de los datos aplicando los conocimientos estadísticos. 1,00

TOTAL 1.50

Una vez que el estudiante exponga su proyecto integrador y defienda las preguntas

propuestas por el tribunal, será notificado en ese momento la nota obtenida y se

procederá a la respectiva firma de constancia.

Dentro de las equivalencias de notas se clasifican de la siguiente manera:

10,00 a 9,50: Excelente

9,49 a 8,50: Muy bueno

8,49 a 8,00: Bueno

7,99 a 7,00: Aprobado

6,99 a menos: Reprobado

18


Los estudiantes deberán alcanzar un puntaje mínimo de 7,00 puntos para aprobar la

asignatura, siendo de carácter obligatorio la presentación del proyecto integrador.

Si el estudiante no alcance los 7,00 puntos necesarios para aprobar la asignatura,

deberá presentarse a un examen supletorio en la cual será evaluado sobre diez puntos

y equivaldrá el 60% de su nota final, el 40% restante corresponde a la nota obtenida

en acta final ordinaria de calificaciones.

Aquellos estudiantes que no podrán presentarse al examen de recuperación son

quienes estén cursando la asignatura por tercera ocasión, y aquellos que no hayan

alcanzado la nota mínima de 2,50/10 en la nota final o aquellos que hubiesen

reprobado por faltas del 25% o más en la asignatura impartida.

El estudiante no conforme con la nota del proyecto integrador podrá solicitar mediante

oficio una recalificación y obtendrá respuesta del mismo en un plazo no mayor a tres

días hábiles.

El docente tendrá un plazo de 48 horas para socializar las calificaciones obtenidas

luego se asentará en las actas finales y se procederá a recoger la firma de los

estudiantes.

Los proyectos presentados serán sometidos a mejoras o corrección si el caso lo

amerita con la finalidad de ser presentadas en la feria de proyectos científicos que el

Instituto Tecnológico Superior Ismael Pérez Pazmiño lanzará cada año.

X. BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA

➢ Crespo Ayala, Priscila. Guía de Estudio de Estadística Descriptica Machala: Instituto Superior Tecnológico Ismael Pérez Pazmiño, 2019.

➢ Guarín Salazar Norberto, Estadística Aplicada, 2002, Colombia, Universidad Nacional de Colombia.

➢ Levin, Richard I; Rubin, David S. Estadística para Administración y Economía, Séptima edición, 2004, México, Editorial Pearson Educación.

➢ Lind D, Marchal W, Wathen S. Estadística aplicada a los Negocios y la Economía, decimoquinta edición, 2012, México, Mc. Graw Hill Editores.

➢ Vergara Juan, Quezada Victor, Estadística Básica con aplicaciones en Ms Excel, Cartagena, Colombia. 2014.


19

ORIENTACIONES PARA EL USO DE LA GUÍA DE ESTUDIOS

Antes de empezar con nuestro estudio, debes tomar en cuenta lo siguiente:

1. Todos los contenidos que se desarrollen en la asignatura contribuyen a tu

desarrollo profesional, ética investigativa y aplicación en la sociedad.

2. El trabajo final de la asignatura será con la aplicación de la metodología de

investigación científica.

3. En todo el proceso educativo debes cultivar el valor de la constancia porque

no sirve de nada tener una excelente planificación y un horario, si no eres

persistente.

4. Para aprender esta asignatura no memorices los conceptos, relaciónalos con

la realidad y tu contexto, así aplicarás los temas significativos en tu vida

personal y profesional.

5. Debes leer el texto básico y la bibliografía que está en el syllabus sugerida

por el docente, para aprender los temas objeto de estudio.

6. En cada tema debes realizar ejercicios, para ello debes leer el texto indicado

para después desarrollar individual o grupalmente las actividades.

7. A continuación te detallo las imágenes que relacionadas a cada una de las

actividades:

Imagen

Significado

Sugerencia

Talleres

Reflexión

20


Subir Tareas al

Aula Virtual

Amauta

Apunte clave

Foro

Resumen

Evaluación

8. Ánimo, te damos la bienvenida a este nuevo periodo académico.


21

DESARROLLO DE ACTIVIDADES

Unidad didáctica I:

Título de la Unidad Didáctica I: Análisis Estadístico.

Introducción de la Unidad Didáctica I:

El campo de la estadística toca nuestras vidas de muchas maneras. Desde las rutinas

diarias en nuestros hogares hasta la responsabilidad de hacer funcionar las ciudades

más grandes, las estadísticas están por doquier.

Las compañías de comunicaciones utilizan estadísticas para optimizar los recursos de

las redes, mejorar el servicio y reducir la rotación de clientes obteniendo un insight

más preciso de los requisitos de los suscriptores.

Mire a su alrededor. Desde el tubo de pasta dental en su baño hasta los aviones que

vuelan sobre su casa, se ven cientos de productos y procesos todos los días que han

sido mejorados a través del uso de la estadística.

La base de la estadística es poder considerar un conjunto de datos y calcular valores

estadísticos o trazar gráficas, pero hay que tomar en cuenta que es mucho más

importante comprender las circunstancias que se están investigando, las variables

implicadas, porque se está investigando el problema y se aprende a cuestionar los

datos y los resultados estadísticos.

La experiencia y situaciones de la vida diaria constituyen la base para comprender la

estadística ya que esta trata sobre la descripción del mundo que nos rodea y nos

proporciona métodos para analizar los resultados de experimentos efectuados, pero

también indica cómo se pueden efectuar los experimentos de manera eficaz para

disminuir los efectos de la variación y tener mayor probabilidad de llegar a

conclusiones correctas.

Objetivo de la Unidad Didáctica I:

Definir los diferentes conceptos empleados en estadística con integridad.

22


Organizador Gráfico de la Unidad didáctica I:

Actividades de Aprendizaje de la Unidad Didáctica I:

Actividad de Aprendizaje 1 de la Unidad Didáctica I:

1.1. Introducción al Análisis estadístico

La estadística recoge, ordena y analiza datos para estudiar las características o el

comportamiento de un colectivo.

Es el conjunto de métodos científicos ligados a la toma, organización, recopilación,

presentación y análisis de datos, tanto para la deducción de conclusiones como para

tomar decisiones razonables de acuerdo con tales análisis.

¿Qué es el análisis estadístico? Es la ciencia de recopilar, explorar y presentar

grandes cantidades de datos para descubrir

patrones y tendencias implícitos.

. Por ejemplo:

Los fabricantes utilizan las estadísticas para

incorporar calidad en telas preciosas, para dar

ANALISIS ESTADÍSTI CO

El muestreo estadístico

Escalas de mediciónLa investigación

estadística

Las estadísticas se aplican

todos los días – en la

investigación, la industria y el

gobierno para volvernos más

científicos acerca de las

decisiones que se necesitan

tomar


23

prosperidad a la industria de las líneas aéreas y para ayudar a los guitarristas a

producir música hermosa.

Los investigadores mantienen a los niños sanos utilizando estadísticas para analizar

datos de la producción de vacunas virales, lo cual garantiza consistencia y seguridad.

El análisis estadístico, a menudo, se utiliza para explorar los datos, por ejemplo, para

examinar la distribución de valores para un atributo en particular o para encontrar

valores atípicos (valores extremadamente altos o bajos). Contar con esta información

es útil cuando se definen clases y rangos en un mapa, cuando se reclasifican datos o

cuando se buscan errores.

Otro uso del análisis estadístico es resumir los datos. Por lo general, esto se realiza

por categorías, como calcular el área total en cada categoría de uso del suelo.

También se pueden crear resúmenes espaciales, como calcular la elevación promedio

para cada cuenca hidrográfica. El resumen de los datos es útil para comprender mejor

las condiciones de un área de estudio.

El análisis estadístico también se utiliza para identificar y confirmar los patrones

espaciales, tales como el centro de un grupo de entidades, la tendencia direccional o

si las entidades forman clusters. Aunque los patrones pueden ser evidentes en un

mapa, podría ser difícil tratar de sacar conclusiones desde un mapa; la forma en que

se clasifican y simbolizan los datos puede oscurecer o exagerar los patrones. Las

funciones estadísticas analizan los datos subyacentes y proporcionan una medida que

se puede utilizar para confirmar la existencia y la fortaleza del patrón.


1.2. Naturaleza de la Estadística.

Los primeros estudiosos de la estadística se dedicaron, por lo general, a la recolección

y exposición de datos útiles para el Estado, de ahí se derivó el nombre estadística.

Por ejemplo recolectaban datos sobre nacimientos y decesos, para auxiliar a los

encargados del reclutamiento militar; sobre enfermedades, para ayudar a quienes se

Realice un resumen mínimo de 5 líneas

correspondiente el análisis estadístico.

24


ocupaban de la salud pública, y acerca de exportaciones, importaciones, ingresos y

egresos, y gastos para facilitar la recaudación de impuestos.

La Estadística consiste en la colección, presentación, análisis y utilización de datos

numéricos para facilitar la toma de decisiones acertadas frente a una incertidumbre

que plantean la economía, la administración y otras ciencias sociales y físicas.

La estadística es una rama de la ciencia, encargada del diseño y aplicación de

métodos para recolectar, organizar, analizar y hacer deducciones a partir de ellos.

La estadística proporciona una metodología para evaluar y juzgar

las discrepancias entre la realidad y la teoría. Además de su papel

instrumental, el estudio de la estadística es importante para

entender las posibilidades y limitaciones de la investigación

experimental, para diferenciar las conclusiones que pueden

obtenerse de los datos de aquellas que carecen de base empírica

y en definitiva para desarrollar un pensamiento crítico y

antidogmático ante la realidad.

Supóngase que nos confrontamos con un conjunto de mediciones u observaciones

obtenidas de la realidad. Tal conjunto representa usualmente un complejo de datos

del que es posible extraer una cantidad de información casi ilimitada. Por ejemplo, los

salarios semanales de un grupo de obreros del acero pueden producir información de

las siguientes clases: el salario total recibido por el grupo, el salario más alto, el salario

más bajo, el salario más frecuente, el rango de los salarios, el salario medio, el número

de los salarios inferiores a $ 75.00, el número de los salarios superiores a $100.00, el

número entre $75,00 y $125.00, etc. La tarea del investigador es seleccionar algunos

procedimientos y medidas mediante los cuales se pongan de relieve los aspectos

significantes de los datos dados. Estos aspectos pueden obtenerse mediante la

clasificación, construcción de gráficas y cálculo de promedios.

En la actualidad

con la ayuda de la

informática y la

tecnología el

tratamiento

estadístico de la

información se

hace más sencillo.

Existen varias definiciones de estadística,

investigue un concepto y analícelo


25

Por lo que los datos estadísticos son un conjunto de números de una misma

características, que pueden ser organizados, comparados, analizados e interpretados,

además encontramos la Unidad Estadística, que es persona, elemento u objeto que

se va a estudiar. Y esta unidad estadística posee características, que son las

propiedades, rasgos, cantidades o cualidades. Estas estas características las

obtenemos en base a observaciones, que no son más que información recopilada de

la unidad estadística elemental, en relación con la característica de interés (Análisis

estadístico), si la unidad estadística es el trabajador y característica su salario una

observación sería que gana $600,00. Por lo que se pueden tener observaciones para

varias características diferentes en una misma unidad.

Cuando se realiza el análisis estadístico, tenemos la Población, que es un conjunto

de personas o cosas objeto de investigación estadística, es el total de unidades de

estudio. La población puede ser finita, que significa que tiene un número limitado de

elementos (Situación existente en un momento dado). La Población infinita está

formada por un número ilimitado de elementos. (Proceso o experimiento, puede

repetirse indefinidamente, sin delimitación de tiempo).

Un mismo conjunto de unidades de estudio puede tener diferentes poblaciones según

sea característica de interés.

Ejemplo:

POBLACIÓN • Todos los empleados actuales de la empresa ABC. SA.

• Salarios percibidos por los empleados en un cierto periodo

• Número de hijos vivos de las familias de los empleados

UNIDAD DE ESTUDIO • Un empleado de la empresa ABC. SA.

CARACTERÍSTICA • Ingreso familiar

• Nivel educativo

• Composición numérica de las familias

OBSERVACIONES • Ingreso familiar $600,00 mensuales

• Nivel educativo… primaria completa

• Composición familiar …. 5 personas.

Realice un organizador gráfico de los siguientes

conceptos: Datos estadísticos, unidad

estadística y población.

26


Cuando vamos a hacer un estudio, no siempre se puede hacer uso de toda la población, por

lo que se tiene que recurrir al muestreo, es decir:

• Cuando la población es infinita o muy grande

• Población finita pero muy grande, incrementa el costo y tiempo

• Unidad de estudio se transforma o destruye. (Análisis de laboratorio)

Y nos damos cuenta que los resultados de muestra bien seleccionada, tamaño

razonable son precisos.

Para que la muestra sea representativa depende del tamaño de la muestra y de forma

de selección.

El tamaño de muestra depende de homogeneidad de los elementos de la población y

del grado de confianza en la inferencia.

EJEMPLOS DE VARIABLES

Unidad Elemental Característica Unidades de Medida Observación

Un estudiante Peso Kilogramos 64.5

Una casa Valor Dólares 156.000

Una casa Número de dormitorios Dormitorios 3

EJEMPLO DE ATRIBUTOS

Unidad Elemental Característica Observaciones

Un estudiante Clase de alumno Regular, Especial, Oyente

Una casa Condición de alquiler Amueblada, sin muebles

Un bombillo Condición Deteriorado, no deteriorado


27


1.3. El muestreo Estadístico.

El muestreo es el proceso de seleccionar un conjunto de individuos de una población

con el fin de estudiarlos y poder caracterizar el total de la población.

La idea es bastante simple. Imagina que queremos saber algo de un universo o

población, por ejemplo, qué porcentaje de los habitantes de Ecuador fuma

habitualmente. Una forma de obtener este dato sería contactar con todos los

habitantes de Ecuador (32 millones de personas) y preguntarles si fuman. La otra

forma sería seleccionar un subconjunto de individuos (por ejemplo, 1.000 personas),

preguntarles si fuman y usar esta información como una aproximación de la

información buscada. Pues bien, este grupo de 1.000 personas que me permiten

conocer mejor cómo se comportan el total de ecuatorianos es una muestra, y la forma

en que los seleccionamos es el muestreo.

En la definición anterior hemos introducido dos términos: Universo o población y

Muestra.

¿Por qué funciona el muestreo?

El muestreo es útil gracias a que podemos acompañarlo de un proceso inverso, que

llamamos generalización. Es decir, para conocer un universo lo que hacemos es:

1) Extraer una muestra del mismo.

Realice tres ejemplos de variables y tres ejemplos de

atributos con sus respectivas características, unidades de

medida y observación de acuerdo a lo revisado en clase.

28


2) Medir un dato u opinión.

3) Proyectar en el universo el resultado observado en la muestra.

Esta proyección o extrapolación recibe el nombre de generalización de resultados.

La generalización de resultados añade cierto error al mismo. Imagina que tomamos

una muestra al azar de 1.000 personas de Ecuador y les preguntamos si fuman.

Obtengo que el 25% de la muestra fuma. La simple lógica nos dice que si de 1.000

ecuatorianos elegidos al azar el 25% fuma, este dato debería ser indicativo de lo que

obtendríamos si preguntásemos a los 122 millones de ecuatorianos. Ahora bien, el

azar podría haber hecho que haya escogido para mi muestra más fumadores de lo

que correspondería a la proporción exacta que hay en el universo o, por el contrario,

que en mi muestra los fumadores estén algo infra-representados. El azar podría hacer

que el porcentaje de fumadores en la población fuese algo diferente del 25% que

hemos observado en la muestra (tal vez un 25,2%, por ejemplo). Por lo tanto, la

generalización de resultados de un muestra a un universo conlleva aceptar que

cometemos cierto error, tal y como ilustra el siguiente esquema.

Afortunadamente, el error cometido al generalizar resultados puede acotarse gracias

a la estadística. Para ello se pueden usar dos parámetros: el margen de error, que

es la máxima diferencia que esperamos que haya entre el dato observado en mi

muestra y el dato real en el universo, y el nivel de confianza, que es el nivel de certeza

que tengo de que realmente el dato real esté dentro del margen de error.

Por ejemplo, en nuestro caso de fumadores ecuatorianos, si selecciono una muestra

de 471 individuos y les pregunto si fuman, el resultado que obtenga tendrá un margen

de error máximo de +-5% con un nivel de confianza del 97%. Esta forma de expresar

los resultados es la correcta cuando usamos muestreo.

Nivel de confianza 90% -> Z=1,645




29

EL TAMAÑO DE LA MUESTRA

¿Qué tamaño de muestra necesito usar para estudiar cierto universo? Depende del

tamaño del universo y del nivel de error que esté dispuesto a aceptar, tal y como

explicábamos. Cuanta más precisión exija, mayor muestra necesito. Si quiero tener

una certeza absoluta en mi resultado, hasta el último decimal, mi muestra tendrá que

ser tan grande como mi universo.

Pero el tamaño de la muestra tiene una propiedad fundamental que explica porqué el

muestreo se usa tanto en tantos ámbitos del conocimiento. Esta propiedad podría

resumirse como sigue: a medida que estudio universos mayores, el tamaño de

muestra que necesito cada vez representa un porcentaje menor de dicho universo.

Recapitulando vemos que para calcular el tamaño de muestra en este tipo de estudios

tenemos que conocer el tamaño de la población y fijar de antemano el nivel de

confianza y el error máximo que admitimos. Llamando N al tamaño de la población, el

tamaño de muestra, n, que necesitamos con un nivel de confianza 1- p y un error e se

puede calcular con la siguiente fórmula:

Siendo un valor de la distribución normal que se obtiene de una tabla y p la

proporción de individuos de la población que poseen la característica que se está

estudiando. Como ese dato es desconocido, se suele usar p=0.5 valor que maximiza

el producto p(1-p).

Lo que parece claro es que cuanto mayor sea el tamaño de la población mayor tendrá

que ser el tamaño de la muestra. La cuestión que nos ocupa es saber de qué forma

crece el tamaño de muestra en función del tamaño de la población si tenemos fijado

de antemano el nivel de confianza y el margen de error. Vamos a realizar algunos

cálculos para intentar hacernos una idea del asunto. Fijamos un nivel de confianza del

95% (con el cual α =0.05 y, por tanto, se sabe que y un error

del 5% (con lo que e=0.05):

Para una población de 100 personas, tenemos que el tamaño de muestra necesario

en este caso será:

30


Es decir, con 100 personas deberíamos tomar una muestra de 80 individuos, casi la

población entera.

Veamos qué ocurre con 1000 personas:

Evidentemente el valor aumenta, 278 en esta ocasión, pero ya no está tan cerca del

tamaño total de la población como ocurría antes.

Para 10000 personas:

Sigue aumentando, pero como se puede ver ya aumenta mucho más despacio.

Hemos aumentado bastante el tamaño de la población, de 1000 a 10000, pero el

tamaño de muestra no llega a aumentar ni en 100 individuos.

Y veamos qué ocurre para 100000:

Aquí se ve mucho mejor. Pasando de una población de 10000 individuos a una de

100000 la muestra aumenta en 13 individuos.

De todo esto se deduce que para poblaciones pequeñas el tamaño de la muestra que

debemos tomar es bastante grande en comparación con dicha población (en


31

ocasiones casi la población completa), pero para poblaciones de gran tamaño (todos

los habitantes de España, por ejemplo) basta con una muestra no demasiado grande

para obtener unos resultados estadísticamente fiables. O sea, que eso de que

necesitamos muchos individuos en una muestra para que los resultados sean buenos

no es del todo cierto.

¿Cuál sería en nuestro caso el tamaño máximo de una muestra? Pues el que

corresponda a una población con una gran cantidad de elementos. Podemos

obtenerlo tomando la expresión del tamaño de muestra como una función cuya

variable es N y calcular el límite de esa función cuando N tiende a infinito:

Es decir, que para poblaciones muy muy grandes necesitaremos tomar una muestra

de 385 personas para obtener buenos resultados para el nivel de confianza y el error

fijados de antemano (95% y 5% respectivamente).

La fórmula anterior podemos simplificarla cuando trabajamos con universos de

tamaño muy grande (se considera muy grande a partir de 100.000 individuos),

resultando lo siguiente:

Ejemplo: Retomando el caso anterior, tenemos una población de 136 millones de

ecuatorianos de entre 15 y 65 años, y queremos saber qué porcentaje de ellos vive

en un piso de propiedad, con un margen de error del 5% y un nivel de confianza del

95%. Supongamos que no tenemos ninguna información previa sobre cuál puede ser

el tanto por ciento de propietarios que podemos obtener en la encuesta. En este caso

podremos usar la fórmula simplificada pues 136 millones > 100.000, y usaremos

p=50% pues no tengo información previa sobre el resultado esperado:

n = 1,962 * 0,5 * (1 - 0,5) / 0,052 = 384,16

32


Existen tres formas para seleccionar la muestra:

Aleatoria o al azar:- Muestreo simple al azar. Todos los elementos tienen la misma

probabilidad de ser seleccionados.

Intencional:- Se utiliza el juicio de una persona con expereiencia y conocimiento de

la población para la selección de los elementos.

Por conveniencia:- Por facilidad se escoge los elementos disponibles o más fáciles

de conseguir con el riesgo de que la muestra no sea representativa.

VENTAJAS E INCONVENIENTES DEL MUESTREO

VENTAJAS

• Necesitamos estudiar menos individuos, necesitamos menos recursos (tiempo

y dinero).

• La manipulación de datos es mucho más simple. Si con una muestra de 1.000

personas tengo suficiente, ¿para qué quiero analizar un fichero de millones de

registros?

DESVENTAJAS

• Introducimos error (controlado) en el resultado, debido a la propia naturaleza

del muestreo y a la necesidad de generalizar resultados.

• Tenemos el riesgo de introducir sesgos debido a una mala selección de la

muestra. Por ejemplo, si la forma en que seleccionamos individuos para la

muestra no es aleatoria, los resultados pueden verse seriamente afectados.


33

VENTAJAS DEL MUESTREO ALEATORIO

• Elimina sesgos de selección porque la selección es aleatoria a diferencia de la

selección a intención o conveniencia.

• Produce errores aleatorios que son medibles utilizando modelos

probabilisticos. (Diferencia entre resultado de la muestra y el valor poblacional)

• El error de muestreo puede hacerse pequeño con aumentar el tamaño de la

muestra.

• La validez o precisión de una inferencia realizada a partir de una muestra

aleatoria es medible.

ATRIBUTOS Y VARIABLES

Variables:- Cuando una característica toma valores diferentes para cada unidad de

estudio de una población.

Tipos de variables:

Cuantitativas

Continuas:- cuando la variable puede tomar cualquier valor dentro de

un intervalo. (peso, edad).

Discretas:- cuando la variable puede tomar un determinado valor dentro

de un intervalo. , es decir, no hay decimales solo números enteros.

(número de hijos).

Cualitativas (Atributos):- Son lo que se puede observar del elemento de estudio

como color de ojos, estado civil.)

Realice un organizador gráfico, con los siguientes temas: Muestreo

estadístico, tamaño de la muestra, formas de muestra: ventajas y

desventajas, Variables y tipos de variables.

34



1.4. Escalas de Medición

. La medición es vital en el análisis estadístico. El análisis científico implica identificar

los fenómenos en estudio para poder describir su evolución cualitativa, y luego, la

medición de esos fenómenos, proporcionando así la característica de magnitud para

su conocimiento y previsión.

La medición puede definirse como la asignación de números a objetos y eventos de

acuerdo con ciertas reglas; la manera como se asignan esos números determina el

tipo de escala de medición.

Escala nominal. En esta escala las unidades observacionales (UO) se agrupan en

clases excluyentes según determinada propiedad, con lo que se define una partición

sobre el conjunto de tales unidades. Los números se usan como identificadores o

nombres. Cuando se estudia el desempleo de un país y se incluye la variable sexo,

se codifica masculino como 1 y femenino como 2, por ejemplo; los números1y2

representan categorías de datos: son simples identificadores y son completamente

arbitrarios. La operación matemática permitida es el conteo.

Escala ordinal: Surge a partir de la operación de ordenamiento; en esta escala se

habla de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está

cerca o lejos del segundo puesto. Los valores de la escala representan categorías o

grupos de pertenencia, con cierto orden asociado, pero no una cantidad mensurable.

La escala ordinal tiene las propiedades de identidad y magnitud. Los números

representan una cualidad que se está midiendo, y expresan si una observación tiene

más de la cualidad medida que otra UO. La distancia entre puntos de la escala no es

constante: no se puede determinar la distancia entre las categorías, sólo es

interpretable el orden entre sus valores. Ejemplos: situación socioeconómica, nivel

educativo.

Escala de intervalos. Esta escala representa magnitudes, con la propiedad de

igualdad de la distancia entre puntos de escala de la misma amplitud. Aquí puede

establecerse orden entre sus valores, hacerse comparaciones de igualdad, y medir la

distancia existente entre cada valor de la escala. El valor cero de la escala no es

absoluto, sino un cero arbitrario: no refleja ausencia de la magnitud medida, por lo que


35

las operaciones aritméticas de multiplicación y división no son apropiadas. Cumple

con las propiedades de identidad, magnitud e igual distancia. La igual distancia entre

puntos de la escala significa que puede saberse cuántas unidades de más tiene una

UO comparada con otra, con relación a cierta característica analizada. Por ejemplo,

en la escala de temperatura centígrada puede decirse que la distancia entre 25° y

30°C es la misma que la existente entre 20° y 25° C, pero no puede afirmarse que una

temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad de calor se

refiere, debido a la ausencia de cero absoluto. Así, los valores numéricos en la escala

de temperatura centígrada se pueden expresar en valores de la escala Fahrenheit

mediante la ecuación C=a+bF (a= -17.778; b=5/9).

Escala de razón. Corresponde al nivel de medición más completo. Tiene las mismas

propiedades que la escala intervalos, y además posee el cero absoluto. Aquí el valor

cero no es arbitrario, pues representa la ausencia total de la magnitud que se está

midiendo. Con esta escala se puede realizar cualquier operación lógica

(ordenamiento, comparación) y aritmética. A iguales diferencias entre los números

asignados corresponden iguales diferencias en el grado de atributo presente en el

objeto de estudio. Ejemplos: longitud, peso, distancia, ingresos, precios.

Es importante tener siempre presente la escala de medición que se está usando, pues

no todos los procedimientos estadísticos son apropiados para cualquier análisis. En

general, como sabemos, las variables estadísticas se clasifican en variables continuas

o cuantitativas y variables discretas o cualitativas, según el nivel de escala en que

estén medidas. Las variables continuas se refieren a magnitudes medidas en escala

de intervalos o de razón, mientras que las variables discretas comprenden magnitudes

medidas en escalas de nivel nominal y ordinal.

36



1.5. La investigación Estadística

La investigación estadística es una actividad que apela a diversas técnicas con el

propósito de llegar a la esencia de la realidad.

El proceso de la investigación estadística implica una serie de pasos; pues lanzarse a

investigar sin un criterio previo o preparación adecuada puede demandar más tiempo

del programado.

El proceso de aplicación de la estadística implica una serie de pasos:

1. Selección y determinación de la población o muestra y las características

contenidas que se desean estudiar. En el caso de que se desee tomar una

muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo

a realizar (probabilístico o no probabilístico).

2. Obtención de los datos. Esta puede ser realizada mediante la observación

directa de los elementos, la aplicación de encuestas y entrevistas, y la

realización de experimentos.

3. Clasificación, tabulación y organización de los datos. La clasificación incluye el

tratamiento de los datos considerados anómalos que pueden en un momento

dado, falsear un análisis de los indicadores estadísticos. La tabulación implica

el resumen de los datos en tablas y gráficos estadísticos.

Existen diferentes tipos de escalas de medición, realice un breve

análisis de cada una.


37

4. Análisis descriptivo de los datos. El análisis se complementa con la obtención

de indicadores estadísticos como las medidas: de tendencia central, dispersión,

posición y forma.

5. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos

que involucran elementos probabilísticos que permiten inferir conclusiones de

una muestra hacia la población (opcional).

6. Elaboración de conclusiones. Se construye el informe final.

Identifique y explique los pasos para el proceso de

Aplicación de la estadística.

38


Análisis estadístico es resumir los datos.

La estadística es una rama de la ciencia, encargada del diseño y aplicación de métodos para

recolectar, organizar, analizar y hacer deducciones a partir de ellos.

Cuando se realiza el análisis estadístico, tenemos la Población (finita,infinita).

Cuando vamos a hacer un estudio, no siempre se puede hacer uso de toda la población, por lo

que se tiene que recurri al muestreo

Para que la muestra sea representativa depende del tamaño de la muestra y de forma de

selección.

Tamaño de la muestras, : a medida que estudio universos mayores, el tamaño de muestra que

necesito cada vez representa un porcentaje menor de dicho universo.

Existen tres formas para seleccionar la muestra: Aleatoria o al azar, Intencional, por

conveniencia.

El proceso de aplicación de la estadística implica una serie de pasos:

Selección y determinación de la población o muestra

Obtención de los datos

Clasificación, tabulación y organización de los datos

Análisis descriptivo de los datos

Análisis inferencial de los datos.

Elaboración de conclusiones


39

Actividades de Auto – evaluación de la Unidad Didáctica I:

➢ Indique los usos del análisis estadístico.

➢ Genere su propia definición de estadística.

➢ Utilizando de base los cuadros de variables y atributos, realizar sus propios

ejemplos (3).

➢ Genere un ejemplo para aplicar la fórmula cuando se tiene una población

superior a 100.000.

➢ Escribir los pasos para el proceso de aplicación de la estadística.

Estadística, es el conjunto de métodos científicos ligados a la toma,

organización, recopilación, presentación y análisis de datos, tanto para

la deducción de conclusiones como para tomar decisiones razonables de

acuerdo con tales análisis.

El análisis estadístico, es la ciencia de recopilar, explorar y presentar

grandes cantidades de datos para descubrir patrones y tendencias

implícitos.

los datos estadísticos son un conjunto de números de una misma

características, que pueden ser organizados, comparados, analizados e

interpretados.

Población, es el total de unidades de estudio.(Finita, Infinita)

Un mismo conjunto de unidades de estudio puede tener diferentes

poblaciones según sea característica de interés.

El muestreo es el proceso de seleccionar un conjunto de individuos de

una población con el fin de estudiarlos y poder caracterizar el total de la

población.

La medición puede definirse como la asignación de números a objetos y

eventos de acuerdo con ciertas reglas

Escalas de medición (Nominal, ordinal, intervalos, razón

40


Actividad de Evaluación de la Unidad Didáctica I:

Este atento a la plataforma Amauta que se

subirá la actividad de evaluación final de la

Unidad Didáctica I.


41

Unidad didáctica II:

Título de la Unidad Didáctica II: Estadística descriptiva.

Introducción de la Unidad Didáctica II:

Los métodos de la Estadística Descriptiva o Análisis Exploratorio de Datos ayudan a

presentar los datos de modo tal que sobresalga su estructura. Hay varias formas

simples e interesantes de organizar los datos en gráficos que permiten detectar tanto

las características sobresalientes como las características inesperadas, el otro modo

de describir los datos es resumirlos en uno o dos números que pretenden caracterizar

el conjunto con la menor distorsión o pérdida de información posible.

Explorar los datos, debe ser la primera etapa de todo análisis de datos. ¿Por qué no

analizarlos directamente? En primer lugar porque las computadoras no son

demasiado hábiles solo son rápidas, hacen aquello para lo que están programadas y

actúan sobre los datos que les ofrecemos. Datos erróneos o inesperados serán

procesados de modo inapropiado y ni usted ni la computadora se darán cuenta a

menos que realice previamente un análisis exploratorio de los datos.

Objetivo de la Unidad Didáctica II:

Representar gráficamente los resultados de la investigación estadística,

honestidad y tolerancia.

Organizador Gráfico de la Unidad Didáctica II:

ESTADISTICA DESCRIPTIVA

Representación tabular de datos

Distribución de frecuencias

Medidas de tendencia central y

de dispersión

42


Actividades de Aprendizaje de la Unidad Didáctica II:

Actividad de Aprendizaje 1 de la Unidad Didáctica II:

2.1. Definición de Estadística descriptiva

(CECILIA SALAZAR P., 2018) “Es la parte de la estadística que permite analizar todo

un conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente

para ese conjunto. Para realizar este análisis se procede a la recolección y

representación de la información obtenida. Como ejemplo de estas estadísticas

podemos citar a aquellas que se obtienen generalmente en los deportes, en los

rendimientos académicos de los estudiantes de una determinada materia, en los

negocios al determinar las ventas obtenidas mensualmente en un determinado año

por una empresa en particular”.

Por lo que podemos decir que la Estadística Descriptiva, simplemente la utilizamos

para resumir de forma numérica o gráfica un conjunto de datos. Se restringe a describir

los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadística

descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en

dicha muestra, no se podrá generalizar la información hacia la población.

Explique con un ejemplo la definición de Estadística

Descriptiva.


43


2.2. Representación Tabular de Datos.

El principal objetivo de la estadística descriptiva es sintetizar conjuntos de datos

mediante tablas o gráficos resumen, con el fin de poder identificar el comportamiento

característico de un fenómeno y facilitar su análisis exhaustivo.

La presentación de datos estadísticos constituye en sus diferentes modalidades uno

de los aspectos de más uso en la estadística descriptiva. Porque cuando los datos

estadísticos se presentan a través de un conjunto de filas y de columnas que

responden a un ordenamiento lógico; es de gran importancia para el usuario ya que

constituye la forma más exacta de presentar las informaciones.

Una tabla consta de varias partes, las principales son las siguientes:

Título: Es la parte más importante del cuadro y sirve para describir todo el contenido

de este.

Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de

cada columna.

Columna matriz: Es la columna principal del cuadro.

Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la

tabla.

Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos.

Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que

aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

Se la utiliza con el fin de hacer recopilaciones numéricas bien estructuradas y fáciles

de interpretar para sintetizar los datos. Expresar valores, magnitudes u otros datos por

medio de tablas. Es una ordenación de datos, los cuales se representan en una tabla

en donde se colocan las variables de acuerdo a intervalos por medio de los cuales se

analizan los datos.

44


UNIDAD EDUCATIVA “LAS ROCAS”

PRODUCTO MUJERES PORCENTAJE DE

MUJERES QUE

COMPRARÍAN

HOMBRES PORCENTAJE DE

HOMBRES QUE

COMPRARÍAN

Comida 183 57% 182 72%

Artículos

Escolares

60 18% 51 20%

Bisutería 80 25% 520 8%

Total 323 100.00% 253 100.00%

Fuente: Alumnos de la Unidad Educativa “Las Rocas”, 2do Quimestre 2019

Ventajas de la tabulación:

• Fácil de leer.

• Un cuadro con su título se explica por sí mismo.

• Es más breve que el texto, elimina la necesidad de repetir las explicaciones.

• Permite presentar varios grupos de datos en un mismo cuadro.

• Se manejan valores exactos.


2.3. Distribución de Frecuencias.

La organización de los datos constituye la primera etapa de su tratamiento, puesto

que facilita los cálculos posteriores y evita posibles confusiones. Realmente, la

organización de la información tiene una raíz histórica y, actualmente, con el desarrollo

de los medios informáticos, tiene menos importancia desde un punto de vista aplicado.

Cuando no existían ordenadores, o ni siquiera calculadoras, si se disponía de un

conjunto de datos, era necesario dotarlos de alguna estructura que permitiera

resumirlos y comprenderlos de una forma más o menos sencilla.

En base a la información

proporcionada en esta guía en

líneas anteriores, elabore una

tabla estadística con 5 productos,

diferentes a los del ejemplo citado


45

La organización va a depender del número de observaciones distintas que se tengan

y de las veces que se repitan cada una de ellas. En base a lo anterior, se pueden

estructurar los datos de maneras diferentes.

Cuando se tiene un gran número de observaciones, pero muy pocas distintas, se

pueden organizar en una tabla de frecuencias, es decir, cada uno de los valores

acompañado de la frecuencia (también llamada frecuencia absoluta) con la que

aparece. Este es el tipo de tabla que acompaña a una variable discreta.

La frecuencia absoluta fi indica el número de veces que aparece un dato xi en el

estudio estadístico.

La frecuencia relativa hi es el cociente entre la frecuencia absoluta de un dato xi y

el número total de datos.

La frecuencia absoluta acumulada Fi es la suma de la frecuencia absoluta de un

dato xi y la de los datos menores que él.

Ejemplo:

En un centro recreativo para adultos mayores se realizó una encuesta a 25 personas

con el fin de saber cuántos días por semana van a este centro. En la encuesta se

obtuvieron los siguientes resultados:

5, 2, 3, 1, 2, 4, 5, 4, 2, 1, 5, 5, 3, 4, 2, 1, 4, 4, 5, 4, 5, 5, 5, 1, 3.

Los datos recogidos se organizan.

Número de días por semana 1 2 3 4 5

Número de personas 4 4 3 6 8

En esta tabla se observa que, por ejemplo, hay seis adultos mayores que van al centro

recreativo cuatro veces por semana; esto significa que la frecuencia absoluta del dato

“van cuatro veces por semana” es 6.

La siguiente tabla muestra las frecuencias absolutas, relativas y acumuladas de los

datos del Ejemplo.

46


Datos Frecuencias

absolutas

Frecuencias

relativas

Frecuencias

absolutas

acumuladas

1 4 4/25=0.16 4

2 4 4/25=0.16 4+4= 8

3 3 3/25= 0.12 4+4+3= 11

4 6 6/25= 0.24 4+4+3+6= 17

5 8 8/25= 0.32 4+4+3+6+8= 25

Suma= 25 Suma= 1

En esta tabla, el valor 17 de la columna de frecuencias absolutas acumuladas indica

el número de personas que asisten como máximo cuatro días por semana al centro

recreativo.

En base al ejemplo citado en

líneas anteriores, elabore usted

su propio ejercicio, aplicando las

fórmulas correspondientes.


47

Datos agrupados

Si una variable estadística es cuantitativa continua

o cuantitativa discreta con un número grande de

datos, conviene agrupar dichos datos en

intervalos o clases que tengan la misma amplitud,

es decir la misma cantidad de números en cada

intervalo.

En cada intervalo se toma un valor representativo

llamado marca de clase, que corresponde al valor

medio del intervalo. Para hallar la marca de clase, se suman los extremos del intervalo

y se divide el resultado entre dos.

A cuarenta estudiantes se les solicitó medir el tiempo (en minutos) que navegaron por

internet durante un fin de semana. Los resultados obtenidos ordenados de forma

ascendente son:

0, 15, 20, 35, 35, 38, 40, 45, 45, 45, 50, 55, 58, 65, 65, 70, 72, 90, 95, 100, 100, 110,

110, 110, 120, 125, 125, 130, 130, 130, 150, 160, 170, 175, 180, 185, 190, 195, 200,

220.

Calcular el número de clase o número de intervalos: - Existen varios métodos,

utilizaremos la siguiente fórmula:

2k >n

En donde n es el número de datos

K es el número de intervalos que estamos buscando

Para ubicar el valor de k que nos resuelve el ejercicio con n= 40. Utilizamos una tabla

de valores de k.

48


Rango:- Para calcular el rango utilizamos la siguiente fórmula

R= Dato mayor – Dato menor

R= 220 – 0

R=220

Ancho del intervalo: - Debe ser mayor al Rango dividido para el número de clase.

i= 220/6

i= >36,7

En mi caso voy a escoger a 40.

i= 40

k 2k

1 2

2 4

3 8

4 16

5 32

6 64

7 128

8 256

9 512

10 1024

Seleccionamos

k= 6

Porque 26 > 40


49

Tiempo

en

minutos

[0,40)

[40,80)

[80,120)

[120,160)

[160,200)

[200,240)

Marca de clase: - La marca de clase se halla dividiendo la suma de los extremos de

los intervalos entre 2.

Tiempo

en

minutos

Marca de

clase

[0,40) 20

[40,80) 6

[80,120) 100

[120,160) 140

[160,200) 180

[200,240) 220

Frecuencia Absoluta

Tiempo en

minutos

Marca

de clase

fi

frecuencia

absoluta

hi

(frecuencia

relativa)

Hi(%) Fi

Frecuencia

absoluta

acumulada

Hi

Frecuencia

relativa

acumulada

Hi%

[0,40) 20 6 6/40= 0.5 50 6 0.5 50

[40,80) 6 11 11/40= 0.2 20 17 0.7 70

[80,120) 100 7 7/40= 0.1 10 24 0.8 80

[120,160) 140 7 7/40= 0.1 10 31 0.9 90

[160,200) 180 7 7/40= 0.1 10 38 1 100

Marca de clase del primer intervalo

40 -20 = 20

2

Y se procede de igual manera para

los demás intervalos

50


[200,240) 220 2 2/40= 0.0 0 40 1 100

total 40 1 100


2.4. Medidas de Tendencia central

Media Aritmética: - La media aritmética o promedio de un conjunto de datos es el

cociente entre la suma de todos los datos y el número total de estos.

Ejemplo:

La primera columna de la Tabla muestra el tiempo semanal en horas que dedica a

navegar por internet un grupo de estudiantes; la segunda columna indica la frecuencia

absoluta de cada tiempo, y en la tercera se calcula el producto de cada tiempo por su

frecuencia.

Complete la tabla estadística de datos agrupados,

de acuerdo a los datos subidos por el docente en

la plataforma Amauta.


51

Tiempo en horas Frecuencia absoluta Dato * frecuencia

3 3 3*3=9

4 5 4*5=20

5 15 5*15=75

6 6 6*6=36

7 4 7*4=28

8 2 8*2=16

Total 35 184

Por tanto, en promedio los estudiantes navegan por internet 184/35 = 5.26 horas

semanales.

Media Ponderada: - En ocasiones, no todos los datos de la variable tienen la misma

importancia. En tal caso, se multiplican los datos por distintos números, que se

denominan pesos y que modifican su valor.

Para calcular la media aritmética ponderada se

siguen estos pasos.

1. Se multiplica cada dato por su peso y se suman los

resultados.

2. Se divide la cantidad obtenida por la suma de los

pesos.

Plantee un ejercicio para resolver la media

aritmética en una tabla estadística, basándose en

el ejercicio revisado anteriormente.

52


Ejemplo:

En un concurso, se asigna un puntaje a un ejercicio de salto y otro al tiempo de

ejecución, dándole una importancia de siete al primero y de tres al segundo. Clara

obtuvo nueve en salto y seis en tiempo de ejecución. ¿Cuál fue su puntuación final?

9 ∙ 7 + 6 ∙ 3

7 + 3=

81

10= 8.1

La puntuación de Clara es 8,1. El valor calculado es la media aritmética ponderada.

Media Aritmética de Datos Agrupados: - Para calcular la media aritmética o

promedio de un conjunto de datos agrupados, se deben calcular las marcas de clase

de los intervalos, luego se multiplican las marcas de clase por sus frecuencias

absolutas respectivas y finalmente, se divide la suma de estos productos por el total

de datos.

Ejemplo:

En la Tabla se registraron las estaturas de los estudiantes de octavo EGB de un

colegio.

Estatura (m) Número de

estudiantes

[1.40;1.45) 2

[1.45;1.50) 10

[1.50;1.55) 25

[1.55;1.60) 2

Plantee 3 ejercicios para encontrar la media

ponderada.


53

Para calcular la media aritmética de este grupo de datos, se construye una tabla en la

que se agregan dos columnas más: marca de clase (xi) y producto entre xi y su

correspondiente frecuencia absoluta fi, como se muestra en la Tabla.

Estatura (m) Marca de clase

(xi)

Frecuencia

absoluta

(fi)

Marca *

Frecuencia

(xi * f)

[1.40;1.45) 1.425 2 2.85

[1.45;1.50) 1.475 10 14.75

[1.50;1.55) 1.525 25 38.125

[1.55;1.60) 1.575 5 7.875

Total 42 63.6

Entonces, la media aritmética de la estatura de los estudiantes de octavo EGB es:

63,6/42 = 1,51 m.

Moda Y Clase Modal: - La moda de un conjunto de datos es el dato que tiene la mayor

frecuencia absoluta. Si los datos están agrupados en clases, la clase de mayor

frecuencia es la clase modal; en este caso, el valor de la moda corresponde a la marca

de clase modal, es decir, al punto medio de la clase.

Ejemplo:

Las edades de los 550 estudiantes que usan como medio de transporte el bus escolar

para llegar al colegio, se presentan agrupadas en la Tabla.

Complete la tabla estadística de acuerdo a los

datos subidos por el docente en la plataforma

Amauta, para encontrar la media aritmética de

datos agrupados.

54


Mediana Y Clase Mediana: - La mediana es el valor que ocupa la posición central de

todos los datos cuando estos están ordenados de menor a mayor. En un conjunto de

datos agrupados la mediana se encuentra en la clase mediana, para la cual la

frecuencia absoluta acumulada es el primer valor mayor o igual a la mitad del tamaño

de la muestra.

Edad Fi

[5,8) 220

[8,11) 115

[11,14) 87

[14,17) 83

[17,20) 45

Como la mayor frecuencia se

presenta en el intervalo [5, 8), esa se

considera la clase modal. La moda es

la marca de clase de este intervalo, es

decir, 6,5 años.

La moda no necesariamente es única, como sí lo son la

media y la mediana.

Si en un estudio estadístico el número de datos es impar,

la mediana es el valor central.

Si en el estudio estadístico el número de datos es par, la

mediana es la media aritmética de los dos valores

centrales.

Plantee un ejercicio para resolver la moda y clase

modal de una tabla estadística, basándose en el

ejercicio revisado anteriormente.


55


2.5. Medidas de dispersión

Rango: - El rango o recorrido de un conjunto de datos es la diferencia entre el mayor

y el menor valor de los datos. Si los datos están agrupados en clases, el rango se

calcula como la diferencia entre el extremo superior del último intervalo y el extremo

inferior del primero.

Ejemplo:

Los rangos de los salarios de las compañías de la situación inicial son:

Compañía A: $ 4 500 - $ 1 200 = $ 3 300

Compañía B: $ 2 600 - $ 2 300 = $ 300

Los puntos azules del diagrama de dispersión de la Figura representan los salarios de

la compañía A y los rojos, los de la compañía B.

Ejemplo:

56


Las estaturas de los 64 estudiantes de octavo EGB de un colegio

se registran en la Tabla. Como el extremo superior del último

intervalo es 200 y el extremo inferior del primero es 150, el rango

de la distribución es 200 - 150 = 50 cm.

DESVIACIÓN MEDIA: - La desviación respecto a la media es la diferencia entre cada

valor de la variable estadística y la media aritmética.

Para calcular la desviación media de un conjunto de datos:

1. Se hallan las desviaciones respecto a la media: dato - media

2. Se calculan los valores absolutos de las desviaciones: |dato - media|

3. Se encuentra la media aritmética de los valores absolutos de las desviaciones.

Ejemplo:

Las estaturas, en centímetros, de los jugadores de dos equipos de baloncesto son:

Equipo A: 190, 192, 195, 198, 200

Equipo B: 170, 175, 195, 215, 220

Estatura media del equipo A: 190+192+195+198+200

5= 195 𝑐𝑚

Estatura media del equipo B: 170+175+195+215+220

5= 195 𝑐𝑚

Las tablas presentan las desviaciones con respecto a la media y sus valores

absolutos.

Estatura

(cm)

fi

[150,160) 18

[160,170) 24

[170,180) 14

[180,190) 7

[190,200) 1


57

Las desviaciones medias de las estaturas de los equipos A y B son:

5 + 3 + 0 + 3 + 5

5=

16

5= 3,2 𝑐𝑚

25 + 20 + 0 + 20 + 25

5=

90

5= 18 𝑐𝑚

Como la desviación media del equipo B es mayor que la del equipo A, entonces las

estaturas de los integrantes del equipo B están más dispersas que las del equipo A,

como se observa en las figuras.

Equipo A

Datos Dato - media |Dato – media|

190 190-195= -5 5

192 192-195= -3 3

195 195-195= 0 0

198 198-195= 3 3

200 200-195=5 5

Suma= 16

Equipo B

Datos Dato - media |Dato – media|

170 170-195= -25 25

175 175-195= -20 20

195 195-195= 0 0

215 215-195= 20 20

220 220-195= 25 25

Suma= 90

Resuelva el ejercicio planteado por el docente

para encontrar la desviación media.

58


Varianza Y Desviación Típica: - La varianza de una distribución estadística es la

media aritmética de los cuadrados de las desviaciones respecto de la media. Se

representa por s2 y está dada por la expresión:

La desviación típica s es la raíz cuadrada positiva de la varianza.

Ejemplo:

Halla la varianza y la desviación típica de las edades 4, 8, 2 y 9 cuya media es 5,75.

Primero, se completa la Tabla 5 incluyendo las desviaciones con respecto a la media

y sus cuadrados. De acuerdo con la definición, la varianza y la desviación típica de la

distribución son, respectivamente:

𝑠2 =32,75

4= 8,1875 => 𝑠 = √8,1875 = 2,86

En base a la información dada por el docente encuentre la varianza y

desviación típica.

La suma de las desviaciones respecto a la media

siempre es 0. Por ello, para hallar la dispersión de

los datos se recurre a la desviación media (valor

absoluto de las desviaciones respecto a la media)

o a la varianza (cuadrado de las desviaciones

respecto a la media).


59

La Estadística Descriptiva, simplemente la utilizamos para resumir de forma numérica o gráfica un

conjunto de datos.

Tabulación de datos, cuando los datos estadísticos se presentan a través de un conjunto de filas y

de columnas que responden a un ordenamiento lógico.

La suma N de las frecuencias absolutas es igual al número de datos.

La suma de las frecuencias relativas siempre es igual a1. Estas expresan el porcentaje o tanto por

ciento de la población que tiene ese dato.

Cada uno de los intervalos en los que se agrupan los datos incluye el extremo izquierdo, pero no el

derecho.

En una tabla estadística usualmente la frecuencia absoluta se nota f i, la frecuencia relativa hi, la

frecuencia absoluta acumulada Fi y la frecuencia relativa acumulada Hi.

La media aritmética o promedio de un conjunto de datos está comprendida entre el menor y el

mayor de los datos del conjunto.

La moda no necesariamente es única, como sí lo son la media y la mediana.

Si en un estudio estadístico el número de datos es impar, la mediana es el valor central.

Si en el estudio estadístico el número de datos es par, la mediana es la medida aritmética de los dos

valores centrales.

Un diagrama de dispersión muestra los datos como un conjunto de puntos.

La suma de las desviaciones respecto a la media siempre es 0

60


Estadística descriptiva es la parte de la estadística que permite analizar todo un

conjunto de datos, de los cuales se extraen conclusiones valederas, únicamente para

ese conjunto.

Tabulación es cuando los datos estadísticos se presentan a través de un conjunto de

filas y de columnas que responden a un ordenamiento lógico.

La frecuencia absoluta fi indica el número de veces que aparece un dato xi en el estudio

estadístico.

La frecuencia relativa hi es el cociente entre la frecuencia absoluta de un dato xi y el

número total de datos.

La frecuencia absoluta acumulada Fi es la suma de la frecuencia absoluta de un dato

xi y la de los datos menores que él. Fórmula para calcular el número de clase 2k>n.

Ancho del intervalo: - Debe ser mayor al Rango dividido para el número de clase.

Marca de clase: - La marca de clase se halla dividiendo la suma de los extremos de los

intervalos entre 2

MEDIDAS DE TENDENCIA CENTRAL

Media Aritmética: - La media aritmética o promedio de un conjunto de datos es el cociente

entre la suma de todos los datos y el número total de estos.

Media Ponderada: - En ocasiones, no todos los datos de la variable tienen la misma

importancia. En tal caso, se multiplican los datos por distintos números, que se denominan

pesos y que modifican su valor.

Media Aritmética De Datos Agrupados: - Para calcular la media aritmética o promedio

de un conjunto de datos agrupados, se deben calcular las marcas de clase de los

intervalos, luego se multiplican las marcas de clase por sus frecuencias absolutas

respectivas y finalmente, se divide la suma de estos productos por el total de datos

Moda Y Clase Modal: - La moda de un conjunto de datos es el dato que tiene la mayor

frecuencia absoluta. Si los datos están agrupados en clases, la clase de mayor frecuencia

es la clase modal; en este caso, el valor de la moda corresponde a la marca de clase

modal, es decir, al punto medio de la clase.

Mediana Y Clase Mediana: - La mediana es el valor que ocupa la posición central de

todos los datos cuando estos están ordenados de menor a mayor.

MEDIDAS DE DISPERSIÓN

Rango: - El rango o recorrido de un conjunto de datos es la diferencia entre el mayor y el

menor valor de los datos.

Desviación Media: - La desviación respecto a la media es la diferencia entre cada valor

de la variable estadística y la media aritmética.

Varianza Y Desviación Típica: - La varianza de una distribución estadística es la media

aritmética de los cuadrados de las desviaciones respecto de la media. Se representa por

s2


61

Actividades de Auto – evaluación de la Unidad Didáctica II:

➢ Realizar un organizador gráfico de la distribución de frecuencias, medidas

de tendencia central, medidas de dispersión.

➢ Realizar un ejemplo de tabulación y aplicación de las frecuencias.

➢ Realizar dos ejercicios que impliquen lo revisado en la unidad II.

Actividad de Evaluación de la Unidad Didáctica II:

Este atento a la plataforma Amauta que se subirá

la actividad de evaluación final de la Unidad

Didáctica II.

62


Unidad didáctica III

Título de la Unidad Didáctica III: Análisis Combinatorio

Introducción de la Unidad Didáctica III:

A menudo nos encontramos con preguntas del tipo ¿Qué proporción de...? ¿Cuál es

la probabilidad de...? ¿De cuántas maneras se puede...? Muchas veces, para

responder, se necesita un pensamiento sistemático y un poco de información

adicional; por ejemplo, ¿Cuántas rutas diferentes puedo usar para ir de Buenos Aires

a San Luis? o ¿De cuántas maneras pueden quedar los 3 primeros puestos en una

carrera de 6 caballos? Hay técnicas y principios matemáticos útiles en situaciones

variadas, pero muchas preguntas se pueden responder directamente, contando en

forma sistemática, es decir, listando todos los posibles resultados en un orden, para

luego contar cuántos son, o desarrollando reglas de conteo.

Objetivo de la Unidad Didáctica III:

Calcular el número de arreglos diferentes que se pueden hacer con una colección

de objetos, con respeto.

Organizador Gráfico de la Unidad Didáctica III:

ANALISIS COMBINATORIO

Principios de multiplicación y

diagrama de árbolPermutaciones Combinaciones


63

Actividades de Aprendizaje de la Unidad Didáctica III:

Actividad de Aprendizaje 1 de la Unidad Didáctica III:

Análisis Combinatorio.

Por Análisis Combinatorio, o Combinatoria, se entiende aquella parte del Álgebra que

se ocupa del estudio y propiedades de los grupos que pueden formarse con unos

elementos dados, distinguiéndose entre sí:

• por el número de elementos que entran en cada grupo

• por el orden de colocación

Los m elementos de que se dispone para formar los grupos pueden ser distintos o

bien puede haber algunos iguales. En el primer caso, las agrupaciones formadas se

llaman ordinarias, las formadas en el segundo supuesto se denominan agrupaciones

con repetición.

Según los criterios empleados para la formación, las agrupaciones pueden ser de tres

tipos:

• variaciones

• permutaciones

• combinaciones

El análisis combinatorio permite, en relación al experimento planteado y sin perder

ningún caso, calcular los valores necesarios para aplicar la regla de Laplace:

𝑃 (𝐴) =𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑠𝑢𝑐𝑒𝑠𝑜 𝐴

𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Investigue una definición de análisis combinatorio y

de los tipos que existen.

64



Principios de Multiplicación.

El principio multiplicativo es una técnica que se utiliza para resolver problemas de

conteo para hallar la solución sin que sea necesario enumerar sus elementos. Es

conocido también como el principio fundamental del análisis combinatorio; se basa en

la multiplicación sucesiva para determinar la forma en la que puede ocurrir un evento.

Si un evento A se puede realizar de «m» formas diferentes y luego se puede realizar

otro evento B de «n» formas diferentes, el número total de formas en que pueden

ocurrir A y B es igual a m x n. Es decir, ambos eventos se realizan, primero uno y

luego el otro. El «y» indica multiplicación. Esto se conoce como principio de

multiplicación o principio fundamental del análisis combinatorio

Ejemplo:

¿De cuántas formas se puede vestir una persona que tiene 3 pantalones y 3 camisas?

Para vestirse, la persona se pone el pantalón y luego la camisa, es decir tiene 3 x 3 =

9 opciones diferentes de vestirse.

Ejemplo 2:

Un restaurante ofrece dentro de su menú diario dos tipos de sopa, tres tipos de carne,

dos tipos de ensalada, 5 variedades de bebidas y 3 opciones de postre.

Como estrategia de mercadeo, el dueño del restaurante quiere saber cuántas

posibilidades de menú diferentes puede ofrecer en un mismo día.

SOLUCIÓN:

En este caso el orden en que se establezcan las combinaciones no interesa, pero sí

el número de ellas. Además, no hay repetición de los elementos, pues para el menú

no se ofrece la combinación sopa-sopa-carne.

Así, por el principio de multiplicación se tiene que:

SOPA CARNE ENSALADA BEBIDA POSTRE TOTAL

2 * 3 * 2 * 5 * 3 180


65

Por lo tanto, se pueden obtener 180 platos diferentes.

Ejemplo 3:

Una persona desea construir su casa, para lo cual considera que puede construir los

cimientos de su casa de cualquiera de dos maneras (concreto o block de cemento),

mientras que las paredes las puede hacer de adobe, adobón o ladrillo, el techo puede

ser de concreto o lámina galvanizada y por último los acabados los puede realizar de

una sola manera ¿cuántas maneras tiene esta persona de construir su casa?

Solución:

Considerando que r = 4 pasos

N1= maneras de hacer cimientos = 2

N2= maneras de construir paredes = 3

N3= maneras de hacer techos = 2

N4= maneras de hacer acabados = 1

N1x N2x N3x N4= 2 x 3 x 2 x 1 = 12 maneras de construir la casa


Diagrama de árbol

Un diagrama de árbol es el dibujo que se usa para enumerar todos los resultados

posibles de una serie de experimentos en donde cada experimento se puede en un

número finito de maneras.

Con tres ejemplos explique el principio de

multiplicaci

66


Un diagrama de árbol es una representación gráfica de un experimento que consta de

r pasos, donde cada uno de los pasos tiene un número finito de maneras de ser llevado

a cabo.

Ejemplos:

1) Un médico general clasifica a sus pacientes de acuerdo a: su sexo (masculino

o femenino), tipo de sangre (A, B, AB u O) y en cuanto a la presión sanguínea

(Normal, Alta o Baja). ¿Mediante un diagrama de árbol diga en cuantas

clasificaciones pueden estar los pacientes de este médico?

2) Un hombre tiene tiempo de jugar ruleta cinco veces como máximo, él empieza

a jugar con un dólar, apuesta cada vez un dólar y puede ganar o perder en cada

juego un dólar, él se va a retirar de jugar si pierde todo su dinero, si gana tres

dólares (esto es si completa un total de cuatro dólares) o si completa los cinco

juegos, mediante un diagrama de árbol, diga cuántas maneras hay de que se

efectué el juego de este hombre.


67


Permutaciones.

Son eventos de tipo multiplicativo, donde el número de posibilidades va disminuyendo

y si importa el orden; una permutación es un arreglo de un conjunto de objetos en un

orden definido.

Hay dos tipos de permutaciones:

Se permite repetir: como la clave de una cerradura, podría ser "333".

Comente sobre el análisis del diagrama del árbol.

68


Sin repetición: por ejemplo, los tres primeros en una carrera. No puedes quedar

primero y segundo a la vez.

1. Permutaciones con repetición

Son las más fáciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las

permutaciones posibles son:

n × n × ... (r veces) = nr

(Porque hay n posibilidades para la primera elección, DESPUÉS hay n posibilidades

para la segunda elección, y así.)

Por ejemplo en la cerradura de arriba, hay 10 números para elegir (0,1,...,9) y eliges 3

de ellos:

10 × 10 × ... (3 veces) = 103 = 1000 permutaciones

Así que la fórmula es simplemente:

nr

Permutaciones sin repetición

En este caso, se reduce el número de opciones en cada paso.

Por ejemplo, ¿cómo podrías ordenar 16 bolas de billar?

Después de elegir por ejemplo la "14" no puedes elegirla otra vez.

Donde n es el número de cosas que puedes

elegir, y eliges r de ellas

(Se puede repetir, el orden importa)


69

Así que tu primera elección tiene 16 posibilidades, y tu siguiente elección tiene 15

posibilidades, después 14, 13, etc. Y el total de permutaciones sería:

16 × 15 × 14 × 13 ... = 20,922,789,888,000

Pero a lo mejor no quieres elegirlas todas, sólo 3 de ellas, así que sería solamente:

16 × 15 × 14 = 3360

Es decir, hay 3,360 maneras diferentes de elegir 3 bolas de billar de entre 16.

¿Pero cómo lo escribimos matemáticamente? Respuesta: usamos la "función

factorial"

Así que si quieres elegir todas las bolas de billar las permutaciones serían:

16! = 20,922,789,888,000

Pero si sólo quieres elegir 3, tienes que dejar de multiplicar después de 14. ¿Cómo lo

escribimos? Hay un buen truco... dividimos entre 13!...

16 ∗ 15 ∗ 14 ∗ 13 ∗ 12 …

13 ∗ 12 …= 16 ∗ 15 ∗ 14 = 3360

¿Lo ves? 16! / 13! = 16 × 15 × 14

La fórmula se escribe:

70


Ejemplo:

Nuestro "ejemplo de elegir en orden 3 bolas de 16" sería:

16!

(16 − 3)!=

16!

13!=

20,922,789,888,000

6,227,020,800= 3360

¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas?

10!

(10 − 2)!=

10!

8!=

3,628,800

40,320= 90

(Que es lo mismo que: 10 × 9 = 90)

Notación

En lugar de escribir toda la fórmula, la gente usa otras notaciones como:

P(n,r) = nPr = nPr = 𝑛!

(𝑛−𝑟)!


71


Combinaciones.

Una combinación de r elementos tomados de un conjunto de n elementos (r ≤ n ) es

una subconjunto no ordenado de los r elementos. El número de combinaciones de

tamaño r que se pueden seleccionar de n objetos distintos viene dado por la expresión:

𝐶𝑛,𝑟 = 𝑛 ∙ (𝑛 − 1) ∙ (𝑛 − 2) ∙ … ∙ (𝑛 − 𝑟 + 1)

𝑟!=

𝑃𝑛,𝑟

𝑟!=

𝑛!

𝑟! ∙ (𝑛 − 𝑟)!= [

𝑛

𝑟]

También hay dos tipos de combinaciones (recuerda que ahora el orden no importa):

Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10)

Sin repetición: como números de lotería (2,14,15,27,30,33)

Combinaciones sin repetición

Así funciona la lotería. Los números se eligen de uno en uno, y si tienes los números

de la suerte (da igual el orden) ¡entonces has ganado!

La manera más fácil de explicarlo es:

Imaginemos que el orden sí importa (permutaciones), después lo cambiamos para que

el orden no importe.

Plantee un ejercicio con permutaciones con

repetición y otro sin repetición.

72


Volviendo a las bolas de billar, digamos que queremos saber qué 3 bolas se eligieron,

no el orden.

Ya sabemos que 3 de 16 dan 3360 permutaciones.

Pero muchas de ellas son iguales para nosotros, porque no nos importa el orden.

Por ejemplo, digamos que se tomaron las bolas 1, 2 y 3. Las posibilidades son:

El orden si importa El orden no importa

1 2 3

1 3 2

2 1 3

2 3 1 1 2 3

3 1 2

3 2 1

Así que las permutaciones son 6 veces más posibilidades.

De hecho, hay una manera fácil de saber de cuántas maneras "1 2 3" se pueden

ordenar, y ya la sabemos. La respuesta es:

3! = 3 × 2 × 1 = 6

(Otro ejemplo: ¡4 cosas se pueden ordenar de 4! = 4 × 3 × 2 × 1 = 24 maneras distintas,

¡prueba tú mismo!)

Así que sólo tenemos que ajustar nuestra fórmula de permutaciones para reducir por

las maneras de ordenar los objetos elegidos (porque no nos interesa ordenarlos):

𝑛!

(𝑛 − 𝑟)! ∙

1

𝑟!=

𝑛!

𝑟! (𝑛 − 𝑟)!

Esta fórmula es tan importante que normalmente se la escribe con grandes paréntesis,

así:


73

𝑛!

𝑟! (𝑛 − 𝑟)!= [

𝑛

𝑟]

donde n es el número de cosas que puedes elegir, y eliges r de ellas

(No se puede repetir, el orden no importa)

Y se la llama "coeficiente binomial".

Notación

Además de los "grandes paréntesis", la gente también usa estas notaciones:

C(n,r) = nCr = nCr = (𝑛

𝑟) =

𝑛!

𝑟!(𝑛−𝑟)!

Ejemplo

Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es:

16!

3! (16 − 3)!=

16!

3! ∙ 13!=

20,922,789,888,000

6 ∙ 6,227,020,800= 560

O lo puedes hacer así:

16 ∙ 15 ∙ 14

3 ∙ 2 ∙ 1=

3360

6= 560

Es interesante darse cuenta de que la fórmula es bonita y simétrica:

Así que recuerda, haz las

permutaciones, después

reduce entre "r!"

... o mejor todavía...

¡Recuerda la fórmula!

74


Con otras palabras, elegir 3 bolas de 16 da las mismas combinaciones que elegir 13

bolas de 16.

Combinaciones con repetición

Digamos que tenemos cinco sabores de helado: banana, chocolate, limón, fresa y

vainilla. Puedes tomar 3 paladas. ¿Cuántas variaciones hay?

Vamos a usar letras para los sabores: {b, c, l, f, v}. Algunos ejemplos son:

{c, c, c} (3 de chocolate)

{b, l, v} (uno de banana, uno de limón y uno de vainilla)

{b, v, v} (uno de banana, dos de vainilla)

(Y para dejarlo claro: hay n=5 cosas para elegir, y eliges r=3 de ellas.

El orden no importa, ¡y sí puedes repetir!)

Bien, no puedo decirte directamente cómo se calcula, pero te voy a enseñar una

técnica especial para que lo averigües tú mismo.

Ahora puedes escribirlo como → ooo →→→ (la flecha es saltar, el círculo es tomar)

Imagina que el helado está en contenedores, podrías decir "sáltate el

primero, después 3 paladas, después sáltate los 3 contenedores

siguientes" ¡y acabarás con 3 paladas de chocolate!

Entonces es como si ordenaras a un robot que te trajera helado, pero

no cambia nada, tendrás lo que quieres.


75

Entonces los tres ejemplos de arriba se pueden escribir así:

{c, c, c} (3 de chocolate): →ooo→→→

{b, l, v} (uno de banana, uno de limón y uno de vainilla): o→→o→→o

{b, v, v} (uno de banana, dos de vainilla): o→→→oo

OK, entonces ya no nos tenemos que preocupar por diferentes sabores, ahora

tenemos un problema más simple para resolver: "de cuántas maneras puedes ordenar

flechas y círculos"

Fíjate en que siempre hay 3 círculos (3 paladas de helado) y 4 flechas (tenemos que

movernos 4 veces para ir del contenedor 1º al 5º).

Así que (en general) hay r + (n-1) posiciones, y queremos que r de ellas tengan

círculos.

Esto es como decir "tenemos r + (n-1) bolas de billar y queremos elegir r de ellas". Es

decir, es como el problema de elegir bolas de billar, pero con números un poco

distintos. Lo podrías escribir así:

Es interesante pensar que podríamos habernos fijado en flechas en vez de círculos, y

entonces habríamos dicho "tenemos r + (n-1) posiciones y queremos que (n-1) tengan

flechas", y la respuesta sería la misma...

¿Qué pasa con nuestro ejemplo, cuál es la respuesta?

(5 + 3 − 1)!

3! (5 − 1)!=

7!

3! ∙ 4!=

5040

6 ∙ 24= 35

¡Uau, es un montón

de cosas que

absorber, quizás

tendrías que leerlo

otra vez para

entenderlo todo

bien!

76


Por Análisis Combinatorio, o Combinatoria, se ocupa del estudio y propiedades de los

grupos que pueden formarse con unos elementos dados, distinguiéndose entre sí.

Principio de la multiplicación Fórmula:

N1x N2x N3x N4= 2 x 3 x 2 x 1 = 12

Diagrama de árbol

Es una representación gráfica de un experimento que consta de r pasos, donde cada

uno de los pasos tiene un número finito de maneras de ser llevado a cabo.

Permutaciones

Hay dos tipos de permutaciones: Se permite repetir, Sin repetición

! = significa que se multiplican números descendentes.

Combinaciones: no importa el orden.

Resuelva el ejercicio subido a la plataforma Amauta

por el docente, de combinaciones con repetición y

sin repetición.


77

Principios de Multiplicación:

Sin que sea necesario enumerar sus elementos,

multiplicación sucesiva para determinar la forma en la

que puede ocurrir un evento.

N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12

Diagrama de árbol: dibujo que se usa para enumerar

todos los resultados posibles de una serie de

experimentos en donde cada experimento se puede en

un número finito de maneras.

Permutaciones: el número de posibilidades va

disminuyendo y si importa el orden

Tipos: se permite repetir

n x n … (r veces) = nr

no repetir.

𝒏!

(𝒏 − 𝒓)!

Combinaciones

El orden no importa.

Sin repetir

𝑛!

𝑟! (𝑛 − 𝑟)!= [

𝑛

𝑟]

Con repetición

78


Actividades de Auto – evaluación de la Unidad Didáctica III:

1) Si se tiene una caja con 5 tornillos de diferente longitud y se extraen 3 tornillos de uno en uno con sustitución ¿Cuántas formas hay de seleccionar los tornillos?

2) Una caja fuerte tiene un clave, y su dueño, no la recuerda, hay 20 números posibles (0, 1, … 19) y debe elegir 6 de ellos.

3) Consideremos el conjunto A= {a,b,c,d,e}. Entonces las permutaciones de estos 5 elementos son:

4) Si tengo el 1,2,3,4,5. ¿Cuáles serían Las combinaciones sin repetición de dos elementos de esta muestra?

Actividad de Evaluación de la Unidad Didáctica III:

Este atento a la plataforma Amauta que se subirá la

actividad de evaluación final de la Unidad Didáctica

III.


79

Unidad didáctica IV

Título de la Unidad Didáctica IV: Teoría de la probabilidad

Introducción de la Unidad Didáctica IV:

La teoría de la probabilidad es una herramienta matemática que establece un conjunto

de reglas o principios útiles para calcular la ocurrencia o no ocurrencia de fenómenos

aleatorios y procesos estocásticos.

En otras palabras, la teoría de la probabilidad está compuesta por todos los

conocimientos relativos al concepto de probabilidad. Se trata de un concepto, en

esencia, matemático. Así mismo, la probabilidad como rama de las matemáticas

constituye un instrumento para la estadística.

Objetivo de la Unidad Didáctica IV:

Desarrollar técnicas de conteo y teoría de probabilidades, con compromiso.

Organizador Gráfico de la Unidad Didáctica IV:

TEORIA DE LA PROBABILIDAD

Distribución de las probabilidades

Tipos de probabilidades

Reglas de la probabilidades

https://economipedia.com/definiciones/fenomeno-aleatorio.html

https://economipedia.com/definiciones/fenomeno-aleatorio.html

https://economipedia.com/definiciones/proceso-estocastico.html

https://economipedia.com/definiciones/estadistica.html

80


Actividades de Aprendizaje de la Unidad Didáctica IV:

Actividad de Aprendizaje 1 de la Unidad Didáctica IV:

4.1. Conceptos Fundamentales.

El término Probabilidad se refiere al estudio del azar y la incertidumbre. En aquellas

situaciones en las cuáles se puede producir uno de varios resultados posibles, la

Teoría de la Probabilidad provee métodos para cuantificar la chance de ocurrencia de

cada uno de ellos.

La teoría de probabilidades se ocupa de asignar un cierto número a cada posible

resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar

dichos resultados y saber si un suceso es más probable que otro. Con este fin,

introduciremos algunas definiciones:

Suceso

Es cada uno de los resultados posibles de una experiencia aleatoria.

Ejemplos:

Al lanzar una moneda salga cara.

Al lanzar un dado se obtenga 4.

Espacio muestral

Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo

representaremos por E (o bien por la letra griega Ω).

Ejemplos:

Espacio muestral de una moneda:


81

E = {C, X}.

Espacio muestral de un dado:

E = {1, 2, 3, 4, 5, 6}.

Suceso aleatorio

Suceso aleatorio es cualquier subconjunto del espacio muestral.

Ejemplos:

Al tirar un dado un suceso sería salir par

Al tirar dos monedas un suceso sería sacar dos caras

Un ejemplo completo

Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas.

Calcular:

1. El espacio muestral.

E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n,b); (n,n,n)}

2. El suceso A = {extraer tres bolas del mismo color}.

A = {(b,b,b); (n,n,n)}

3. El suceso B = {extraer al menos una bola blanca}.

B = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n,b)}

4. El suceso C = {extraer una sola bola negra}.

C = {(b,b,n); (b,n,b); (n,b,b)}

TEN EN CUENTA

La mayoría de

experimentos aleatorios

se presentan en juegos,

concursos y

eventos naturales, entre

otros.

82


Tipos de sucesos

• Suceso elemental: es el formado por un solo resultado.

• Suceso compuesto: es el formado por más de un resultado.

• Suceso seguro: es el que ocurre siempre en un determinado experimento.

• Suceso imposible: es el que nunca ocurre en un determinado experimento.

Los sucesos seguros se designan por E y los imposibles con Ø

Ejemplo

En el Mundial de Fútbol del 2018 se pueden presentar diferentes tipos de sucesos,

como se muestra en la Tabla:

Tipo de suceso El ganador del mundial será

Elemental El que ha ganado más copas mundiales.

A = {Brasil}

Compuesto El que ya ha sido campeón mundial.

B = {Brasil, Alemania, Italia, Argentina,

España, Inglaterra, Francia, Uruguay}

Seguro Uno de los equipos clasificados para el

Mundial de Fútbol 2022.

Imposible Un equipo no clasificado para el Mundial de

Fútbol 2022.C = Ø

Sucesos compatibles, incompatibles y contrarios

Dos sucesos son compatibles si tienen al menos un suceso elemental en común.

Dos sucesos son incompatibles si no tienen ningún suceso elemental en común.

Ejemplo


83

Si se extrae al azar una bola de la urna de la Figura 2, es posible

determinar los siguientes sucesos:

H: “sacar una bola con el número 8”

G: “sacar una bola de color verde”

Estos dos sucesos son compatibles porque pueden

verificarse al mismo tiempo:

se puede extraer una bola de color verde que tenga el

número 8.

Por su parte, los sucesos P: “sacar una bola roja” y Q:

“sacar una bola con un número impar” son incompatibles,

porque cualquier bola que se extraiga de esa urna no

puede ser roja y tener un número impar al mismo tiempo.

Se llama suceso contrario de A al suceso que ocurre siempre que no ocurra A y se

expresa de la forma Ã. Los sucesos contrarios también se llaman complementarios.

Ejemplo

En el experimento que consiste en el lanzamiento de un dado cúbico con las caras

numeradas del 1 al 6, el suceso contrario a A: “salir número par” = {2, 4, 6} es el suceso

Ã: “salir número impar” = {1, 3, 5}.

Observa que si se verifica el suceso A no se verifica el suceso contrario Ã y viceversa.

Sucesos equiprobables

Los sucesos equiprobables son aquellos que tienen la misma probabilidad de ocurrir.

Ejemplo

En la Figura se muestra una urna con tantas bolas rojas como

azules. Los sucesos A: “sacar una bola roja” y B: “sacar una bola

azul” son equiprobables, ya que es igual de probable extraer una

bola roja o una bola azul de la urna.

El contrario del suceso

seguro (el espacio

muestral) es el suceso

imposible (el conjunto

vacío) y viceversa.

84


Actividad de Aprendizaje 2 de la Unidad Didáctica IV:

4.2. Distribución de Probabilidad

Una distribución de probabilidad indica toda la gama de valores que pueden

representarse como resultado de un experimento si éste se llevase a cabo.

Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye

una herramienta fundamental para la prospectiva, puesto que se puede diseñar un

escenario de acontecimientos futuros considerando las tendencias actuales de

diversos fenómenos naturales.

Toda distribución de probabilidad es generada por una variable (porque puede tomar

diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede

ser de dos tipos: discreta o continua. Una variable aleatoria discreta es aquella

representada por números enteros, caracterizada por el límite de valores que puede

tomar. Por otro lado, una variable aleatoria continua no posee esta separación o

limitación, puede tomar cualquier valor dentro del límite establecido.

Tipos de distribución

El tipo de distribución depende del tipo de variable que se esté tratando. Existen

muchas, a continuación, las principales o más conocidas:

Para variables continuas: en el caso de que la variable aleatoria sea continua, la

distribución asociada es una distribución normal o de tipo Gaussiana.

Para variables discretas: en el caso de que la variable aleatoria sea discreta, pueden

existir varios tipos de distribuciones, las principales son la distribución binomial, la

distribución hipergeométrica y la distribución de Poisson (Se explicaran en el capítulo

siguiente)

Realice un organizador gráfico de la Teoría de la

probabilidad y los tipos de suceso.


85

Distribución Normal

Es una de las más importantes en el área de estadística. Su desarrollo y explicación

se les atribuyen a diferentes investigadores, especialmente a Carl Friedrich Gauss.

Esta distribución considera dos parámetros, los cuales son el promedio o la media (μ)

y la desviación estándar (σ). Gracias a estos dos parámetros, tiene asociada una

ecuación, de la cual se desarrolla una gráfica conocida como campana de Gauss.

Esta gráfica es simétrica con respecto a la media y su apertura o ancho viene dada

por la desviación estándar. A su vez, en la gráfica se ve reflejada la distribución de la

probabilidad de la variable en estudio.

De esta distribución normal se desarrollan otros tres tipos de distribuciones:

T de Student

Ji-cuadrado

F de Fisher

Ejemplos de Distribución Normal

Algunos ejemplos donde puede darse una distribución normal son:

El efecto de un medicamento o fármaco.

El cambio de temperatura en una época del año específica.

Caracteres morfológicos como el peso o la estatura en un grupo de individuos.

T de Student

En probabilidad y estadística, es una distribución de probabilidad que surge del

problema de estimar la media de una población normalmente distribuida cuando el

tamaño de la muestra es pequeño.

También se la llama teoría exacta del muestreo, ya que también la podemos utilizar

con muestras aleatorias de tamaño grande.

Para entender la distribución t Student es necesario conocer el concepto de “grados

de libertad”.

Para definir grados de libertad se hará referencia a la varianza maestral

86


Esta fórmula está basada en n-1 grados de libertad. Esta terminología resulta del

hecho de que si bien S2 está basada en n cantidades x1 - ̅x, x2 - x̅, ̅x,… xn - ̅x, éstas

suman cero, así que especificar los valores de cualquier n -1 de las cantidades

determina el valor restante.

Por ejemplo, si n=4 y x1 -̅x = 8; x2 - ̅x = -6 y x4 - ̅x = -4, entonces automáticamente

tenemos x3 - x̅ = 2, así que sólo tres de las cuatro medidas de x1 - ̅x están libremente

determinadas, la otra debe tomar el valor que haga esta suma cero, es por esto que

solo tenemos 3 grados de libertad.

Grados de libertad = número de mediciones -1

Distribución de probabilidad t-Student

Una variable aleatoria se distribuye según el modelo de probabilidad t o T de Student

con k grados de libertad, donde k es un entero positivo, si su función de densidad es

la siguiente:

La gráfica de esta función de densidad es simétrica, respecto del eje de ordenadas,

con independencia del valor de k, y de forma algo semejante a la de una distribución

normal:


87

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general

de la distribución t es similar a la de la distribución normal estándar: ambas son

simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media u

= o. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la

probabilidad de las colas es mayor que en la distribución normal. A medida que el

número de grados de libertad tiende a infinito, la forma límite de la distribución t es la

distribución normal estándar.

88


Propiedades de las distribuciones t.

1. Cada curva t tiene forma de campana con centro en 0.

2. Cada curva t, está más dispersa que la curva normal estándar.

3. A medida que k aumenta, la dispersión de la curva t correspondiente disminuye.

4. A medida que k -> 00, la secuencia de curvas t se aproxima a la curva normal

estándar.

Ejemplo:

Se desea saber si un instrumento de medición cualquiera está calibrado, desde el

punto de vista de la exactitud. Para ello se consigue un valor patrón y se lo mide 10

veces (por ejemplo: una pesa patrón para una balanza, un suero control para un

método clínico, etc.). Suponiendo que el resultado de estas mediciones arroja una

media de 52,9 y una desviación de 3, usando un patrón de valor 50, se debe

determinar si el instrumento está calibrado y la estimación de su error sistemático, si

es que se prueba su existencia (no se usan unidades para generalizar este ejemplo)


89

Se trata de un ensayo de dos colas donde hay k - 1 = 9 grados de libertad. De la

tabla t-Student se obtienen los valores críticos para el 95% de t0,05,9 = 2,262, para el

99% de t 0,01,9 = 3,25 y para un nivel del 99,9% es t0,001,9 = 4,781. Lo que permite

establecer las zonas de aceptación y rechazo:

Mirando las zonas con los valores críticos, el valor de t cae en la de rechazo para el

95% y no alcanza para las otras. La conclusión es que se ha probado la existencia

de un error sistemático con una confianza del 95%.

90


Ji-cuadrado

El estadístico ji-cuadrado (o chi cuadrado), que tiene distribución de probabilidad del

mismo nombre, sirve para someter a prueba hipótesis referidas a distribuciones de

frecuencias. En términos generales, esta prueba contrasta frecuencias observadas

con las frecuencias esperadas de acuerdo con la hipótesis nula.

Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su

distribución t de Student, nos han servido para someter a prueba hipótesis que

involucran a promedios y porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que

tiene distribución de probabilidad del mismo nombre, nos servirá para someter a

prueba hipótesis referidas a distribuciones de frecuencias.

En términos generales, esta prueba contrasta frecuencias observadas con las

frecuencias esperadas de acuerdo con la hipótesis nula

Ji- cuadrado como prueba de asociación

Supongamos que un investigador está interesado en evaluar la asociación entre uso

de cinturón de seguridad en vehículos particulares y el nivel socioeconómico del

conductor del vehículo. Con este objeto se toma una muestra de conductores a

quienes se clasifica en una tabla de asociación, encontrando los siguientes resultados:


91

¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel

socioeconómico? Usaremos un nivel de significación alfa=0,05.

Los pasos del análisis estadístico en este caso son los siguientes:

1. En primer lugar se debe plantear las hipótesis que someteremos a prueba

H0: “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.

H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.

En esta prueba estadística siempre la hipótesis nula plantea que las variables

analizadas son independientes.

2. En segundo lugar, obtener (calcular) las frecuencias esperadas

Estas son las frecuencias que debieran darse si las variables fueran independientes,

es decir, si fuera cierta la hipótesis nula.

Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de

los casos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no lo usan. Esa

misma proporción se debería dar al interior de los tres grupos de nivel

socioeconómico, de manera que el cálculo responde al siguiente razonamiento: si de

94 personas 51 usan cinturón; de 21 personas, ¿cuántas debieran usarlo?

La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4. Este

procedimiento debe repetirse con todas las frecuencias del interior de la tabla.

El detalle de los cálculos es el siguiente:

Nivel bajo: (21x51/94)=11,4-(21x43/94)=9,6

Nivel medio: (31x51/94)=16,8-(31x43/94)=14,2

Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2

92


Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera

verdadera y, por consiguiente, las variables fueran independientes.

Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así

tendremos una tabla con los valores observados y una tabla con los valores

esperados, que anotaremos en cursiva, para identificarlos bien.

3. En tercer lugar se debe calcular el estadístico de prueba

En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al comienzo,

compara las frecuencias que entregan los datos de la muestra (frecuencias

observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:

Donde oi representa a cada frecuencia observada y ei representa a cada frecuencia

esperada.

De este modo el valor del estadístico de prueba para este problema será:

Entonces x2 = 5,23. Este es el valor de nuestro estadístico de prueba que ahora,

siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar con

un valor de la tabla de probabilidades para ji-cuadrado (x2). Esta tabla es muy parecida

a la tabla t de student, pero tiene sólo valores positivos porque ji-cuadrado sólo da


93

resultados positivos. Véase gráfico, que muestra la forma de la curva, con valores

desde 0 hasta infinito.

Dado que el estadístico ji cuadrada sólo toma valores positivos, la zona de rechazo

de la hipótesis nula siempre estará del lado derecho de la curva.

Uso de tabla ji-cuadrado

La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la

primera fila la probabilidad asociada a valores mayores a un determinado valor del

estadístico (véase gráfico de la tabla).

Los grados de libertad dependen del número de celdas que tiene la tabla de asociación

donde están los datos del problema y su fórmula de cálculo es muy sencilla:

Grados de libertad (gl)=(nº de filas–1)x(nº de columnas–1)

Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad serán:

gl=(2-1)x(3-1)=2

Nótese que no se consideran la fila ni la columna de los totales.

94


Tabla de ji-cuadrado.

Al comienzo elegimos un nivel de significación alfa=0,05. Entonces un valor de tabla

para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.

Por lo tanto, como en el gráfico vemos que 5,23 se encuentra a la izquierda de 5,99,

la probabilidad asociada a valores superiores a 5,23 es mayor que alfa (0,05).

Grados de

libertad


95

Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso de

cinturón de seguridad” y “nivel socioeconómico” son independientes. Limitación: como

norma general, se exige que el 80% de las celdas en una tabla de asociación tengan

valores esperados mayores de 5.

Ji-cuadrado como prueba de bondad de ajuste

También se puede usar el estadístico ji-cuadrado para evaluar cuán buena puede

resultar una distribución teórica, cuando pretende representar la distribución real de

los datos de una muestra determinada. A esto se le llama evaluar la bondad de un

ajuste. Probar la bondad de un ajuste es ver en qué medida se ajustan los datos

observados a una distribución teórica o esperada.

Tomemos como ejemplo la distribución esperada para los individuos de una población

que son clasificados según grupo sanguíneo. Según estudios realizados en población,

se espera que dicha distribución, en porcentajes, sea la siguiente:

Ejemplo de distribución esperada.

96


En una muestra de 150 dadores de sangre se encontró la siguiente distribución:

Ejemplo de distribución observada.

1. Las hipótesis del problema son:

H0: los datos se ajustan a la distribución teórica.

H1: los datos no se ajustan a la distribución teórica.

2. Siguiendo el esquema general de solución propuesto para las pruebas de hipótesis,

ahora corresponde elegir un nivel de significación

Elegimos entonces alfa=0,01. El estadístico de prueba será ji-cuadrado, cuya fórmula

es:

Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los

porcentajes esperados a la muestra de 150 casos podemos obtener las siguientes

frecuencias esperadas (ei):


97

Ejemplo de frecuencias esperadas.

Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en este

caso: gl=4-1=3

Recordemos que la fila del total no se considera para los grados de libertad.

Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar

la diferencia entre ellas utilizando el estadístico ji-cuadrado. Si la diferencia entre

frecuencias observadas y esperadas es grande, significará que la hipótesis nula es

falsa, o sea, esta distribución no se ajusta a la distribución teórica y si, en cambio,

resulta que la diferencia entre frecuencias observadas y esperadas no es muy grande,

significará que la hipótesis nula es verdadera; por lo tanto, la distribución en la muestra

se ajusta a la distribución teórica y diremos que no hay significación estadística.

El valor del estadístico de prueba (x2) es una medida de la diferencia entre frecuencias

observadas y esperadas; por lo tanto, mientras mayor resulte, más fácil será rechazar

la hipótesis nula.

3. Se calcula el estadístico de prueba con los datos del ejemplo

4. Se compara este valor con el valor de ji-cuadrado de la tabla

El valor de ji-cuadrado lo buscaremos con alfa=0,01 y 3 grados de libertad. Según

tabla, ese valor es 11,34.

98


Al comparar el valor del estadístico de prueba (0,73) con el valor de tabla (11,34),

vemos que 0,73 se encuentra a la izquierda de 11,34 desplazado hacia el centro de

la curva y que, por lo tanto, la probabilidad de valores mayores a él es muy superior

al nivel de significación alfa=0,01.

F de Fisher

Comparación de dos varianzas.

La necesidad de disponer de métodos estadísticos para comparar las varianzas de

dos poblaciones es evidente a partir del análisis de una sola población.

Frecuentemente se desea comparar la precisión de un instrumento de medición con

la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma

en que varía el procedimiento para calificar de un profesor universitario con la de otro.

Intuitivamente, podríamos comparar las varianzas de dos poblaciones, Ϭ12 y Ϭ22,

utilizando la razón de las varianzas muestrales S2 1/S2 2. Si S2 1/S2 2 es casi igual a 1,

se tendrá poca evidencia para indicar que Ϭ12 y Ϭ2

2 no son iguales. Por otra parte, un

valor muy grande o muy pequeño para S21/S22, proporcionará evidencia de una

diferencia en las varianzas de las poblaciones.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-

cuadrada independiente, cada una dividida entre sus respectivos grados de libertad.

Esto es,

donde χ21 y χ2

2 son variables aleatorias ji-cuadrada independientes con grados de

libertad v1 y v2 respectivamente.

La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha.

La distribución F es conocida como distribución de Fisher. Los valores de F se

encuentran tabulados para diferentes grados de significación y la forma de manejar

las tablas de F es similar a la que ya hemos visto para otras distribuciones. La tabla

de F la encontrarán en los materiales auxiliares.

Supóngase que se tiene interés en dos poblaciones normales independientes, donde

las varianzas de la población son desconocidas. Se desea probar la igualdad de las

dos varianzas. Ya vimos que para poder comparar las medias de estas dos

poblaciones se utiliza la distribución t de Student, en la cual podemos tener varianzas


99

iguales o diferentes en la población (Caso de comparación de dos medias con

varianza poblacional desconocida). Nuestro estadístico de prueba es:

Este caso es la comparación de dos muestras en cuanto a sus varianzas y tenemos

tres posibles casos:

Ejemplo:

La variabilidad en la cantidad de grasa presente en un lote de un complemento

dietético, utilizada para un proceso de fabricación de un alimento, depende del origen

del complemento. Un fabricante que recibe el complemento de dos proveedores 1 y

2, hizo una comparación analizando muestras de ambos proveedores. Muestras de

n1=10 y n2=16 mediciones de dos lotes produjeron las varianzas:

S21=1.25 y S2

2=0.5

¿Presentan los datos evidencia suficiente para indicar que la variabilidad en el

contenido de grasa es menor para el producto que se recibe del proveedor 2? Realice

una prueba con un a= 0.05.

100


Solución.

Tenemos nuestras hipótesis:

La Fcalc = 1.25/0.5 = 2.5

Como 2.5 < 2.5876 no se rechaza Ho, y se concluye con un ∞= 0.05 que no existe

suficiente evidencia para decir que la variabilidad del contenido de grasa del

complemento del proveedor 2 es menor que la del complemento suministrado por el

proveedor 1.

Investigue sobre la distribución de probabilidad y sus

diferentes tipos.


101

4.2.1 Probabilidad empírica

La probabilidad empírica se obtiene en base a resultados obtenidos de un evento o

experimento, esta probabilidad se basa en la frecuencia con la que cierto resultado

suceda. Para poder calcular una probabilidad empírica es necesario realizar el evento

o experimento unas cuantas ocasiones, porque esta probabilidad se calcula

analizando los resultados anteriormente obtenidos.

Ejemplo:

Encontrar probabilidad empírica

Para encontrar la probabilidad empírica de un suceso se usará el ejemplo de lanzar

una moneda al aire, Hay que aclarar que, al inicio de los eventos, ambas caras tienen

la misma probabilidad de salir es decir 50% cada cara: 1 resultado a obtener / 2

posibles resultados = 0.5

Luego de lanzar la moneda en 60 ocasiones, se obtienen los siguientes resultados.

Resultado Ocasiones que salió

Cara 26

Cruz 34

Con estos resultados ya se puede pasar al siguiente paso que es obtener la

probabilidad empírica, para ello se hace uso de la siguiente ecuación.

Rf = resultados favorables

Tr = Total de resultados

Probabilidad = Rf / Tr

Ahora sabiendo esto, se puede calcular la probabilidad empírica con los resultados

anteriores.

Probabilidad de salir cara

102


P(cara) = 26 / 60 * 100%

P(cara) = 0.4333 * 100%

P(cara) = 43.33%

Probabilidad de salir cruz

P(cruz) = 34 / 60 * 100%

P(cruz) = 0.5666 * 100%

P(cruz) = 56.66%

Ejemplo

Si se toma un dado y se lanza al aire la probabilidad que tiene cada lado de salir es

de 16.7% al inicio del experimento, por lo que cualquier lado tiene las mismas

posibilidades, pero si este experimento se realizara 80 veces y los resultados fueran

los siguientes...

Lado Ocasiones que salió Porcentaje

1 10 12,5%

2 11 13,75%

3 13 16,25%

4 16 20%

5 18 22,5%

6 12 15%

Con estos resultados se puede observar que lado que empíricamente es más probable

que salga es el lado con cinco puntos, porque de 80 intentos salió en 18 ocasiones,

dicho de otra manera, salió el 22.5% de las ocasiones que se lanzó el dado, que fue

la probabilidad más alta.

Desarrolle un ejemplo para demostrar la

probabilidad empírica.


103

4.2.2 Probabilidad clásica

Es el número de resultados favorables a la presentación de un evento dividido entre

el número total de resultados posibles. Asignación de probabilidad "a priori", si

necesidad de realizar el experimento.

La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio

muestral tiene la misma probabilidad de ocurrir.

Fórmula para obtener la probabilidad clásica o teórica:

EJEMPLO:

¿Cuál es la probabilidad de obtener un número mayor que 3, en el lanzamiento de un

dado? Si E: 4, 5, 6, entonces el número de resultados favorables es n (E) = 3.

Si S: 1, 2, 3, 4, 5, 6, entonces el número total de resultados posibles es (S) = 6.

Por lo tanto:

Describa lo que entiende por probabilidad clásica.

104


4.2.3 Probabilidad subjetiva

Se basan en las creencias e ideas en que se realiza la evaluación de las

probabilidades y se define como en aquella que un evento asigna el individuo

basándose en la evidencia disponible (el individuo asigna la probabilidad en base a su

experiencia).

La probabilidad subjetiva puede tener forma de frecuencia relativa de ocurrencia

anterior o simplemente puede consistir en una conjetura inteligente N.

Para clarificar lo antes dicho un ejemplo muy común es el pronóstico del tiempo,

muchos individuos como nosotros realizamos una predicción personal de cómo serán

las condiciones climáticas para el día, basadas más en nuestra experiencia personal

pero que muchas veces sustentamos en experiencia de eventos pasados.

La asignación de probabilidad subjetiva se da generalmente cuando los eventos

ocurren solo 1 vez y a lo máximo unas cuantas veces más.

Sin embargo, en las organizaciones a pesar de que es común tomar decisiones en

base a la probabilidad subjetiva la mayoría de las veces esta se respalda con datos

futuros estadísticos.

Ejemplo:

Si pasas por la casa del vecino hay un perro que es probable que te muerda, debido

a que a mí me mordió cuando pasé por ahí.

4.2.4 Reglas de las probabilidades

Probabilidad total

Sean A y B dos sucesos definidos en el experimento E, cada uno de los cuales puede

presentarse o no cada vez que se realiza el experimento. Plantee estos dos sucesos

en cada uno de los experimentos dados.

Nos interesa considerar el suceso aparición de “al menos uno de ellos”

Es decir, el suceso se cumplirá si aparece A, si lo hace B o si lo hacen ambos.

Para calcular esta probabilidad se pueden presentar dos casos:


105

Se puede obtener para tres sucesos y luego generalizar más.

106


Probabilidad condicional

Hay situaciones en las que interesa calcular la probabilidad de sucesos que tienen

cierta información con respecto a un experimento. Dicha información reduce el

espacio muestra original a uno de sus subconjuntos. De esta forma la probabilidad de

un suceso será diferente si se tiene o no información adicional. Así, por ejemplo, un

animal elegido de aquellos que están vacunados tendrá una probabilidad mayor de no

contraer la enfermedad que aquel seleccionado entre el conjunto total de animales.

Este tipo de probabilidad se denomina probabilidad condicional y se expresa:

P(A / B) que se lee: probabilidad de que habiendo ocurrido B ocurra A, o probabilidad

de A habiendo ocurrido B.


107

Probabilidad compuesta o conjunta

La probabilidad condicional estudiada nos conduce a observar reglas de probabilidad

para sucesos conjuntos, es decir, la probabilidad de que dos o más sucesos

aparezcan al mismo tiempo.

Dado que:

Se debe introducir en este momento un concepto nuevo: el de sucesos

independientes.

Dos sucesos se dicen independientes si la probabilidad de ocurrencia de uno no es

afectada por la ocurrencia del otro. Luego

4.2.5 Regla de la adición

La regla de adición o regla de la suma, establece que, si tenemos un evento A y un

evento B, la probabilidad de que ocurra el evento A o el evento B se calcula de la

siguiente manera:

108


Fórmula

P(A⋃B) = P(A) + P(B) − P(A⋂B)

Donde:

P(A) : probabilidad de que ocurra el evento A.

P(B) : probabilidad de que ocurra el evento B.

P(A⋃B) : probabilidad de que ocurra el evento A o el evento B.

P(A⋂B) : probabilidad de que ocurra el evento A y el evento B a la vez.

¿Y si los eventos son mutuamente excluyentes?

Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo tiempo,

es decir, si no tienen elementos comunes.

Por ejemplo, sacar una carta al azar de una bajara, y obtener un 5 y un 7, son eventos

mutuamente excluyentes, ya que no hay ninguna carta que tenga un 5 y un 7 al mismo

tiempo.

Entonces P(A⋂B) = 0

Por lo tanto, partiendo de la misma fórmula, obtendríamos la siguiente expresión:

P(A⋃B) = P(A) + P(B) − P(A⋂B)

P(A⋃B) = P(A) + P(B) − 0

P(A⋃B) = P(A) +P(B)

Ejemplo:

La probabilidad de que un día cualquiera, Carlos almuerce pollo frito es de 0,4. La

probabilidad de que almuerce hamburguesa es de 0,3; mientras que la probabilidad

de que almuerce pollo frito y hamburguesa el mismo día es de 0,1. Calcula la

probabilidad de que un día cualquiera, Carlos almuerce pollo frito o hamburguesa.

Solución:


109

Definimos nuestras probabilidades:

Probabilidad de que Carlos almuerce pollo frito: P(A) = 0,4.

Probabilidad de que Carlos almuerce hamburguesa: P(B) = 0,3.

Probabilidad de que Carlos almuerce pollo frito y hamburguesa el mismo día:

P(A⋂B) = 0,1.

Probabilidad de que Carlos almuerce pollo frito o hamburguesa:

P(A⋃B) = ?

Ahora, aplicamos nuestra fórmula:

P(A⋃B) = P(A) + P(B) − P(A⋂B)

P(A⋃B) = 0,4 + 0,3 − 0,1

P(A⋃B) = 0,6

Ejemplo:

La probabilidad de que al tirar un dado, salga 1, es de 1/6. La probabilidad de que

salga 3, es de 1/6. Calcular la probabilidad de que al tirar un dado, salga 1 o 3.

Solución:

Definimos nuestros eventos:

Probabilidad de que salga 1: P(A) = 1/6.

Probabilidad de que salga 3: P(B) = 1/6.

Probabilidad de que salga 1 y 3 al mismo tiempo P(A⋂B) = 0. Este valor es cero, dado

que son eventos mutuamente excluyentes. Si sale 1, ya no puede salir 3.

Probabilidad de que salga 1 o 3: P(A⋃B) = ?

Ahora, aplicamos nuestra fórmula:

110


4.2.6 Regla de la multiplicación.

Si A y B son dos eventos independientes en un experimento de probabilidad, entonces

la probabilidad que ambos eventos ocurran simultáneamente es:

En caso de los eventos dependientes, la probabilidad que ambos eventos ocurran

simultáneamente es:

(La notación significa "la probabilidad de B , dado que A ha ocurrido".)

Ejemplo:

Suponga que saca dos cartas de un paquete de cartas una después de la otra, sin

reemplazar la primera carta. ¿Cuál es la probabilidad de que la primera carta sea un

as y la segunda carta sea una de espadas?

Los dos eventos son eventos dependientes porque la primera carta no es

reemplazada.

Realice un ejemplo de probabilidad subjetiva, reglas

de las probabilidades y reglas de adición.


111

Explique con un ejemplo en que consiste la regla de la

multiplicación.

112


La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir

en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable

que otro.

La mayoría de experimentos aleatorios

se presentan en juegos, concursos y

eventos naturales, entre otros.

Distribución de Probabilidad

Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de

un experimento si éste se llevase a cabo

Probabilidad empírica

La probabilidad empírica se obtiene en base a resultados obtenidos de un evento o experimento

Probabilidad clásica

Probabilidad subjetiva

Reglas de la probabilidad

Probabilidad total

Probabilidad Condicional

Probabilidad Compuesta

Reglas de la Adición

P(A⋃B) = P(A) + P(B) − P(A⋂B)

Regla de la multiplicación


113

El término Probabilidad se refiere al estudio del azar y la incertidumbre. En aquellas

situaciones en las cuáles se puede producir uno de varios resultados posibles, la Teoría

de la Probabilidad provee métodos para cuantificar la chance de ocurrencia de cada uno

de ellos.

Espacio muestral: Es el conjunto de todos los posibles resultados de una experiencia

aleatoria, lo representaremos por E (o bien por la letra griega Ω).

Sucesos aleatorios: Suceso aleatorio es cualquier subconjunto del espacio muestral.

Tipos de sucesos

• Suceso elemental: es el formado por un solo resultado.

• Suceso compuesto: es el formado por más de un resultado.

• Suceso seguro: es el que ocurre siempre en un determinado experimento.

• Suceso imposible: es el que nunca ocurre en un determinado experimento.

Distribución de Probabilidad

Una distribución de probabilidad indica toda la gama de valores que pueden representarse

como resultado de un experimento si éste se llevase a cabo.

Tipos de distribución

Para variables continuas: en el caso de que la variable aleatoria sea continua, la

distribución asociada es una distribución normal o de tipo Gaussiana.

Para variables discretas: en el caso de que la variable aleatoria sea discreta, pueden existir

varios tipos de distribuciones, las principales son la distribución binomial, la distribución

hipergeométrica y la distribución de Poisson.

Probabilidad empírica

Se obtiene en base a resultados obtenidos de un evento o experimento, esta probabilidad

se basa en la frecuencia con la que cierto resultado suceda. Para poder calcular una

probabilidad empírica es necesario realizar el evento o experimento unas cuantas

ocasiones, porque esta probabilidad se calcula analizando los resultados anteriormente

obtenidos.

114


Rf = resultados favorables

Tr = Total de resultados

Probabilidad = Rf / Tr

Probabilidad clásica

La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio muestral

tiene la misma probabilidad de ocurrir.

Probabilidad subjetiva

Se basan en las creencias e ideas en que se realiza la evaluación de las probabilidades y

se define como en aquella que un evento asigna el individuo basándose en la evidencia

disponible (el individuo asigna la probabilidad en base a su experiencia).

Reglas de las probabilidades

Probabilidad total

Probabilidad condicional

Hay situaciones en las que interesa calcular la probabilidad de sucesos que tienen cierta


115

Actividades de Auto – evaluación de la unidad IV:

Tres monedas son lanzadas al azar. La probabilidad de que se obtengan

Exactamente dos caras son:

a. 1/3

b. 3/8

c. 1/2

d. 2/3

Si P(A) = 0.3 y P (B) = 0.4 donde A y B son eventos mutuamente excluyentes,

Entonces la probabilidad de que A y B ocurran simultáneamente es:

a. 0

b. 0.12

c. 0.58

d. 0.7

Sea P(A) = 0.2 y P(B) = 0.5, donde A y B son independientes, entonces

P(A o B) =

a. 0

b. 0.1

c. 0.6

d. 0.7

Utilice la siguiente información para contestar las preguntas.

Sea S = {a, b, c, d, e, f} el espacio muestral de un experimento. Considere

A = { c, d, f} y B = {a, b, c, f} dos eventos del anterior espacio muestral.

La regla de adición o regla de la suma, establece que, si tenemos un evento A y un evento

B, la probabilidad de que ocurra el evento A o el evento B se calcula de la siguiente manera:

P(A⋃B) = P(A) + P(B) − P(A⋂B)

Regla de la multiplicación.

Si A y B son dos eventos independientes en un experimento de probabilidad, entonces la

probabilidad que ambos eventos ocurran simultáneamente es:

116


8. P(AUB) =

a. 2/6

b. 4/6

c. 5/6

d. 7/6

9. P(A∩ B) =

a. 2/6

b. 4/6

c. 5/6

d. 7/6

Un envase contiene 3 canicas rojas, 5 azules y 2 blancas. Las canicas son todas

iguales excepto en el color. Dos canicas son extraídas al azar y sin reemplazo del

envase. La probabilidad de que la segunda canica no sea roja dado que la primera no

fue roja es:

a. 7/9

b. 7/10

c. 6/9

d. 6/10

Actividad de Evaluación de la Unidad Didáctica IV:

Este atento a la plataforma Amauta que se subirá la

actividad de evaluación final de la Unidad Didáctica

IV.


117

Unidad didáctica V

Título de la Unidad Didáctica V: Distribuciones discretas especiales

Introducción de la Unidad Didáctica V:

En teoría de la probabilidad y estadística, la distribución de probabilidad de una

variable aleatoria es una función que asigna a cada suceso definido sobre la variable

la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está

definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango

de valores de la variable aleatoria. También puede decirse que tiene una relación

estrecha con las distribuciones de frecuencia. De hecho, una distribución de

probabilidades puede comprenderse como una frecuencia teórica, ya que describe

cómo se espera que varíen los resultados.

La distribución de probabilidad está completamente especificada por la función de

distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria

sea menor o igual que x.

Objetivo de la Unidad Didáctica V:

Calcular medidas de ubicación y descriptivas en una distribución de


Organizador Gráfico de la Unidad Didáctica V:

DISTRIBUCIONES DISCRETAS ESPECIALES

Distribución uniformeDistribución de

BernoulliDistribución binomial

y de poisson

https://es.wikipedia.org/wiki/Teor%C3%ADa_de_la_probabilidad

https://es.wikipedia.org/wiki/Estad%C3%ADstica

https://es.wikipedia.org/wiki/Variable_aleatoria

https://es.wikipedia.org/wiki/Funci%C3%B3n_matem%C3%A1tica

https://es.wikipedia.org/wiki/Variable_estad%C3%ADstica

https://es.wikipedia.org/wiki/Probabilidad

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias

https://es.wikipedia.org/wiki/Funci%C3%B3n_de_distribuci%C3%B3n

https://es.wikipedia.org/wiki/Funci%C3%B3n_de_distribuci%C3%B3n

118


Actividades de Aprendizaje de la Unidad Didáctica V:

Actividad de Aprendizaje 1 de la Unidad Didáctica V:

5.1. Distribución uniforme.

La distribución Uniforme es el modelo (absolutamente) continuo más simple.

Corresponde al caso de una variable aleatoria que sólo puede tomar valores

comprendidos entre dos extremos a y b, de manera que todos los intervalos de una

misma longitud (dentro de (a, b)) tienen la misma probabilidad. También puede

expresarse como el modelo probabilístico correspondiente a tomar un número al azar

dentro de un intervalo (a, b).

Ejemplo:

Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la

probabilidad de que se haya detenido en los primeros 25 minutos luego de señalar la

hora en punto.

Intervalo: [0-60]

f(x) = 1

60−0=

1

60

P(x) = P(0 ≤ x ≤ 25)= ∫1

60 𝑑𝑥 =

5

12

25

0

Comente sobre la distribución uniforme


119


5.2. Distribución de Bernoulli

La distribución de Bernoulli (o distribución dicotómica), nombrada así por el

matemático y científico suizo Jakob Bernoulli, es una distribución de probabilidad

discreta, que toma valor 1 para la probabilidad de éxito (p) y valor 0 para la

probabilidad de fracaso (q=1-p).

Si X es una variable aleatoria que mide "número de éxitos", y se realiza un único

experimento con dos posibles resultados (éxito o fracaso), se dice que la variable

aleatoria X se distribuye como una Bernoulli de parámetro P.

Su fórmula es:

n es el número de pruebas.

k es el número de éxitos.

p es la probabilidad de éxito.

q es la probabilidad de fracaso.

El número combinatorio

Ejemplo:

La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de

los lectores ya la han leído.

Un grupo de 4 amigos son aficionados a la lectura:

120


1 ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas?

B(4, 0.2) p = 0.8 q = 0.2

2 ¿Y cómo máximo 2?


5.3. Distribución binomial.

Fue desarrollada por Jacob Bernoulli, posee diversas aplicaciones en el área de

bioestadística, específicamente en la realización de experimentos, también es

conocida como distribución de Bernoulli. es una distribución de probabilidad discreta

que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli

independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los

ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico.

Un experimento o estudio tiene una distribución binomial cuando se cumplen las

siguientes condiciones:

En el experimento solo existen dos posibles resultados, el éxito o el fracaso.

La repetición del mismo experimento presenta un resultado que es independiente de

los resultados anteriores.

Demuestre con un ejemplo la distribución de

Bernoulli.


121

La probabilidad del éxito o del fracaso es constante.

Cada experimento posee un mismo número de réplicas.

Ejemplos de Distribución Binomial

Se aplica a experimentos y relaciones en las áreas de medicina o biología, aunque

también puede ser aplicada en las finanzas y economía. Algunos ejemplos de su

aplicación son:

Si una persona presenta o no una enfermedad como cáncer, viruela, o hepatitis.

Si una mujer se encuentra o no embarazada.

Si la publicación de un artículo fue exitosa o no.

Propiedades de la distribución binomial

Para que una variable aleatoria se considere que sigue una distribución binomial, tiene

que cumplir las siguientes propiedades:

En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o

fracaso).

La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p.

La probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante

dado que la moneda no cambia en cada experimento y las probabilidades de sacar

cara es constate.

La probabilidad de fracaso ha de ser también constate. Esta se representa mediante

la letra q = 1-p. Es importante fijarse que, mediante esa ecuación, sabiendo p o

sabiendo q, podemos obtener la que nos falte.

El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto,

lo que ocurra en cada experimento no afecta a los siguientes.

Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo

tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda

salga cara y cruz al mismo tiempo.

122


Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de

ocurrir. Si no se es hombre, se es mujer y si se lanza una moneda, si no sale cara ha

de salir cruz.

La variable aleatoria que sigue una distribución binomial se suele representar como

X~(n,p). n representa el número de ensayos o experimentos y p la probabilidad de

éxito.

La fórmula para calcular la distribución normal es:

Donde:

n = número de ensayos/experimentos

x = número de éxitos

p = probabilidad de éxito

q = probabilidad de fracaso (1-p)

Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino

que es un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente

formula:

El signo de exclamación en la expresión anterior, representa el símbolo de factorial.


123

Ejemplo de distribución binomial

Imaginemos que un 80% de personas en el mundo han visto el partido de la final del

último mundial de futbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la

probabilidad de que 3 de ellos hayan visto?

Definamos las variables del experimento:

n = 4 (es el total de la muestra que tenemos)

x = número de éxitos, que en este caso es igual a 3, dado que buscamos la

probabilidad de que 3 de los 4 amigos lo hayan visto.

p = probabilidad de éxito (0,8)

q = probabilidad de fracaso (0,2). Este resultado se obtiene al restar 1-p.

Tras definir todas nuestras variables, simplemente sustituimos en la formula.

El numerador de la factorial se obtendría de multiplicar 4*3*2*1 = 24 y en el

denominador tendríamos 3*2*1*1 = 6. Por lo tanto, el resultado del factorial sería

24/6=4.

Fuera del corchete tenemos dos números. El primero sería 0,8^3=0,512 y el segundo

0,2 (dado que 4-3 = 1 y cualquier número elevado a 1 es el mismo).

Por tanto, nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100

tenemos que hay una probabilidad del 40,96% de que 3 de los 4 amigos hayan visto

el partido de la final del mundial.

Realice una investigación sobre Distribución binomial

Y explíquelo con un ejemplo.

124



5.4. Distribución de Poisson

La distribución de Poisson es una distribución de probabilidad discreta que se aplica

a las ocurrencias de algún suceso durante un intervalo determinado. Nuestra variable

aleatoria x representará el número de ocurrencias de un suceso en un intervalo

determinado, el cual podrá ser tiempo, distancia, área, volumen o alguna otra unidad

similar o derivada de éstas.

La probabilidad de nuestra variable aleatoria X viene dada por la siguiente expresión:

Donde:

Nuestra variable aleatoria discreta puede tomar los valores:

x=0,1,2,3 …

donde es la media del número de sucesos en el intervalo que estemos tomando, ya sea de tiempo, distancia, volumen, etc. Es importante entender que este valor es una media en el sentido estrictamente estadístico de la palabra y como tal se calculará mediante dicha expresión y no debe calcularse nunca con una regla de proporcionalidad o regla de tres.

Se debe cumplir la condición de normalización

La desviación típica es

Cuando realizamos un experimento contando sucesos y obtenemos un valor x, su

error vendrá determinado por la raíz de x.

La distribución de Poisson debe de cumplir los siguientes requisitos:

La variable discreta x es el número de ocurrencias de un suceso durante un intervalo

(esto es la propia definición que hemos dado anteriormente).

Las ocurrencias deben ser aleatorias y no contener ningún vicio que favorezca unas

ocurrencias en favor de otras.


125

Las ocurrencias deben estar uniformemente distribuidas dentro del intervalo que se

emplee.

¿Cuándo se usa la Distribución de Poisson?

La distribución de Poisson es particularmente importante ya que tiene muchos casos

de uso. Podemos poner como ejemplos de uso: la disminución de una muestra

radioactiva, la llegada de pasajeros de un aeropuerto o estación de trenes o

autobuses, los usuarios que se conectan a una web determinada por hora (es un caso

particularmente interesante que usa Googlee en sus métricas predictivas de visitantes

únicos a una web).

Distribución de Poisson como una aproximación a la Distribución Binomial

La distribución de Poisson se usa en ocasiones para aproximar la distribución

binomial. Existe un consenso en poder realizar esta aproximación cuando se

satisfagan las siguientes condiciones:

1. n ≥ 100

2. np ≤ 10

En caso de que hagamos la aproximación porque se cumplan ambas condiciones

vamos a necesitar el valor de \mu que lo calcularemos mediante la siguiente

expresión:

Ejemplo general de Poisson

Si un banco recibe en promedio por día 6 cheques sin fondos. ¿Cuáles son las

probabilidades de que reciba?

a) 4 cheques sin fondo en un día. b) 10 cheques sin fondos en cualquiera de dos días consecutivos.

Solución:

a) X – variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, etc.

126


ꭅ = 6 cheques sin fondo por día

b) X = variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 0, 1, 2, 3, ….. etc., etc.

ꭅ = 6 X 2 = 12 cheque sin fondo en promedio que llegan al banco en dos días

consecutivos

NOTA: ꭅ siempre debe de estar en función de x siempre o dicho de otra forma, debe

hablar de lo mismo que x.

Comente sobre la distribución Poisson y en qué tipo de investigación se

aplica.


127

Distribución uniforme.

Distribución de Bernoulli

Distribución binomial

Distribución de Poisson

128


La distribución Uniforme es el modelo (absolutamente) continuo más simple.

Corresponde al caso de una variable aleatoria que sólo puede tomar valores

comprendidos entre dos extremos a y b, de manera que todos los intervalos

de una misma longitud (dentro de (a, b)) tienen la misma probabilidad.

La distribución de Bernoulli (o distribución dicotómica), nombrada así por el

matemático y científico suizo Jakob Bernoulli, es una distribución de probabilidad

discreta, que toma valor 1 para la probabilidad de éxito (p) y valor 0 para la

probabilidad de fracaso (q=1-p).

La distribución Binomial, es una distribución de probabilidad discreta que cuenta

el número de éxitos en una secuencia de n ensayos de Bernoulli independientes

entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un

experimento de Bernoulli se caracteriza por ser dicotómico.

La distribución de Poisson es particularmente importante ya que tiene muchos

casos de uso.


129

Actividades de Auto – evaluación de la Unidad Didáctica V:

1) Una llamada telefónica llego a un conmutador en un tiempo, al azar, dentro de un periodo de un minuto. el conmutador estuvo ocupado durante 15 segundos en ese minuto. calcule la probabilidad de que la llamada haya llegado mientras el conmutador no estuvo ocupado.

2) Probabilidad de vida para pólizas de seguro

Un agente de seguros vende pólizas a cinco personas de la misma edad

y que disfrutan de buena salud.

Según las tablas actuales, la probabilidad de que una persona en estas condiciones

viva 30 años o más es 2/3.

Hállese la probabilidad de que, transcurridos 30 años, vivan:

1 Las cinco personas

2 Al menos tres personas

3 Exactamente dos personas

3) Si un almacén recibe en promedio por día 300. ¿Cuál es la probabilidad de que reciba, 230 en un día? ¿Qué reciba 500 personas en cualquiera de dos días consecutivos?

Actividad de Evaluación de la Unidad Didáctica V:

Este atento a la plataforma Amauta que se subirá

la actividad de evaluación final de la Unidad

Didáctica V.

Documents

Asignatura: Estadística Descriptiva Docente:Ing. Priscila ...instipp.edu.ec/instipp/assets/pdf/guias/redes/rt-s5-estadistica.pdf · Unidad V.-Calcular medidas de ubicación y descriptivas