Upload
leo-harris
View
218
Download
1
Embed Size (px)
Citation preview
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
1/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
UNIDAD DE CIENCIAS BÁSICAS
JEAMMY JULIETH SIERRA HERNÁNDEZ
(Director Nacional de Curso)
100403 – INFERENCIA ESTADÍSTICAVol. 1
IBAGUÉFEBRERO 2013
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
2/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 2
COMITE DIRECTIVO
Jaime Alberto Leal AfanadorRector
Constanza Abadía GarcíaVicerrectora Académica y de Investigación
Gloria HerreraVicerrector de Medios y mediaciones Pedagógicos
Maribel Córdoba GuerreroSecretaria General
Inferencia Estadí stica
Tercera Versión
Actualización por Jeammy Julieth Sierra Hernández
Autores Primera Edición:Jorge RondonDanis Brito
CopyrightUniversidad Nacional Abierta y a Distancia
ISBN
2012
Unidad de Ciencias Básicas UNAD
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
3/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 3
CAMPOS DE Básica CR DITOS: 2 TRABAJO INDEPENDIENTE: 72TIPO DE CURSO Teórico C DIGO:100403 ACOMPAÑAMIENTO TUTORIAL: 24
OBJETIVO GENERAL:
Que el estudiante comprenda, aplique y desarrolle la teoría y las técnicas de lainferencia estadística en diversos campos de su saber formativo, y que dichaaplicación se convierta en una herramienta de uso matemático para la toma dedecisiones sobre hipótesis cuantitativas de datos, basado en la informaciónextraída de una muestra.
OBJETIVOS ESPECÍFICOS: Que el estudiante identifique las técnicas y procedimientos que se
deben emplear para que las muestras sean representativas de la poblaciónque se pretende estudiar, de forma que los errores en la determinación de
los parámetros de la población objeto de estudio sean mínimos.
Que el estudiante comprenda el comportamiento de una población apartir del análisis metódico de una muestra aleatoria de la misma, y queentienda que la inferencia inductiva de los parámetros estadísticos queestime sobre dicha muestra, conlleva un error, el cual es posible de sercuantificado.
Conocer los criterios técnicos que hay que tener en cuenta antes
de seleccionar un tamaño de muestra.
Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.
Diferenciar y analizar las ventajas y desventajas de la estimaciónpor intervalos de confianza y las pruebas de hipótesis.
Determinar la prueba o técnica apropiada a aplicar en las diferentespruebas de hipótesis paramétricas y No paramétricas.
COMPETENCIA GENERAL DE APRENDIZAJE:
Identificar un procedimiento adecuado para seleccionar de una población unaparte de ella, con el fin de obtener resultados confiables y poder generalizar losresultados obtenidos a toda la población.Determinar los estadísticos necesarios para el análisis y solución de situacionesque implican conjuntos de datos de su disciplina de formación, por medio del
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
4/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 4
conocimiento de la teoría elemental del muestreo y de las distribucionesmuestrales.
Plantear y desarrollar el proceso de la inferencia estadística para resolverproblemas concretos de investigación en el ámbito de otras disciplinas.
Aplicar apropiadamente los resultados teóricos y metodológicos de la inferenciaestadística de estimación y prueba de hipótesis en el marco de la modelación.
Habilidad para planear una investigación, diseño de instrumentos, definición devariables, recolección de la información, resumen y presentación de los datos.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
5/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 5
UNIDADES DIDÁCTICAS
INTRODUCCIÓN ................................................................................................................................... 6
UNIDAD UNO: ...................................................................................................................................... 7
MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA ............................................. 7
CAPITULO UNO: PRINCIPIOS DE MUESTREO ................................................................................... 8
Lección No 1: Conceptos Básicos .............................................................................................. 10
Lección No 2: Tipos de muestreo y selección de muestra ........................................................ 15
Lección No 3: Tipos de Selección de Muestras ......................................................................... 30
Lección No 4: Métodos de Inferencias, Paramétrico y No Paramétrico ................................... 31
Lección No 5: Estimadores y propiedades de los estimadores ................................................. 34
................................................................................................................................................... 36
CAPITULO DOS: DISTRIBUCIONES MUESTRALES ........................................................................... 37
Lección No 6: Distribuciones Muestrales .................................................................................. 38
Lección No 7: Distribución Muestral de la Media y de la Proporción ....................................... 40
Lección No 8: Distribución Muestral de la proporción.............................................................. 58
Lección No 9: Distribución Muestral de Diferencias de Medias y de la Proporciones .............. 63
Lección No 10: Tamaño de la muestra para estimar la media, la proporción y el total de la
Población ................................................................................................................................... 67
CAPITULO TRES: INTERVALOS DE CONFIANZA .............................................................................. 74
Lección No 11: Nociones Fundamentales. ................................................................................ 75
Lección 12. Intervalos de confianza para medias y diferencias de medias con muestras
pequeñas 30n ..................................................................................................................... 80
Lección 13. Intervalos de confianza para la media y diferencias de medias muestras grandes
30n .................................................................................................................................... 101
Lección 14. Intervalos de confianza para la proporción y diferencias de proporciones (siempre
son muestras grandes) 30n .............................................................................................. 105
Lección 15. Intervalos de confianza para la varianza poblacional. ......................................... 107
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
6/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 6
INTRODUCCIÓN
El presente modulo está dirigido a estudiantes de programas de pregrado queoferta la UNAD, bajo la modalidad de educación superior a distancia.
El material está estructurado en dos unidades que son las temáticas macro delcurso académico.
El contenido de cada una de las partes fue seleccionado, teniendo en cuenta lossaberes mínimos que se esperaría debe alcanzar un estudiante de laUniversidad Nacional Abierta y a Distancia en el campo de la Inferenciaestadística.
La propuesta permite que los estudiantes reconozcan los conocimientosmínimos del curso en mención, que le permita resolver situaciones propias delmismo y además, abordar posteriores temáticas que requieran de éstosconocimientos.
Para el mejor aprovechamiento de este material, se recomienda que el estudianteposea como conocimientos previos: de estadística descriptiva y de la teoría deprobabilidad.
El modulo se caracteriza porque en cada lección se presentan ejemplos
modelos del tema en estudio, al final de cada capítulo se exponen ejercicios conrespuesta, que permite a los estudiantes contextualizarse en diversas áreas delconocimiento, con el fin de fortalecer las temáticas propias del curso.
Al final de cada unidad se presenta una Autoevaluación de un nivel medio-alto, lascuales permiten verificar los alcances de los estudiantes en las temáticasanalizadas y detectar las debilidades y así centrarse en éstas, con el fin dealcanzar las metas propuestas.
Finalmente, el Material pretende servir como guía de aprendizaje autónomo, serecomienda apoyar este proceso por medio de lecturas especializadas, ayudasaudiovisuales, visitas a sitios Web y prácticas de laboratorio; entre otros, asílograr una efectiva comprensión, y aplicación de las temáticas estudiadas.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
7/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 7
UNIDAD UNO:
MUESTREO, DISTRIBUCIÓN MUESTRAL E INTERVALOS DE CONFIANZA
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
8/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 8
CAPITULO UNO: PRINCIPIOS DE MUESTREO
Introducción
En los estudios de investigación lo primero que se define es el f enómeno aanalizar, luego la población objeto de estudio, la cual puede ser finita cuandose conocen todos los elementos, o infinita cuando no se conocen todoslos elementos de la misma. Desde estos puntos de vista analizar la poblaciónno es práctico, por tiempo y costos, lo que induce a seleccionar unamuestra, cuya importancia radica en el proceso de consecución dedatos que proporcionan la información suficiente y necesaria a cerca dela población, además que con la muestra se están utilizando menos recursos,debido a que sólo una parte de la población se encuentra bajo observación,lo que resulta significativamente beneficioso sobre todo cuando se trata
de poblaciones grandes y dispersa.
Otro aspecto que justifica la decisión de tomar una muestra es en casos dondese debe destruir los elementos de ésta, por ejemplo cuando se deseaidentificar el grado de vacío de un producto enlatado, la resistencia de unmaterial y otros.
En las encuestas de opinión sobre la preferencia de un producto se nota másclaramente la utilidad de una muestra en contraste con la población,para conocer las preferencias de los consumidores y poder acomodar
rápidamente el sistema de producción a dichos cambios.
En desarrollo del presente modulo, se utiliza la coma para indicar la parte decimalde un número.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
9/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA 9
Objetivo general
Que los estudiantes identifiquen los principios sobre población y
muestra, métodos de muestreo, distribución de muestreo para medias,el teorema central del límite, aplicados al cálculo de tamaños de muestraspertinentes.
Objetivos especí f icos
Comprender los conceptos de población y muestra.
Identificar los diferentes diseños de muestreo y su utilidad en
diferentes campos del saber. Conceptuar una distribución muestra y calcular las estimacionesrequeridas, la varianza y el error de estimación para los mismos.
Conocer y comprender los elementos del teorema central delímite y su utilidad.
Determinar un tamaño de muestra representativo tanto para mediascomo para proporciones.
Realizar aplicaciones en Excel y SPSS.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
10/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
10
Lección No 1: Conceptos Básicos
Dentro de la inferencia estadística, el proceso de muestreo permite que apartir de los resultados obtenidos al analizar una muestra, se pueda obtenerconclusiones en cuanto a una o varias de las características o parámetros de una
población. Esta área de la Estadística, ayuda a determinar la confiabilidad de lainferencia de que los fenómenos observados en la muestra ocurrirán tambiénen la población de donde se selecciona la muestra. Es decir, sirve paraestimar la eficacia del razonamiento inductivo con el cual se infiere que loobservado en una parte ser equivalente a lo observado en la población.
Las técnicas de muestreo son importantes en la medida que se utilice enforma adecuada para la situación que se requiera. De las técnicas másconocidas y utilizadas se tienen el Muestro Aleatorio Simple (M.A.S), Muestreo
Aleatorio Estratificado (M.A.E), Muestro Sistemático (M.S) y Muestreo porConglomerados (M.C). Se tratará de analizar estas técnicas, especialmente elM.A.S y M.A.E.
El Éxito en el desarrollo del curso en mención está en los buenosconocimientos previos en Estadística Descriptiva, Probabilidad y, algebra,Trigonometría y Geometría analítica. Lo anterior debido a que se debe predecirresultados o tomar decisiones que tienen un grado de incertidumbre o ungrado de error que se debe definir de antemano.
1.1. Población Y Muestra
Existe una serie de términos estadísticos básicos, que son muy utilizados y serequiere sean comprendidos para avanzar en otros temas o unidades, enesta sección se tratarán los conceptos de población y muestra.
Población ó Universo: Se considera a todo aquello sobre el que sedesea hacer un estudio estadístico. Según el número de unidades,elementos o casos que la constituyen, la población puede ser finita o infinita.
Población Finita: Es aquella conformada por un determinado o limitado númerode elementos.
Población Infinita: Es aquella conformada por un determinado o limitadonúmero de elementos. Cuando el número de unidades que integra una población es muy grande, sepuede considerar a ésta como una población infinita. El investigador define la
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
11/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
11
población objeto de estudio en términos de espacio y tiempo, ya que de estamanera los resultados serán sobre la población definida en el espaciodemarcado y en el tiempo definido.
Ejemplo
Estudiantes del Programa de Ingeniería de SistemasEstudiantes del programa de Ingeniería de sistemas de la UNADEstudiantes del programa de Ingeniería de sistemas en la UNAD de losaños2.010, 2.011 y 2.012
Muestra: Se considera una muestra al subconjunto representativo de lapoblación, que ha sido seleccionada de manera técnica mediante unprocedimiento denominado diseño de muestreo, para garantizar que dicha
muestra es representativa de la población, es decir, que las unidadesseleccionadas en la muestra mediante un proceso aleatorio, hayan tenidoigual probabilidad de haber sido seleccionadas para el análisis.
Figura 1. Población y muestra
Muestra representativa: Subconjunto de sujetos que pertenecen a unapoblación determinada. Debería tener las mismas características generales quela población. En caso contrario, tenemos una muestra sesgada. (M. J. Navas,2001, p. 19). Ir al referente. Los dos principios que determinan la
http://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htmhttp://www.mathematicsdictionary.com/spanish/vmd/full/b/biasedsample.htm
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
12/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
12
representatividad de una muestra son, la forma de selección, que debe seraleatoria y el otro corresponde al tamaño de la muestra.
Parámetros: Según Moore, D. (2000) es un número que describe algunacaracterística de la población. En la práctica estadística el valor del parámetro noes conocido ya que en muchos casos no podemos examinar toda la población.
Pudiendo ser por ejemplo el porcentaje de personas con VIH en Colombia, aquíel parámetro es la “Proporción” de personas en la población (Colombia) que
tienen dicho virus.Es conveniente el uso de un símbolo general para designar el parámetro de
interés, entonces éste será:
Entre los parámetros más importantes tenemos:
= Tamaño total de la población
= Promedio Poblacional= Varianza Poblacional = Desviación estándar Poblacional = Total Poblacional =Proporción poblacionalEstadístico: Es un número que se puede calcular a partir de los datos de lamuestra. Moore, D. (pág. 270). Entonces un estadístico mide características,pero en una parte de la población, es decir, en una muestra; por ejemplo elporcentaje de personas en Bogotá con VIH; aquí se evidencia que la muestra es
la capital en donde se está analizando una característica, lo que permite sacarconclusiones de todo el país, por lo cual se dice que la inferencia suministraconclusiones de la población sirviéndose de los resultados encontrados en lasmuestras.
El objetivo fundamental del muestreo es Est imar los parámetros de lapoblación a partir de algunos elementos cuyas mediciones son los Estadístic os Los estadísticos más utilizados por su importancia son:
n =Tamaño de la muestra
=Promedio de muestraS2 =Varianza MuestraS =Desviación estándar Muestra ̂ =Total Estimado
p =Proporción Muestra
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
13/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
13
de estimación en inferencia estadística puede ser descrito como el proceso deestimar un parámetro a partir del estadístico correspondiente, tal como usar unamedia muestra (un estadístico) para estimar la media de la población (unparámetro).
Error de muestreo (error muestral): En estadística se sabe que existen
diferencias entre lo que se obtuvo en el estudio y lo que se esperaba. En elproceso de estimación es poco probable que la media Muestra sea idéntica a lamedia poblacional, igual para la varianza y la desviación estándar. El error demuestreo es la diferencia entre el estadístico y el parámetro, es decir diferenciaentre lo encontrado en la muestra con lo esperado en la población.
es el Parámetro y es el estadístico. Recuerde que
| | es el símbolo de valor absoluto
A medida que el tamaño de la muestra aumenta el error de muestreo disminuye,
es decir, son inversamente proporcionales.
Error tolerable: Se considera el error tolerable al error máximo que seestá dispuesto a aceptar y aún considerar que el muestreo ha alcanzadosu objetivo. En todo estudio estadístico siempre se considera un error tolerable,partiendo del principio que a menor error tolerable, mayor será el tamaño de
la muestra. Si es el parámetro y es
el estadístico, el error tolerable está
determinado por B, donde:
Error estándar: La desviación estándar de una distribución, en elmuestreo de un estadístico, es frecuentemente llamada el error estándar delestadístico. Por ejemplo, la desviación estándar de las Medias de todas lasmuestras posibles del mismo tamaño, extraídas de una población, es llamada elerror estándar de la media. De la misma manera, la desviación estándar de lasproporciones de todas las muestras posibles del mismo tamaño, extraídas de unapoblación, es llamada el error estándar de la proporción. La diferencia entre los
términos desviación estándar y error de estándar es que la primera se refierea los valores originales, mientras que la segunda está relacionada con valorescalculados.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
14/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
14
1.2. Razones para seleccionar una muestra
Entre los motivos que inducen a tomar una muestra aleatoria están:
Naturaleza Destructiva: Existen casos donde se requiere destruir loselementos de la muestra para medir la car acter ística, como es el caso de
medir la resistencia de un material, el vacío de un producto enlatado, otros. Noes lógico pensar en destruir todos los elementos de la población, de allí que setome una muestra.
Imposibilidad Física de Medir Todos los Elementos de la Población:Se sabe que existen poblaciones muy grandes, consideradas infinitas y escasi imposible conocer todos los elementos de la misma.
Costos: Estudiar todos los elementos de la población es muy costoso, tanto en
tiempo como en dinero, por lo que es más rentable hacer un estudio Muestra.
Confiabilidad del Estudio Muestra: Esta demostrado con soporte matemáticoque una muestra representativa arroja resultados que permiten inferir sobre lapoblación con una confiabilidad muy alta.
Unidad de observación: Son los elementos que se miden; es decir, sobre losque se toman los datos de las variables a medir. En el caso de los hogares, launidad de observación serán las personas y en el caso de las llantas delautomóvil, cada una serán las unidades de observación.
Marco de muestreo: Se considera el referente para identificar las unidades deobservación, éste NO incluye todos los elementos de la población. Ejemplos demarcos de muestreo tenemos el directorio telefónico de una ciudad, comopotenciales votantes, el registro de ventas de los últimos 5 años enuna compañía comercializadora y muchos otros.
1.3. Etapas en la Selección de La Muestra
En todo estudio de muestreo se debe definir las etapas que permiten sudesarrollo.
a) Definición de objeto de Estudio: Comprende la identificación del problema yel establecimiento de las metas que busca el estudio.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
15/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
15
b) Marco de Muestreo: Establecimiento de una metodología para identificar loselementos que estarán en el muestreo, sus características y el modelo quelos identifica.
c) Identificación de Variables: Es pertinente identificar las variables deestudio, para así definir la forma de medición que se haría.
d) Tamaño de la Muestra: Por medio del modelo de muestreo pertinenteseleccionar la muestra representativa, sobre la que se realizarán lasmediciones.
e) Unidad de Muestreo: Se debe extraer las unidades de muestreo según elmodelo definido que determinan las n unidades maestrales de la población N .
f) Trabajo de Campo: Son todas las acciones necesarias para obtener la
información, definiendo los costos, desplazamientos, herramientas física ylogísticas para su realización.
g) Análisis de Información: La información obtenida, requiere de un procesoestadístico, el cual puede ser descriptivo o inferencia, para el curso quenos ocupa se deben hacer los dos.
h) Resultados: Con el proceso desarrollado sobre los datos obtenidos, seprocede a la emisión de los resultados y la confrontación con las metaspropuestas para verificar el grado de eficiencia del trabajo realizado. Es
pertinente saber presentar los resultados, ya que un buen trabajo que no sepresente de la mejor manera, quedaría oscuro en su información.
Lección No 2: Tipos de muestreo y selección de muestra
Tipos de Muestreo
Con los conceptos previos que se han analizado, ahora corresponde
estudiar las clases de muestreo. Los dos grandes grupos están enmarcados enlas siguientes clases:
Muestreo probabilístico
Muestreo No probabilístico
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
16/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
16
2.1. Muestreo No Probabilístico
Son aquellos muestreos donde los elementos de la muestra se toman al azar,siendo imposible determinar el grado de representatividad de la muestra. Parael caso de una población homogénea, la representatividad de tal muestra puedeconsiderarse satisfactoria.
Por otra parte, en problemas comerciales diarios y en la toma de decisionesque a falta de tiempo no permiten disecar métodos de muestreo probabilísticohay que recurrir a este tipo de muestreo, donde el investigador conoce lapoblación.
Dentro del muestreo no probabilístico se conoce variostipos:
Muestreo por conveniencia.
Muestreo por juicio Muestreo Causa / Efecto
Muestreo por Cuotas
Muestreo de Poblaciones Móviles
2.1.1. Muestreo por convenienciaLa muestra se determina por conveniencia, incorporando elementos en la muestralsin probabilidades especificadas o conocida de selección. Por ejemplo unprofesor que se encuentra investigando una causa universitaria, puede usaralumnos voluntarios para formar la muestra, tan solo porque dispone fácilmente
de ellos y participan como elementos a un costo pequeño o nulo. Tiene laventaja de ser de fácil selección y recolección de sus datos. Tiene ladesventaja de no poderse evaluar en su bondad de la muestra enfunción de la representatividad de la población, motivo por el cual se haceimposible inferir a cerca de la población correspondiente.
2.1.2. Muestreo por juicioEn este método la persona por experiencia y capacidad selecciona a losindividuos u otros elementos de la población, que supone son los más
representativos de esa población. Por ejemplo un reportero puedemuestrear uno o dos senadores, por considerar que ellos reflejan la opinióngeneral de todos.
2.1.3. Muestreo causa / efectoSe realiza cuando no hay una población definida y se requiere tomarelementos para el estudio en cuestión, caso por el cual se toman los elementosdisponibles.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
17/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
17
2.1.4. Muestreo por cuotas
Cuando es necesario obtener una cantidad dada de elementos que constituyenuna muestra proporcional a la población, se toman elementos hasta cubrirdicha cuota. El caso de tomar una cantidad de carros en una esquina para
hacer un estudio sobre accidentalidad en dicho sitio.
2.1.5. Muestreo de poblaciones móviles
Método propio de poblaciones móviles como en estudios de migraciónocurridos en un sitio determinado. El caso típico es con animales que migran,donde se hace captura-marca- recaptura.
2.2. Muestreo Probabilístico
El muestreo aleatorio o muestreo probabilístico, es aquel en que cada uno delos elementos de la población objeto de estudio, tienen una probabilidadmatemática conocida, y frecuentemente igual, para ser elegido en la muestra.
Muestra probabilística
Una muestra se considera probabilística si cumple con las siguientescondiciones:
a) Se pueda definir un conjunto de muestras M1, M2, M3... Mi posibles
derivados del proceso de selección propuesta. Así se puede iden ti fi ca rque unidades de muestreo pertenecen a la muestra M1, M2, M3... Mi
b) A cada muestra posible le debe corresponder una probabilidad deselección conocida P(S).
c) El proceso de selección garantiza que todos los elementos de la poblacióntienen una probabilidad P(yi)>0 de ser elegido en alguna muestra.
d) La selección es un proceso aleatorio que garantiza que cadamuestra S tenga una probabilidad P(S) de ser elegida. Muestreo aleatoriosimple
Dentro del muestreo probabilístico o aleatorio existen cuatro métodos:1. Muestreo aleatorio simple2. Muestreo estratificado3. Muestreo sistemático4. Muestreo por conglomerados
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
18/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
18
2.2.1. Muestreo Aleatorio Simple
El M A S es la forma m á s sencilla de muestreo probabilístico y es la base detécnicas más complejas. La muestra se puede tomar de una población finitao infinita, la cantidad de muestras posibles depende del tipo de diseño y la
forma de tomar las muestras. Este tipo de muestreo se utilize cuando seconsidera que la población es más o menos homogénea. Como ya sabemos elmuestreo puede ser con y sin reemplazamiento.
El marco de muestreo corresponde a la lista codificada de todas las observacionesque hacen parte de la población. La muestra se elige de tal manera que cadaobservación tiene la misma probabilidad de ser elegida, la elección de unaobservación NO tiene influencia sobre la elección de otra. Es de aclarar que en elM.A.S la unidad de muestreo es igual a la unidad de observación.
Este tipo de muestreo requiere la construcción de un marco demuestreo, consistente en el listado completo de las unidades de lapoblación.
Técnicas para Seleccionar la Muestra
a) Tabla de números aleatorios
(Ver tabla siguiente). Se enumeran las unidades que conforman la población
objetivo de estudio, partiendo desde 01 hasta 99, desde 001 hasta 999, y asísucesivamente, dependiendo del tamaño poblacional. Luego se define eltamaño de la nuestra y como los elementos de la población estánlistados y codificados, entonces se establece un punto de partida:Columna x Fila y, se van leyendo ya sea horizontal o verticalmente losnúmeros de la tabla hasta completar el tamaño de la muestra.
Ejemplo
Suponga que tenemos N=30 facturas de servicios públicos (unidades en lapoblación), saque una muestra aleatoria simple de tamaño n=5.
Paso 1: Asigne etiquetas: Dé a cada unidad en la población un número, etiqueta oidentificación. Todas las etiquetas deben tener el mismo número de dígitos. Comotenemos 30 unidades y el número 30 tiene dos dígitos, todas las unidades tienenque tener dos dígitos.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
19/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
19
Tabla 1.Facturas de servicios públicos
Paso 2: Use la tabla: Empezando en un lugar escogido al azar lea grupos dedígitos (dependiendo del número de dígitos en las etiquetas) de izquierda aderecha, continuando con la línea siguiente cuando se acabe la línea que estáleyendo. Si el grupo de dígitos corresponde a una de las etiquetas, ese númeroidentifica a una de las unidades que será seleccionada. Si el grupo de dígitos nocorresponde a una de las etiquetas o si ya fue seleccionado, se salta al gruposiguiente.
Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 05,columna 1 (la columna 1 es la 12345) y la lectura sera vertical (aunque puede serhorizontal):
Se toman dos digitos porque la muestra es 30 (que tiene dos digitos)33850 Este número no se escoge porque está por encima de 30
97340Este número no se escoge porque solo se escogen numerous entre01 y 30. Se sigue buscando y se llega hasta un número menor oigual a 30
Este número si se escoge porque es menor a 30.14756
Se continúa y si con la primera columna no se han encontrado los 5 números parala muestra se pasa a la siguiente.
Cabe notar que el número 23913 de la tabla se salta ya que se repite el 23 que seencontró en 23236
La muestra está conformada por las observaciones que se ubican en la posición:14, 23, 09, 11 y 06
Recibo No. Valor $ Recibo No. Valor $ Recibo No. Valor $
01 $ 45.661 11 $ 37.798 21 $ 44.901
02 $ 43.629 12 $ 33.672 22 $ 40.155
03 $ 41.502 13 $ 39.607 23 $ 48.082
04 $ 45.069 14 $ 34.904 24 $ 32.825
05 $ 45.813 15 $ 36.701 25 $ 45.915
06 $ 49.687 16 $ 34.001 26 $ 30.382
07 $ 45.960 17 $ 36.302 27 $ 41.835
08 $ 35.001 18 $ 48.728 28 $ 47.227
09 $ 49.553 19 $ 48.706 29 $ 48.485
10 $ 46.976 20 $ 34.881 30 $ 45.159
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
20/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
20
Tabla 2.
Números aleatorios
Columna
00000 00001 11111 11112 22222 22223 33333 33334
Renglón 12345 67890 12345 67890 12345 67890 12345 67890
0149280 88924 35779 00283 81163 07275 89863 02348
02 61870 41657 07468 08612 98083 97349 20775 45091
03 43898 65923 25078 86129 78496 97653 91550 08078
04 62993 93912 30454 84598 56095 20664 12872 64647
05 33850 58555 51438 85507 71865 79488 76783 31708
06 97340 03364 88472 04334 63919 36394 11095 92470
07 70543 29776 10087 10072 55980 64688 68239 20461
08 89382 93809 00796 95945 34101 81277 66090 88872
09 37818 72142 67140 50785 22380 16703 53362 44940
10 60430 22834 14130 96593 23298 56203 92671 15925
11 82975 66158 84731 19436 55790 69229 28661 1367512
39087 71938 40355 54324 08401 26299 49420 59208
13 55700 24586 93247 32596 11865 63397 44251 43189
14 14756 23997 78643 75912 83832 32768 18928 57070
15 32166 53251 70654 92827 63491 04233 33825 69662
16 23236 73751 31888 81718 06546 83246 47651 04877
17 45794 26926 15130 82455 78305 55058 52551 47182
18 09893 20505 14225 68514 46427 56788 96297 78822
19 54382 74598 91499 14523 68479 27686 46162 83554
20 94750 89923 37089 20048 80336 94598 26940 36858
21 70297 34135 53140 33340 42050 82341 44104 82949
22 85157 47954 32979 26575 57600 40881 12250 73742
23 11100 02340 12860 74697 96644 89439 28707 25815
24 36871 50775 30592 57143 17381 68856 25853 35041
25 23913 48357 63308 16090 51690 54607 72407 55538
26 79348 36085 27973 65157 07456 22255 25626 57054
27 92074 54641 53673 54421 18130 60103 69593 49464
28 06873 21440 75593 41373 49502 17972 82578 16364
29 12478 37622 99659 31065 83613 69889 58869 29571
30 57175 55564 65411 42547 70457 03426 72937 83792 31 91616 11075 80103 07831 59309 13276 26710 73000
32 78025 73539 14621 39044 47450 03197 12787 47709
33 27587 67228 80145 10175 12822 86687 65530 49325
34 16690 20427 04251 64477 73709 73945 92396 68263
35 70183 58065 65489 31833 82093 16747 10386 59293
36 90730 35385 15679 99742 50866 78028 75573 67257
37 10934 93242 13431 24590 02770 48582 00906 58595
38 82462 30166 79613 47416 13389 80268 05085 96666
39 27463 10433 07606 16285 93699 60912 94532 95632
40 02979 52997 09079 92709 90110 47506 53693 49892
41 46888 69929 75233 52507 32097 37594 10067 67327
42 53638 83161 08289 12639 08141 12640 28437 09268
43 82433 61427 17239 89160 19666 08814 37841 12847
44 35766 31672 50082 22795 66948 65581 84393 15890
45 10853 42581 08792 13257 61973 24450 52351 16602
46 20341 27398 72906 63955 17276 10646 74692 48438
47 54458 90542 77563 51839 52901 53355 83281 19177
48 26337 66530 16687 35179 46560 00123 44546 79896
49 34314 23729 85264 05575 96855 23820 11091 79821
50 28603 10708 68933 34189 92166 15181 66628 58599
Fuente:Web
Paso 3: Indicar según las posiciones que arroja la tabla de números aleatorios
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
21/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
21
cuales elementos se escogerán para la muestra
Tabla 3:Selección muestra de 5 recibos ejemplo 1
Este método de selección permite que todos los elementos que constituyen la
población tengan la misma posibilidad de ser incluidos en la muestra. Loselementos se escogen en forma individual y aleatoriamente de la totalidad dela población. Esta selección puede ser sin reemplazamiento, similar a la quese realiza en la extracción aleatoria de números en el juego denominado baloto.Cada elemento que constituye la muestra se selecciona una sola vez,denominándose extracciones sin reposición.
En otras ocasiones, cada elemento puede ser elegido más s de una vez enla misma muestra, como por ejemplo, cuando se selecciona aleatoriamente elnúmero ganador de una lotería, que puede ocurrir ser el mismo número; enestos casos se dice que las extracciones son realizadas con reposición.
b) Programa de Computador: Utilizando el programa Excel que es el máscomún se puede desarrollar números aleatorios de la siguiente manera:
Si la población es de N = 1.000 observaciones y se desea una muestra de 20,entonces: Sobre una celda se escribe =ALEATORIO ()*N y se da clic, elsistema genera el primer número aleatorio, se despliega en la parte inferiorderecha de la celda del número hasta el tamaño de la muestra definida.
Sintaxis para obtener números aleatorios de una población de 1000observaciones
Figura 2. Sintaxis número aleatorio en Excel
No. Recibo Valor $ No. Recibo Valor $ No. Recibo Valor $
01 $ 45.661 11 $ 37.798 21 $ 44.901
02 $ 43.629 12 $ 33.672 22 $ 40.155
03 $ 41.502 13 $ 39.607 23 $ 48.082
04 $ 45.069 14 $ 34.904 24 $ 32.825
05 $ 45.813 15 $ 36.701 25 $ 45.915
06 $ 49.687 16 $ 34.001 26 $ 30.382
07 $ 45.960 17 $ 36.302 27 $ 41.835
08 $ 35.001 18 $ 48.728 28 $ 47.227
09 $ 49.553 19 $ 48.706 29 $ 48.485
10 $ 46.976 20 $ 34.881 30 $ 45.159
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
22/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
22
Al dar clic se genera el primer número aleatorio y desplegando se obtiene losque se desea.
De esta manera se obtiene los números aleatorios que se requierenpara tomar la muestra aleatoria de la población objeto de estudio. Si sevuelve a hacer el proceso, se obtendrán nuevos números y cada que se realice
un nuevo proceso, se generarán diferentes números; esto por lo de Aleatorio.
VIDEOS
c) Método de Fan Muller:
Para seleccionar una muestra aleatoria simple mediante este método hay queseguir los siguientes pasos:
1. Para cada elemento de la población se genera un número aleatorio entre 0y 1. Ese número aleatorio se llamará r.
2. Se hace un recorrido secuencial de la población y se incluye a la muestrael número aleatorio r si cumple: Comprobando que no estuviera anteriormente introducida, en el caso deque esté repetida se pasa a la siguiente unidad. Si se introduce la unidadse vuelve a empezar en el paso 1.
3. El algoritmo termina cuando d) Coordinado Negativo: El proceso general es de la siguiente manera:
1. Se adiciona una variable aleatoria U con distribución uniforme U (0, 1)2. Se ordena el marco muestral según la distribución U.3. La muestra se forma de los n primeros elementos del marco ordenado
Selección de
muestras a través
de M A S
https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1https://sites.google.com/site/unadjeammysh/recursos-de-apoyo/Trab1_Pto2.mp4?attredirects=0&d=1
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
23/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
23
2.2.2. Muestreo Aleatorio Estratificado
En el diseño de muestreo probabilístico, es pertinente identificar la poblaciónobjeto de estudio, ya que no siempre la variable de análisis es más o menoshomogénea. Si se desea analizar la variable peso; por lo general los hombres
pesan más s que las mujeres, en estratos altos se paga más arriendo queen estratos bajos. En estos y otros muchos casos el M. A. S. no es adecuado.En casos donde la población es muy heterogénea respecto a la variablede estudio el muestreo estratificado es mejor que el muestreo aleatorio simple.La palabra estratificar hace referencia a formar Capias.
DEFINICIÓN: Una muestra aleatoria estratificada se obtiene mediante laseparación de los elementos de la población en subgrupos llamados ESTRATOS,los cuales son disyuntos.
Obtenidos los estratos, en cada uno se obtiene la muestra por M.A.S para elestudio de la variable de interés.
Como los elementos de los estratos son disyuntos, entonces cadaunidad de muestreo pertenece solo a un estrato. Las muestrasseleccionadas en los estratos deben ser independientes; es decir, la elegidaen un estrato no debe afectar la elección de otra muestra en otro estrato.
La esencia de la estratificación es que ésta saca provecho de lahomogeneidad conocida de las sus poblaciones, de tal forma sólo se requieranmuestras relativamente pequeñas para estimar las características de cadasub-población, estas estimaciones individuales pueden entonces serfácilmente combinadas para producir una estimación de toda lapoblación; además, la economía en el tamaño de la muestra, unvalioso sub-producto del esquema del muestreo estratificado es que lasestimaciones obtenidas para diferentes partes de la población sepueden usar posteriormente para hacer comparaciones.
Para una descripción general del muestreo aleatorio estratificado y losmétodos de inferencia asociados con este procedimiento, suponemosque la población está dividida en h subpoblaciones o estratos de tamañosconocidos N 1, N 2 ,..N h tal que las unidades en cada estrato sean
homogéneas respecto a la característica en cuestión.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
24/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
24
Figura 3. Población divida en estratos
Ejemplo
Población de tutores del CEAD Ibagué - UNAD (ver figura 3). El tamaño de lapoblación 18 tutores (N= 18), la cual está dividida en 3 escuelas o subgrupos(H=3). Cada escuela es un estrato, y se tiene que son diferentes los perfiles de lostutores de una escuela a otra pero al interior de cada una son similares susprofesiones, esto significa que los subgrupos son heterogéneos entre sí, perohomogéneos dentro de cada uno.
VENTAJAS DEL MUESTREO ESTRATIFICADO
1. Evitar la obtención de muestras erróneas, tal es el caso deescoger elementos que podrían sesgar el muestreo, por consiguientese puede perder representatividad de la población.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
25/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
25
2. Obtener información precisa de ciertos subgrupos para hacercomparaciones
3. Producir un límite de error de estimación (B) más pequeño, comparado conel obtenido en el M.A.S. para un mismo tamaño de muestra.
4. Los costos por observación en las encuestas son más reducidos yaque se evitan desplazamientos extremos.
5. Las estimaciones se obtienen por subgrupos así los estratos se hacenidentificables.
Notación: Partiendo de la población o universo U cuyo tamaño es N,ésta se divide en NL estratos.
Figura 4. Tamaño de estratos
N = N1 + N2 +…+NL (Tamaño poblacional) = Tamaño del estrato i. = Valor de la observación j en el Estrato i. = Media poblacional en el estrato i.= Varianza poblacional en el estrato i.
= Total poblacional en el estrato i.
Proporcion poblacional en el estrato iLa media poblacional del estrato, la varianza poblacional del estrato, eltotal poblacional del estrato y el total poblacional, se obtiene de la siguientemanera:
En cada estrato se obtiene una muestra aleatoria por M.A.S. Si tenemos el
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
26/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
26
estrato l, se puede hacer el siguiente análisis.
Tamaño de la muestra en el estrato i Promedio de la muestra del estrato i
Varianza muestral del estrato i
̂ Proporción estimada del estrato i ∑ Donde son los elementos j del estrato iTamaño de la submuestras en los estratos
Ecuación No.1
Dónde:
N = Tamaño de la población
N = Tamaño de la muestra
Ni= Tamaño del estrato i
ni= Tamaño de muestra en el estrato i
N= N1+N2+N3+..+Nh
n = n1 + n2+…+ ni
Ejemplo
La sección operativa de una empresa de confecciones cuenta con 100empleados, la cual está dividida en operarios de maquina plana, dibujantes ycortadores, de los que hay 40, 35 y 25 operarios respectivamente; se quiere hacerun estudio estadístico y se toma una muestra de 20 empleados. ¿Cuántosoperarios de cada línea deben escogerse si la selección se hace a través de unmuestreo estratificado?
N= 100n = 20
N1= 40N2= 35N3= 25
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
27/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
27
La muestra de 20 empleados debe estar compuesta por 8 de máquina plana,7 dibujantes y 5 cortadores.
2.2.3. Muestreo Sistemático
Es utilizado por algunos contadores para revisar sumas, cuentas, inventarios,etc., por ser un método directo y económico. Consiste en seleccionar uno a
uno, los elementos de la muestra en un orden determinado, dando un inicioaleatorio. Es decir, la muestra queda ordenada.La fracción de muestreo se establece por medio de la siguiente relación: Dónde:
f = Fracción de muestreo
N= Población
n = Tamaño de la muestra
Ejemplo
De una población de 1.000 observaciones, se desea tomar una muestra de 10,cuáles serían las observaciones que harían parte de la muestra sistemática.
La fracción de muestreo es: f = Fracción de muestreoN= Poblaciónn = Tamaño de la muestra
Como la fracción de muestreo dio 100, el primer elemento se seleccionaaleatoriamente en el intervalo cero a cien, por ejemplo seleccionando elnúmero 25, el segundo elemento que se selecciona es 125 (25+100), luego el225 (125+100) y así sucesivamente, hasta completar la muestra de diez.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
28/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
28
Puede ver un ejemplo de muestreo sistemático en:https://sites.google.com/site/unadjeammysh/recursos-de-apoyo
Figura 5. Recursos de apoyo
Un problema específico del muestreo sistemático es la existencia de cualquier
factor periódico o cíclico en la lista de la población que pudiera conducir aun error sistemático en los resultados muestrales.
Ejemplo
Si en un hospital hay un universo de quince mil cien historias clínicasque están numeradas interrumpidamente y se desea tener una muestraequivalente al 10%, o sea, mil quinientas diez historias, ello significa que hade tomarse una de cada 10, ya que (15100 /1510 = 10). La primera historiapuede seleccionarse del primer grupo de 10. Si la primera historia
seleccionada es la número 8 en la población, teniendo en cuenta que elocho es un número cualquiera tomado aleatoriamente; la segunda será la 18=(8+10) la tercera será la 28 = (18 + 10), la cuarta será la 38 = (28 + 10), y asísucesivamente.
La estimación y tamaño de muestra tiene un análisis similar al muestreoaleatorio simple M.A.S.
2.2.4. Muestreo Conglomerados
Este es un método de muestreo aleatorio en el que los elementos de lapoblación se dividen en forma natural en subgrupos, de tal forma que dentro deellos sean lo más heterogéneo posible y entre ellos sean homogéneos, casocontrario al muestreo estratificado.
Este tipo de muestreo se usa en particular cuando no se dispone de una
Clic allí para descargar archivo
https://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyohttps://sites.google.com/site/unadjeammysh/recursos-de-apoyo
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
29/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
29
lista detallada y enumerada de cada una de las unidades que conforman eluniverso y resulta muy complejo elaborarla. Se le denomina así debido aque en la selección de la muestra en lugar de escogerse cada unidad seprocede a tomar los subgrupos o conjuntos de unidades, a los que se llama"conglomerados". Aunque quizá por ello se tienda a creer que es lomismo que el estratificado, ambos se diferencian en que en los
conglomerados los subconjuntos se dan en la vida real o ya estánagrupados de esa manera; por ejemplo: Escuelas, tipos de Industrias,bloques de casas y otros. En el estratificado el investigador decide lasagrupaciones que utilizar según la posible variabilidad de los fenómenos aestudiar; otra diferencia es que en este el investigador conoce la distribuciónde la variable, todo lo contrario que en el muestreo por conglomerado.
El proceso se indica definiendo los conglomerados, después se seleccionan lossubconjuntos a estudiar (o sea, que se realiza un muestreo de
conglomerados); de estos seleccionados se procede a hacer el listado de lasunidades que componen cada conglomerado, continuando posteriormente con laselección de las unidades que integrarán la muestra, siguiendo algunos de losmétodos aleatorios indicados.
Si se desea hacer un estudio en las escuelas de educación primaria sobre undeterminado fenómeno, inicialmente se seleccionan las escuelas que seestudiarán, de esas escuelas seleccionadas se determinan los grados o clasesque deben incluir y posteriormente se escogen los alumnos, que serán lasunidades de observación, utilizando uno de los métodos aleatorios. Se estima
que las inferencias que se hacen en una muestra conglomerada no son tanconfiables como las que se obtienen de un estudio hecho por muestreo aleatorio.
Ejemplo
Si un analista de la Secretaría de Salud necesita hacer un estudio de losservicios médico-asistenciales que reciben los trabajadores del áreametropolitana, sería difícil obtener una lista de todos los trabajadores de lapoblación objetivo. Sin embargo podría obtenerse una lista de las empresas yfábricas del área. Con esta lista, el analista puede tomar una muestra aleatoriade las empresas o fábricas, que representan conglomerados detrabajadores, y obtener la información de los servicios médicos que se lesestán prestando.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
30/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
30
Lección No 3: Tipos de Selección de Muestras
En el diseño Muestra hacemos referencia a la probabilidad de selección, lacual consiste en definir el valor de probabilidad de que una muestra dadasea seleccionada. En teoría de probabilidad existen dos tipos de selección:
3.1. Selección con Reemplazamiento:
Consiste en que los elementos seleccionados una vez medidos vuelven a lamuestra, lo que hace que el espacio Muestra permanezca constante. Por loanterior la ocurrencia de un evento no afecta la ocurrencia de otro, por lo quelos eventos se consideran independientes.
Ejemplo
Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿ Cuál serála probabilidad que al seleccionar dos bolas, estas sean blancas?
La probabilidad de que la primera sea negra es: La probabilidad de que la segunda sea negra es:
3.2. Selección sin Reemplazamiento:
Los elementos elegidos una vez la medición, estos NO vuelven a lamuestra, lo que hace que el espacio muestral cambie a medida que se vantomado elementos de la muestra.
Ejemplo
Si en una bolsa se tiene 4 bolas blancas y 5 bolas negras. ¿Cuál será laprobabilidad que al seleccionar dos bolas estas sean blancas, la selección essin reemplazamiento?
La probabilidad de que la primera sea negra es: 4/9La probabilidad de que la segunda sea negra es: 3/8Recordemos que una vez elegida la primera, ésta no vuelve a la muestra.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
31/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
31
Ejemplo
Suponga que tenemos N = 4 unidades 1, 2, 3 y 5 en una poblaciónhipotética y desea seleccionar muestras con reemplazamiento y sinreemplazamiento de tamaño n=2
Para los propósitos de esta selección, los valores podrían ser el número delas personas que viven en cada una de cuatro unidades habitacionales queconstituyen una población. Se realizará una comparación entre el muestreoaleatorio con y sin reemplazamiento para una muestra de tamaño n=2.Primero se listan todas las posibles muestras no ordenadas de tama ño n= 2.
Para recordar:
Tabla 4:Técnicas de conteoMuestreo Con Orden Sin Orden
Con Repetición Regla del exponente (o permutacionescon repetición)
N n
Multiplicación de opciones:n1 x n2 x n3….
Combinaciones
Sin Repetición Permutaciones (de n elementos tomadostodos a la vez)
N! = N P n
Permutaciones (de N elementos tomadosde r en r. con )
Combinaciones (de Nelementos tomados de r en r.
con )
Lección No 4: Métodos de Inferencias, Paramétrico y No
Paramétrico
4. Métodos De InferenciaLos procedimientos de inferencia permiten establecer conclusiones acerca deuna población, a partir de las propiedades estudiadas en una muestra de ella.
Además, como dichas conclusiones dependen de sucesos aleatorios, se lesasociará un nivel de confianza o de verosimilitud.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
32/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
32
Gráfico No.1 Métodos de inferencia
4.1. Métodos ParamétricosResuelve objetivos relacionados con parámetros de una población, tales comomedia, varianza, proporción etc. Estos modelos se apoyan en el conocimientode la distribución de probabilidad asociada a dicha población aunque sedesconozca algún parámetro de dicho modelo. Por ejemplo podemos suponerque el número de clientes atendidos por hora en una entidad bancaria sigue unmodelo de Poisson pero de parámetro µ desconocido.
Para resolver un problema de inferencia paramétrico se utilizan dos tipos deprocedimientos:
4.1.1. Estimación: Puntual cuando obtenemos valores aproximados del
parámetro desconocido y una medida de error asociado; por Intervaloscuando obtenemos un rango de valores, que contiene el verdadero valordel parámetro con una probabilidad o confiabilidad prefijada.
4.1.2. Test de Hipótesis: Cuando aceptamos o rechazamos una hipótesisrelacionada con uno o varios parámetros de una población desconocidos,con un cierto nivel de error prefijado.
4.2. Métodos no paramétricoLos métodos no paramétricos se refieren a menudo como distribución
libremente métodos pues no confían encendido asunciones que los datos estándibujados del dado distribución de la probabilidad. Resuelven situacionesrelacionadas con el tipo de distribución de probabilidad asociada a la poblaciónde estudio u otros objetivos no relacionados directamente con parámetros.
Lo deseable en estos casos será buscar la inferencia en contrastes que seanválidos bajo un amplio rango de distribuciones de la población. Tales contrastes
Métodos deInferencia
Parámetrico
EstimaciónPruebas deHipótesis
No
Parámetrico
Pruebas NoParámetricas
http://www.worldlingo.com/ma/enwiki/es/Assumptionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Probability_distributionhttp://www.worldlingo.com/ma/enwiki/es/Assumption
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
33/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
33
se denominan no paramétricos.
El término no paramétrico no se significa implicar que tales modelos carecentotalmente parámetros, sino que el número y la naturaleza de los parámetros sonflexibles y no fijados por adelantado.
Ventajas y Desventajas
Las pruebas no paramétricas no necesitan suposiciones respecto a lacomposición de los datos poblacionales. Las pruebas no paramétricas son deuso común:
1. Cuando no se cumplen las suposiciones requeridas por otrastécnicas usadas, por lo general llamadas pruebas paramétricas.
2. Cuando es necesario usar un tamaño de muestra pequeño y no es
posible verificar que se cumplan ciertas suposiciones clave.3. Cuando se necesita convertir datos cualitativos a información útil parala toma de decisiones.
Existen muchos casos en los que se recogen datos medidos en una escalanominal u ordinal. Muchas aplicaciones de negocios involucran opiniones osentimientos y esos datos se usan de manera cualitativa.
Ventajas
Las pruebas no paramétricas tienen varias ventajas sobre las pruebas
paramétricas:
1. Por lo general, son fáciles de usar y entender.2. Eliminan la necesidad de suposiciones restrictivas de las pruebas
paramétricas.3. Se pueden usar con muestras pequeñas.4. Se pueden usar con datos cualitativos.
Desventajas
También las pruebas no paramétricas tienen desventajas:
1. A veces, ignoran, desperdician o pierden información.2. No son tan eficientes como las paramétricas.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
34/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
34
Lección No 5: Estimadores y propiedades de los estimadores
5. Estimador
En estadística, un estimador es un estadístico (esto es, una función de lamuestra) usado para estimar un parámetro desconocido de la población. Porejemplo, si se desea conocer el precio medio de un artículo (el parámetrodesconocido) se recogerán observaciones del precio de dicho artículo endiversos establecimientos (la muestra) y la media aritmética de lasobservaciones puede utilizarse como estimador del precio medio.
Para cada parámetro pueden existir varios estimadores diferentes. En general,escogeremos el estimador que posea mejores propiedades que los restantes,como insesgadez, eficiencia, convergencia y robustez (consistencia).
5.1. Propiedades de un estimadorEl concepto de estimación de parámetros mediante la especificación de laspropiedades que deben cumplir los estimadores y el desarrollo de técnicasapropiadas para implementar el proceso de estimación. Se utilizar · el puntode vista práctico de la teoría del muestreo, que considera un parámetro comouna cantidad fija pero desconocida.
Para evaluar la calidad de un estadígrafo como un estimador este debe
cumplir las siguientes propiedades:
5.1.1. Insesgado
Un estimador insesgado es aquel cuya media o valor esperado de la distribuciónde las de las estimaciones es igual al parámetro estimado. En otras palabras,cuando el promedio de un estimador muestral es igual al parámetro poblacionalque se desea estimar.
5.1.2. Eficiencia:
La eficiencia se refiere al tamaño del error estándar del estadígrafo de lamuestra. Si se comparan dos estadígrafos de una muestra del mismo tamaño yse desea decidir cuál de los dos es el estimador más eficiente, se escogeráel estadígrafo que tenga el menor error estándar o desviación de ladistribución muestra. Supóngase que se escoge una muestra de un tamañodado y se decide cuando usar la media muestra o la mediana muestra para
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
35/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
35
estimar la media de la población. Si se calcula el error estándar de la mediamuestra y se encuentra que es igual a 2.15 y luego se calcula el errorestándar de la mediana muestra y se encuentra que es de 2.6, se podrádecir que la media muestra es un estimador más eficiente de la media de lapoblación porque su error estándar es menor o con menos variación, tendráuna mayor oportunidad de producir un estimador más cercano al parámetro de
la población bajo estudio.
5.1.3. Consistencia:
Un estadígrafo es un estimador consistente de un parámetro de la poblaciónsi en la medida en que el tamaño de la muestra aumenta se está seguro deque el valor del estadígrafo se acerca al valor del parámetro de la población.
Cuando un estimador es consistente, se vuelve más confiable tomando
muestras grandes. De esta manera, cuando usted se preocupa poraumentar el tamaño de la muestra para obtener más información acerca deun parámetro de la población, debe primero encontrar si su estadígrafo esun estimador consistente, si no es así, usted desperdiciará dinero y tiempoal tomar muestras grandes.
5.1.4. Suficiencia:
Estadísticos que, de alguna manera, resumen toda la información de una muestrarelacionada con un parámetro objetivo, se dice que tienen la propiedad de
suficiencia, es decir, utilizan toda la información relevante contenida en unamuestra.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
36/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
36
Ejercicios propuestos
En cierta cadena de centros comerciales trabajan 150 personas en eldepartamento de personal, 450 en el departamento de ventas, 200 en el de
contabilidad y 100 en el de servicios al cliente. Con el objeto de realizar unaencuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. Quénúmero de trabajadores tendríamos que seleccionar en cada departamentoatendiendo a un criterio de proporcionalidad
R/ta: 30, 90, 40, 20
Suponga que se quiere estimar el número de días-hombre perdidos debidoa accidentes de trabajo en un mes particular. Además se sabe que la mayorparte de dichos accidentes se presentan en los niveles operativo, técnico y
administrativo. ¿Cuál de los siguientes diseños de muestreo es el másaconsejable?:
R/ta: Estratificado, identificando como estrato los niveles de trabajo
Supongamos que en la ciudad “T” hay 200 barrios. Si elegimos al azar dosde estos barrios, de manera que la muestra esté compuesta por todoslos individuos de esos dos barrios. Se trata de de:
R/ta: Por conglomerados
Se ha proyectado realizar una encuesta sobre el consumo de leche enlas familias. El número de familias de la población es 6000 y el tamaño dela muestra 840, con la siguiente clasificación de profesión u oficio:
Profesionales: 100 Comerciantes: 200Operarios: 2000 Agricultores: 600Servicios 1900 Empleados: 1200
Cuántas familias de agricultores deben estar representadas en la muestra.R/ta: 84
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
37/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
37
CAPITULO DOS: DISTRIBUCIONES MUESTRALES
Introducción
Como se ha señalado anteriormente, el propósito del muestreo es averiguar lascaracterísticas de la población en estudio. Se recuerda de nuevo que parapoder dar conclusiones de los parámetros se usan los estadísticos que sonmediciones obtenidas en la muestra, mientras que los parámetros soncaracterísticas medibles propias de la población.
El escoger una muestra, es un proceso que inevitablemente puede arrojardiferentes subconjuntos de la población, por ejemplo de la población de tutores,se puede escoger como muestra los tutores de la ECBTI o escoger los deECEDU. El valor del estadístico es aleatorio porque depende de los elementoselegidos en la muestra seleccionada- también aleatoria- de tamaño “n” y, por lotanto, el estadístico tiene una distribución de probabilidad la cual es llamada laDistribución Muestral del estadístico.
Objetivo general
Que los estudiantes lleguen a formar, no sólo, una muestra si no un conjunto deposibles muestras de una población, con las unidades de observación y seancapaces de reconocer la distribución de ese conjunto de muestras.
Objetivos especí f icos
Comprender la importancia del teorema del límite central.
Establecer las diferencias entre un parámetro y un estadístico
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
38/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
38
Lección No 6: Distribuciones Muestrales
En estadística, la distribución muestral es lo que resulta de considerar todas lasmuestras posibles que pueden ser tomadas de una población. Su estudio permite
calcular la probabilidad que se tiene, dada una sola muestra, de acercarse alparámetro de la población. Mediante la distribución muestral se puede estimar elerror para un tamaño de muestra dado.
Como bien lo afirma Ximenez, C. (S, F.) “La estadística inferencial trata sobre las
inferencias con respecto a las poblaciones (sus parámetros µ y σ 2 ) a partir de la
información contenida en las muestras (los estadísticos ̅ y S2 ).Para poder llevar a cabo esas inferencias es necesario conocer la relación que se
establece entre estadísticos y parámetros. El concepto que permite poner en
relación ambas cosas es “la distribución muestral de un estadístico”.
Figura 6. Distribución de un estadístico Algunos estadísticos pueden ser: La media, la proporción y la desviación.Recuerde que todos son cálculos en las muestras.
A cada una de las muestras se les calcula el respectivo estadístico, es decir, setendrá tantos estadísticos como muestras se haya obtenido. Por ejemplo, si el
estadístico que se está estimando es la media, y si se obtuvo 8 muestras,entonces, serán 8 medias muestrales las que tendrá.
Con todos los resultados del estadístico en todas las muestras, se forma ladistribución muestral del estadístico.
Distribución Muestral: Es la distribución de Probabilidad de un estadístico
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
39/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
39
6. Diferentes distribuciones muestrales
Ya que a nivel muestral se pueden calcular diferentes estadísticos, como lamedia, desviación y la proporción entre otros, se pueden encontrar susrespectivas distribuciones muestrales, entre estas:
Distribución muestral de la medias Distribución muestral de las proporciones
Distribución muestral de la diferencias de medias
Distribución muestral de la diferencias de proporciones
Nota: El muestreo se puede hacer sin o con reemplazamiento.
Ejemplo
En la figura a continuación se tiene que la variable X, es el número de párrafos
digitado por minuto, X: 1, 2, 3, 4.
Figura 7. Distribución de la población
Poblacionalmente se tiene:Parámetros
E(X)= 2.5Var (X)= 1.1180
E(x) es el valor esperado de la variable o promedio, y V(x) es la varianza.
∑
∑ ̅ Se sugiere al lector comprobar los cálculos para la varianza con el comandoVAR.P en Excel.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
40/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
40
Ejemplo
Si se quiere escoger una muestra de tamaño 3, es decir compuesta por 3personas y si además las muestras se toman con reposición es decir se puedevolver a incluir el individuo. La distribución muestral será:
Gráfico No.2. Histograma de medias muestrales
El 1,00 que se observa corresponde a la media de la muestra conformada por lasobservaciones 1, 1, 1; es decir se tomo una muestra de tres personas pero al sercon reposición, el primer elemento que se obtuvo fue 1, éste se devuelve lapoblación y tiene de nuevo la posibilidad de ser escogido, que es lo que vuelve asuceder, del mismo modo en la tercera extracción. El valor 1,33 es la media deuna muestra que puede ser por ejemplo las observaciones 1, 1, 2. El total de
muestras es 24 conformadas por 3 personas, ya que se aplica el principio de laspermutaciones.
Lección No 7: Distribución Muestral de la Media y de laProporción
Los estadísticos obtenidos en una muestra son variables aleatorias, por lo cualdeben tener una distribución de probabilidad, así que la media muestral tiene una
distribución.
Supongamos que se tiene una muestra de tamaño “n” observaciones tomada deuna población normal N (µ; σ2) cada observación X1= 1, 2, 3,…, n tendrá lamisma distribución que la población de donde fue tomada la muestra.
0
2
4
6
8
10
12
14
1,00 1,33 1,67 2,00 2,33 2,67 3,00 3,33 3,67 4,00
Distribución de frecuencias de mediasmuestrales
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
41/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
41
7. Principios y conceptos en la medias muestrales
Teorema: (Población infinita)-------------------------------------------------------------------------------------------------------
Sea la media de la muestra aleatoria de tamaño nproveniente de una población infinita de tamaño N con media µ y varianza σ2.
Entonces:̅ El valor esperado de la media muestral es la media poblacional
La varianza del estimador es igual a la varianza poblacional dividida por el tamañode la muestra.
Teorema: (Población Finita)-------------------------------------------------------------------------------------------------------
Sea la media de la muestra aleatoria de tamaño nproveniente de una población finita de tamaño N con media µ y varianza σ2.Entonces:̅ Comentario: Se conoce como el factor de corrección para poblaciones finitas. Cuando N esmuy grande comparado con n, la diferencia se hace despreciable lo que originaque para poblaciones infinitas dicho factor de corrección se hace uno.
7.1. Distribución Muestral de la Media
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño ytomadas de la misma población tenga la misma media muestral o que seancompletamente parecidas; puede esperarse que cualquier estadístico, como lamedia muestral, calculado a partir de las medias en una muestra aleatoria, cambie
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
42/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
42
su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todoslos valores posibles de un estadístico. Tales distribuciones serán muy importantes enel estudio de la estadística inferencial, porque las inferencias sobre las poblacionesse harán usando estadísticas muestrales. Como el análisis de las distribucionesasociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de unestadístico muestral como un instrumento para hacer inferencias sobre un parámetro
poblacional desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria aotra, se le puede considerar como una variable aleatoria con su correspondientedistribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribuciónmuestral. En general, la distribución muestral de un estadístico es la de todos susvalores posibles calculados a partir de muestras del mismo tamaño.
Figura 8. Distribución muestral de medias
Ejemplo Construcción de la distribución de las medias muestrales.
Un Colegio tiene siete profesores, la retribución por hora cátedra es la que semuestra a continuación:
Tabla 5:Tabla No. Salario profesores
Profesor Salario $1234567
7000700080008000700080009000
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
43/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
43
Para determinar la distribución muestral de las medias, se seleccionaron todaslas muestras posibles de tamaño 2, sabiendo que son sin sustitución y queno interesa el orden de selección en la población. Se calculan las medias decada muestra y se calcula la media de las medias muestrales.
Para saber cuántas muestras posibles se pueden tomar, se utiliza la combinatoria,por los preceptos tomados: Sin repetición y no importa el orden
El valor de 21, es el número de muestras tamaño 2 que se pueden formar deuna población de 7 elementos. A continuación se indican las 21 muestras posiblesy el valor de la media para cada una de las muestras:
72 =7!
(7 2)! 2! =
7!
(5)! 2! =
5! × 6 × 7
5!2! =
42
2! =
42
2 = 21
Paso 1: Media de la población
9 Paso 2: Varianza de dicha población.
9 99
∑
La varianza poblacional está dada por:
Entonces:
Otra formulación es:
Recuerde que la desviación es la raiz cuadrada de la varianza, entonces la
desviavión en este caso es 99 699 Paso 3: Distribución muestral de las medias
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
44/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
44
Tabla 6:
Distribución salarios de profesores. Muestreo sin reemplazamiento y las medias Muestra Prof. Salario Media Muestra Prof. Salario Media
1 1 y 2 7000-7000 7000 12 3 y 4 8000-8000 8000
2 1 y 3 7000-8000 7500 13 3 y 5 8000-7000 7500
3 1 y 4 7000-8000 7500 14 3 y 6 8000-8000 8000
4 1 y 5 7000-7000 7000 15 3 y 7 8000-9000 8500
5 1 y 6 7000-8000 7500 16 4 y 5 8000-7000 7500
6 1 y 7 7000-9000 8000 17 4 y 6 8000-8000 8000
7 2 y 3 7000-8000 7500 18 4 y 7 8000-9000 8500
8 2 y 4 7000-8000 7500 19 5 y 6 7000-8000 7500
9 2 y 5 7000-7000 7000 20 5 y 7 7000-9000 8000
10 2 y 6 7000-8000 7500 21 6 y 7 8000-9000 8500
11 2 y 7 7000-9000 8000
Suma Total 162.000
En el cuadro siguiente se indica la distribución de probabilidad para elmuestreo de medias, donde la sumatoria de todas las probabilidades es iguala uno:
Tabla 7:Distribución de probabilidad
Media muestral Número de medias Probabilidad
7000 3 0,1429
7500 9 0,4285
8000 6 0,2857
8500 3 0,1429
Suma 21 1,000
Gráfico No.3. Histograma de medias muestrales salario de los profesores
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
45/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
45
La media poblacional es igual a la media de las medias muestrales
La media de la distribución muestral de medias, se determina sumando lasdiferentes medias muestrales y dividiendo la suma entre el número de muestras.
La media de todas las medias muestrales en general se expresa:
̅ ̅ Ecuación No.2
Primero se obtiene todas las muestras (todos los subconjuntos) y luego a cadamuestra le calcula la media, finalmente obtendrá, tantas medias como muestrashaya, y con esas medias calcula de nuevo un promedio; es decir, se calcula una
media de medias. ̅ 6 Vea el valor obtenido en el paso 1 (Media poblacional) y compárelo con elresultado anterior ¡Son equivalentes! Note que: ̅ es la media de las medias muestrales y es la media poblacional.
Por tanto para nuestro caso:
Paso 4: Media de la distribución muestral de medias
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
46/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
46
Paso 5: Construcción de distribución de errores muestrales
̅
Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, lamedia poblacional , entonces la media muestral, como medida, conlleva algúnerror. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria detamaño 25 de una población con media ; si la media de la muestra es ̅ , entonces a la diferencia observada ̅ se le denominael error muestral . Una media muestral x puede pensarse como la suma de doscantidades: la media poblacional y el error muestral; si e denota el errormuestral, entonces:
Ecuación No.3
Al calcular la media y desviación estándar de los errores muestrales “e” (últimacolumna de la tabla 7) se tiene respectivamente:
Se deja como ejercicio al lector calcular y
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
47/113
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
48/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
48
Muestreo con reemp lazo
Si de una población se eligen muestras de tamaño n conreemplazo (o la población es No finita), entonces el error estándar
de la media es igual a la desviación estándar de la distribución delos errores muestrales.
En general se tiene: ̅ Ecuación No.4
Muestreo sin reemp lazo
Cuando las muestras se toman de una población pequeña y sin
reemplazo se puede usar la siguiente fórmula para encontrar ̅: ̅ √
Ecuación No.5
Error estándar del estadístico
La desviación estándar de la distribución muestral de un estadístico se conocecomo er ro r es tándar del es tadíst ic o . Para el ejercicio anterior el error estándarde la media denotado por ̅, es 451,75.
Aunque, se puede notar que en este caso la desviación de los erroresmuestrales y el error estándar, son iguales.
̅,
: Es llamado factor de corrección para poblaciones finitas, o en dondese muestrea sin reemplazo.
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
49/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
49
Más adelante se verá que, estas dos concepciones hacen parte de los principiosdel teorema del límite central. Para lo cual se desarrollan dos ejemplos, uno demuestreo con reemplazamiento y otro sin reemplazamiento.
El siguiente es un diagrama de flujo que le permite identificar en que caso debe
usar o no el factor de corrección.
Gráfico No.4. Diagrama de flujo para error estándar de la media
Teorema central del límite.
En el caso de una población con media y varianza 2 , la distribución muestralde medias de todas las muestras posibles de tamaño n a partir de la población,tendrá una distribución aproximadamente normal (siendo la media de la
distribución muestral igual a y la varianza igual a n/2 ) considerando que eltamaño de la muestra es bastante grande.
El teorema central del límite es uno de los teoremas más importantes dentro de
¿Es la población
infinita?
COMIENZO
¿Se muestrea
con sustitución?
¿Es N≥ 20n?
̅ √
̅ si
si
si
No
No
8/16/2019 Modulo 100403 Vol 1 Inferencia Estadistica
50/113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 –INFERENCIA ESTADISTICA
50
las ciencias estadísticas, ya que su funcionalidad es muy grande.
Hay que destacar tres aspectos importantes del teorema central de límite.
Primer principio:
Si el tamaño de la muestra n es suficientemente grande, la distribución muestralde las medias será más o menos normal. Esto se cumple ya sea que la poblaciónesté o no distribuida normalmente. Esto es, el teorema se verifica, ya sea que lapoblación esté distribuida en forma normal, o bien sea sesgada o uniforme.
Segundo principio:Como se mostró con anterioridad, la media de la población, , y la media de todas
las medias muestrales posibles, x , son iguales. Si la población es grande y se
selecciona un número grande de muestras de la población, la media de las medias
muestrales se aproximará a la media poblacional.
Tercer principio:
La varianza de la distribución de medias muestrales se determina de n/2 .No existe acuerdo general sobre lo que constituye un tamaño de muestra“suficientemente grande”. Algunos estadísticos consideran que es 30; otrospiensan que un número pequeño como 12 es adecuado. El ejemplo sobre lossalarios por hora de todos los profesores del colegio funcionó bastante bien conuna muestra de 2. Sin embargo, a menos que la población sea aproximadamente
normal, los tamaños de muestra así de pequeños, por lo general no dan comoresultado una distribución muestral que se distribuya normalmente. A medida queel tamaño de la muestra se vuelve cada vez más grande, la distribución de lamedia muestral se aproxima más a la distribución normal con forma de campana.
TEOREMA CENTRAL DEL LÍMITE:
Sea X1, X2,…, Xn un