Estadistica Descriptiva Material 2014 Pgqt

Embed Size (px)

Citation preview

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    1/173

    1

    PRESENTACIN

    La estadstica tiene su origen en la palabra Estado, pues este era el encargado de realizar lacuantificacin y anlisis de la riqueza que tenan, los cuales estaban en funcin a fineseconmicos y militares, expresados en recursos econmicos, infraestructura y sobre loscules tomaban decisiones.Actualmente la estadstica es una ciencia y ya no es reservada al estado pues estrelacionada y aplicada a prcticamente todas las dems ciencias. La razn es evidente, esnecesario recolectar informacin y analizarla y eso es justamente lo que hace la estadstica,proporciona tcnicas precisas de recoleccin de datos y proporciona mtodos especficospara el anlisis de los mismos , su utilidad la entendemos mejor si tenemos en cuenta quelos quehaceres y decisiones diarias embargan cierto grado de incertidumbre, esta cienciatrabaja con ella y nos orienta para tomar las decisiones con un determinado grado deconfianza, en este sentido la asignatura de Estadstica tiene la finalidad de incursionarlosdentro de esta ciencia como herramienta para la toma de decisiones en su desarrollo

    profesional.

    La asignatura est dividida en tres Unidades Didcticas: en la Primera Unidad Didcticaingresaremos a conocer a la Ciencia Estadstica tocando temas de Estadstica descriptivacomo conceptos bsicos, organizacin y presentacin de datos y medidas descriptivas. En laSegunda Unidad Didctica desarrollaremos los temas de Estadstica Inferencialempezaremos conociendo los mtodos de muestreo para realizar estimacin de parmetros ypruebas de hiptesis; y en la Tercera Unidad Didctica los Mtodos de Pronstico aplicandoanlisis de regresin y de correlacin. En la parte final se hace entrega del manual delprograma estadstico SPSS el cul se desarrollar en las clases de laboratorio pero esnecesario que le dediquemos algunas horas adicionales en casa para poder reforzar suaplicacin. Del mismo modo se presenta una gua rpida del Excel en comandos estadsticos,sobre todo para la construccin de tableros de frecuencia y su representacin, para su

    posterior anlisis e interpretacin.

    Este material llega a sus manos con la intensin de guiarlos en su aprendizaje en estaasignatura, pero as mismo debe ser complementada con la bibliografa propuesta en elsilabo del curso.

    El Autor

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    2/173

    2

    UNIDAD DIDCTICA I

    EST DSTIC DESCRIPTV

    INTRODUCCIN

    En esta primera unidad para poder entender a la Ciencia Estadstica empezaremos por unade sus ramas principales como es la Estadstica Descriptiva.

    La Estadstica Descriptiva se ocupa, como su nombre lo indica, de describir las caractersticasde una muestra o de una poblacin a travs de recopilar, organizar, presentar y resumir datos que

    facilite la interpretacin y as extraer conclusiones de su comportamiento.En el Tema 01 iniciamos con conceptos bsicos para poder entendernos en un lenguaje

    comn; en el Tema 02 conoceremos los diferentes mtodos de organizacin y presentacin de datosmediante tablas de frecuencias y grficos estadsticos; para el Tema 03 aplicaremos medidasdescriptivas que nos permitan resumir un conjunto de datos.

    APRENDIZAJES ESPERADOS

    Conoce y aplica eficientemente mtodos y tcnicas de estadstica descriptiva como herramientaspara la toma de decisiones y valora reflexivamente su importancia en su quehacer profesional.

    CONTENIDOS

    Tema 1:Introduccin a la estadsticaTema 2: Organizacin y presentacin de datosTema 3:Medidas descriptivas

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    3/173

    3

    TEMA 01

    1.1 INTRODUCCIN A LA ESTADSTICA

    1.1.1 DEFINICIN

    El trmino estadstica se deriva de la palabra latina status, que significa estado. Los primerosusos de la estadstica tienen que ver con la recopilacin de datos y la elaboracin de grficaspara describir diversos aspectos de un estado o un pas. En 1662, Jhon Graunt publicinformacin estadstica acerca de los nacimientos y los decesos. Al trabajo de Graunt siguieronestudios de tasas de mortalidad y de enfermedad, tamao de poblaciones, ingresos y tasas dedesempleo. En la actualidad los hogares, gobiernos y empresas se apoyan en la estadstica paradirigir sus acciones.

    Para muchas personas, estadstica significa descripciones numricas. Lo anterior puedeverificarse fcilmente al escuchar, un domingo cualquiera, a un comentarista de televisin narrarun juego de ftbol. Sin embargo, en trminos ms precisos, la estadstica es el estudio de losfenmenos aleatorios.

    Uno de los aspectos ms importantes en estadstica es la posibilidad de obtener conclusionesbasadas en los datos observados. Este proceso se conoce como inferencia estadstica. Si unaconclusin obtenida para un indicador econmico importante, una posible concentracin decierto contaminante o si se pretende establecer una relacin entre la incidencia de cncerpulmonar y el fumar, es muy probable que dicha conclusin est basada en la inferenciaestadstica.

    1.1.2 RAMAS DE LA ESTADSTICA

    La estadstica se divide en dos ramas que no son independientes; por el contrario, soncomplementarias y entre ambas dan la suficiente ilustracin sobre una posible realidad futura,con el fin de que quien tenga poder de decisin, tome las medidas necesarias para transformarese futuro o para mantener las condiciones existentes.En atencin a su metodologa, por sus procedimientos y alcances bien definidos, la cienciaestadstica se clasifica en:

    1.1.2.1 ESTADSTICA DESCRIPTIVA O DEDUCTIVA:

    Son mtodos y tcnicas de recoleccin,caracterizacin, resumen y presentacin que permitedescribir apropiadamente las caractersticas de unconjunto de datos.

    Comprende el uso de grficos, tablas,diagramas y criterios para el anlisis.

    Existen diversos tipos de grficos adecuadosa los distintos datos que se desean representar.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    4/173

    4

    1.1.2.2 ESTADSTICA INFERENCIAL O INDUCTIVA Son mtodos y tcnicas que hacen posibleestimar una o ms caractersticas de unapoblacin o tomar decisiones referentes a lapoblacin basados en el resultado de muestraselegidas adecuadamente. Estas conclusiones no tienen que sertotalmente vlidas, pueden tener cierto margende error, por eso se dan con unamedida de confiabilidad o probabilidad.

    1.1.3 OBJETIVOS

    Los objetivos de la estadstica pueden ser clasificados en tres grandes captulos: descripcin,anlisis y prediccin.1.1.3.1 Descripcin de grandes colecciones de datos empricosreducindolos a un pequeo

    nmero de caractersticas que concentra la parte ms importante y significativa de la

    informacin proporcionada por los datos.La descripcin supone que los datos que vienen expresados en su forma natural debenser clasificados y presentados sistemticamente en cuadros o tablas como una pequeareduccin de datos, esto se obtiene cuando el comportamiento y caractersticas de losdatos se expresan por un conjunto de indicadores, medidas de resumen o estadgrafos.La estadstica se inicia estudiando el problema, puesto que es un trabajo preliminar decasi todas las investigaciones estadsticas; de este modo tanto como la reduccin comola descripcin de la informacin se estudia en la Estadstica Descriptiva.Es importante anotar que la descripcin estadstica de los fenmenos o hechos es elprimer aspecto al cual se redujo la ciencia estadstica durante mucho tiempo,aplicndose especialmente a los datos demogrficos, sociales econmicos, etc.

    1.1.3.2 Anlisis estadstico de datos experimentalesy de los fenmenos observados, toda la

    investigacin estadstica incluye un problema de anlisis, con el objeto de formarse unconcepto de la poblacin o universo y adoptar decisiones; en este caso no es necesarioobservar toda a una poblacin sino que ser suficiente elegir una muestrarepresentativa. La preocupacin del anlisis estadstico es inferir propiedades para unapoblacin sobre la base de resultados muestrales conocidos. Aqu se presenta variosproblemas que presentan la Estadstica, la estimacin estadstica, el clculo deprobabilidades, las pruebas estadsticas, etc. stos son aspectos que correspondeesencialmente a la Inferencia Estadstica.Todo anlisis debe suponer la eleccin adecuada de una muestra representativa, la queser estudiada en detalle para obtener conclusiones o resultados, que dentro de ciertosmrgenes de aceptacin sean vlidas a toda la poblacin de la cual fue elegida lamuestra.

    1.1.3.3 Prediccin o comportamiento de los fenmenos en el futuro, lo cual constituye lamxima aspiracin prctica de toda ciencia. Este objetivo de prediccin y previsin estimplcito tanto en la descripcin como en el anlisis estadstico, puesto que en generalinteresa orientar la toma de decisiones con vigencia y afecto en el futuro.Naturalmente que las estimaciones y proyecciones dependen del grado de conocimientodel comportamiento del pasado y presente de las variables en estudio.Para concretar estos objetivos, la Estadstica se vale por una parte del censo, querecopila datos del todo, analiza la distribucin y variacin de las caractersticas de loselementos que componen una poblacin claramente definida; por otra parte delmuestreo, que permite estimar o inferir caractersticas de un todo considerando unaparte representativa. Basndose en el anlisis de experiencias y evaluaciones pasadas yactuales, hace estimaciones de fenmenos y caractersticas para un futuro, proponevalores esperados. La estadstica tambin se vale de una serie de artificios matemticos

    y del clculo de probabilidades, para definir sobre la validez de supuestos, construirmodelos y mtodos estadsticos.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    5/173

    5

    1.1.4 CONCEPTOS BSICOS

    1.1.4.1 POBLACINEs el conjunto mayor o coleccin completa de todos los elementos (puntajes. personas,mediciones, etc.) que posee al menos una caracterstica comn observable, cuyo estudio

    nos interesa o acerca de los cuales se desea informacin.La poblacin debe estar perfectamente definida en el tiempoy en el espacio, de modo queante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o node la poblacin bajo estudio. Por lo tanto, al definir una poblacin, se debe cuidar que elconjunto de elementos que la integran quede perfectamente delimitado.

    La poblacin puede ser segn su tamao de dos tipos:

    a. Poblacin finita:cuando se tiene un nmero determinado de elementos.b. Poblacin infinita:cuando el nmero de elementos es indeterminado, o tan grande que

    pudiesen considerarse infinitos.

    Tamao de la Poblacin:Es el nmero total de elementos que tiene la poblacin estudiada y

    se denota con la letra N

    1.1.4.2 MUESTRAEs un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiarlas propiedades de la poblacin de la cual es obtenida.Una muestra debe ser representativa, esto es, guarda las mismas caractersticas de lapoblacin de donde fue seleccionada y debe ser adecuada en cuanto a la cantidad deelementos que debe tener con respecto a la poblacin.Existen diversos mtodos para calcular el tamao de la muestra y tambin para seleccionarlos elementos que la conforman, pero es importante que sea representativa de la poblaciny sus elementos escogidos al azar para asegurar la objetividad de la investigacin.

    Tamao de muestra:El nmero de elementos de la muestra se denota con letra n.

    1.1.4.3 PARMETROS ESTADSTICOSEs un nmero que describe alguna caracterstica de la poblacin o medida de resumen deuna poblacin. Se considera como un valor verdadero de la caracterstica estudiada ypara determinar su valor es necesario utilizar la informacin poblacional completa, y por lotanto la decisin se toman con certidumbre total.

    1.1.4.4 ESTADGRAFO O ESTADSTICO

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    6/173

    6

    Es un nmero que describe alguna caracterstica de la muestra o medida de resumen deuna muestra y la toma de decisin contiene un grado de incertidumbre.

    1.1.4.5 DATOEs el valor, respuesta o registro que adquiere una caracterstica o variable asociado a unelemento de la poblacin o muestra, como resultado de la observacin, entrevista orecopilacin en general. Puede ser un nmero, una palabra o un smbolo.

    1.1.4.6 VARIABLEEs una caracterstica estudiada de las unidades estadsticas. Podemos mencionar lossiguientes tipos:

    a. Segn la Naturaleza de la Variable

    a.1 Variables Cualitativas o Estadsticas de AtributosCuando expresan una cualidad, caracterstica o atributo, sus datos se expresanmediante una palabra, no es numrico. Por ejemplo: estado civil, los colores, lugarde nacimiento, profesiones, actividad econmica, causas de accidentes, etc.

    a.2 Variables CuantitativasCuando el valor de la variable se expresa por una cantidad. El dato o valor puederesultar de la operacin de contar o medir; por ejemplo: edad, nmero de hijos porfamilia, ingresos, viviendas por centro poblado, niveles de desempleo, produccin,utilidades de empresas, etc.

    Las variables cuantitativas pueden ser: Discreta y Continua.

    a.1.1 Variable DiscretaCuando el valor de la variable resulta de la operacin de contar, su valor estrepresentado slo por nmeros naturales (enteros positivos); Ejemplos: hijos porfamilia, nmero de accidentes por da, trabajadores por empresa, poblacin por

    distritos, habitaciones por vivienda, etc.a.1.2 Variable Continua

    Cuando la variable es susceptible de medirse, es toda variable cuyo valor seobtiene por medicin o comparacin con una unidad o patrn de medida. Lasvariables continuas pueden tener cualquier valor dentro de su rango o recorrido,por tanto se expresa por cualquier nmero real; Ejemplos: rea de parcelas,ingresos monetarios, produccin de maz, peso, tiempo de servicios, horastrabajadas, niveles de empleo, etc.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    7/173

    7

    b. Segn la Escala de MedicinLa medicin de una variable consiste en asignar un valor a la caractersticaobservada.

    Por ejemplo, si la caracterstica observada es el gnero de las personas, alclasificar a una persona como de sexo femenino, le asignamos un valor, y

    hacemos una medicin de la caracterstica.

    El proceso de medicin utiliza diversas escalas: nominal, ordinal, intervalo y razn

    El cuadro siguiente resme las caractersticas de los niveles de medicin:

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    8/173

    8

    Ejemplo: El diario nacional La Voz tiene 600 empleados, de los cuales el 35% son mujeres. Se realiza un

    estudio a 100 de estos empleados. Se encontr que la edad promedio en el grupo analizado esde 35 aos, que el 25% han estudiado en provincias, que 60 de estos trabajadores tienen a loms 4 hijos y que 15 trabajadores ganan ms de $4000.

    a. Identifique la poblacin, muestra y unidad elemental.

    Poblacin:Muestra:Unidad de elemental o unidad de anlisis:

    Informacin

    b. Qu variables se estudian indique adems el tipo y escala de medicin?

    Variable Tipo EscalaEdad

    Lugar de estudioNmero de hijos por empleado

    Sueldo

    c. Cules son los estadsticos y parmetros?

    Estadstico Parmetro

    En cada uno de los siguientes casos determine usted si el resultado es: parmetro,observacin, variable, dato, informacin, estadstico o resultado de una inferencia estadstica.

    a. El gerente del diario nacional La Voz observ que el Sr. Juan Tenorio, uno de los 600empleados elegidos al azar, es casado, tiene 3 hijos, cuenta con grado de instruccinsuperior y su ingreso mensual es de $1 500.

    b.Grado de instruccin Superior

    c. 60 de estos trabajadores tienen a lo ms 4 hijos y que 15 trabajadores ganan ms de$4000

    Ejemplo:

    La gerencia de relaciones pblicas de la empresa distribuidora de agua potable harealizado una campaa para promover el ahorro del agua potable de los hogares de LimaMetropolitana y mejorar as la imagen de la empresa. Para determinar si la campaa ha dadoresultado, se realiz una encuesta a una muestra de hogares de Lima Metropolitanaobtenindose la siguiente informacin:

    El consumo promedio mensual de agua potable por hogar es de 12,5 m3El 20% de los encuestados opina que la calidad de servicio que brinda la empresadistribuidora de agua potable es deficiente.El nmero promedio de personas por vivienda en Lima Metropolitana es de 4,6

    Del enunciado anterior identifique: poblacin, muestra, unidad elemental y tres variables en

    estudio con su respectivo tipo.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    9/173

    9

    Poblacin

    Muestra

    Unidadelemental

    ACTIVIDAD N1Presente de manera formal los siguiente:

    PRIMERA PARTE: EJERCICIOS1. Mediante un organizador de conocimientos resuma el contenido tratado en el Tema 01.2. Los clientes que se suscriben al diario local La Vozdeben llenar un formato con

    informacin personal. Algunos de los datos solicitados se presentan a continuacin.Clasifique cada una de ellos indicando el tipo de variable y su respectiva escala de medicin.

    Profesin Centro de labores Direccin Estado civil

    Nacionalidad Nmero de hijos Fecha de nacimiento Edad

    Ingreso mensualfamiliar

    Grado deinstruccin

    Nmero de telfono Nmero de DNI

    3. Clasifique las siguientes variables en cualitativas o cuantitativas (continua o discreta):

    a. Tiempo de servicio de los empleados de un medio de comunicacin.b. Nivel educacional y religin de los empleados de un medio de comunicacin.c. Lugar de nacimiento de una persona de los empleados de un medio de comunicacin.d. Orden de llegada de los reporteros a una entrevista.e. Nmero de diarios defectuosos que salen de la lnea de produccin del diario Informa.

    f. Ingreso mensual de los trabajadores de una empresa publicitaria.4. Se quiere hacer un estudio sobre las caractersticas ms importantes que debe tener una

    pagina Web de un diario local.

    a. Defina el objetivo del estudio, la poblacin objetivo, la unidad elemental, la unidad demuestreo y el marco muestral del estudio.

    b. Elabore un cuestionario que podra ser utilizado en el estudio, precisando para cada unade ellas el tipo de variable y escala de medicin.

    5. Analistas y Consultores realiz un estudio de mercado en el distrito de El Tambo con lafinalidad de analizar las posibilidades de instalar cabinas de Internet en la zona. Seleccionuna muestra de 200 hogares, encuestndoles sobre lo siguiente:

    a. Ingreso familiarb. Nmero de miembros de la familiac. Grado de instruccin del jefe de la familiad. Si tienen Internet en el hogar.

    Del estudio de la muestra se encontr que el promedio del ingreso familiar es de 2500 soles,el 30 % de hogares tienen Internet. Responda lo siguiente:

    a. Indique cul es la poblacin de estudio?b. Quienes constituyen la muestra?c. Cul es un estadstico?

    d. Qu variables se estn analizando? de qu tipo son?

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    10/173

    10

    6. Un diario local desea analizar qu tanta gente que adquiere el diario, estara interesada porque se ofrezcan recetas de comidas tpicas de diferentes regiones del pas. Para ello de untotal de 2000 personas suscritas al diario, de las cuales el 70% son hombres. Se seleccionaaleatoriamente a 300 de las personas suscritas y se les consulta al respecto. Se encontrque al 60% tiene mucho inters en recetas de comida tpica, 5 personas tienen surestaurante, la edad promedio de las personas entrevistadas es de 30 aos, 10 de ellas

    proceden de la Selva.

    a. Identifique la poblacin, muestra y unidad elemental.b. Indique qu variables se estn estudiando. Adems, escriba el tipo de variable y la escala

    en que est medida.c. Cules son los estadsticos y parmetros?d. Qu datos se estn mencionando?

    SEGUNDA PARTE: PROPUESTA DE INVESTIGACINPresente en una hoja su propuesta de investigacin mencionando de acuerdo a lo explicado:

    a. Fundamentob. Planteamientoc. Ttulo

    d. Objetivos: 01 general y 03 especficos.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    11/173

    11

    TEMA 02

    1.2 ORGANIZACIN Y PRESENTACIN DE DATOS

    La siguiente fase a la recoleccin de datos es la crtica de campo, lo que significa realizar lavalidacin y consistencia de los datos obtenidos durante el trabajo de campo, con la finalidad que enla fase de Organizacin y Clasificacin de los Datos sea consistente y veraz los datos aprocesarse, analizarse y con la cual se va tomar decisiones.

    1.2.1 CONCEPTOS BSICOS

    Para iniciar la organizacin de datos definiremos algunos conceptos:

    1.2.1.1 ClaseEs una divisin de la variable. Se denota como subndice con la letra i y el nmero total declases con m.

    1.2.1.2 FrecuenciaEs las veces que se repite una clase de la variable. stas son: Simples y Acumuladas

    a. Frecuencia Simple: Es aquella frecuencia que slo correspondes a una clase de lavariable entre ellas tenemos:

    a.1 Frecuencia Absoluta SimpleLa frecuencia absoluta simple de la clase ci es el nmero fi, de observaciones quepresentan una modalidad perteneciente a esa clase.

    Adems se cumple que:

    nfm

    i

    i 1

    a.2 Frecuencia Relativa SimpleFrecuencia Relativa Simple de la clase c i es el cociente h i, entre las frecuenciasabsolutas de dicha clase y el nmero total de observaciones, es decir:

    Obsrvese que f i es el tanto por uno de observaciones que estn en la clase c i.

    Tambin cumple:

    1

    1

    m

    i

    ih

    a.3Frecuencia Porcentual Simple

    Frecuencia Porcentual Simple de la clase cies el producto de p i, entre las frecuenciasrelativas de dicha clase por 100, es decir

    Cumple lo siguiente:

    1001

    m

    i

    ip

    b. Frecuencias Acumuladas: Aquellas frecuencias que se obtienen por la suma de dos oms clases de la variable

    b.1Frecuencia Absoluta Acumulada

    Fi, se calcula sobre variables cuantitativas, y es el nmero de elementos de lapoblacin cuya modalidad es inferior o equivalente a la modalidad c i:

    n

    fihi

    100*ii hp

    i

    1k

    ki21 ff....ffFi

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    12/173

    12

    b.2 Frecuencia Relativa AcumuladaHi, se calcula sobre variables cuantitativas, siendo el tanto por uno de los elementosde la poblacin que estn en alguna de las clases y que presentan una modalidadinferior o igual a la c i, es decir:

    b.3 Frecuencia Porcentual AcumuladaPi, se calcula sobre variables cuantitativas, siendo el tanto por ciento de los elementosde la poblacin que estn en alguna de las clases y que presentan una modalidadinferior o igual a la c i, es decir :

    1.2.2 Distribucin de FrecuenciasLlamaremos distribucin de frecuencias o tabla de frecuencias al arreglo de filas ycolumnas que contiene al conjunto de clases junto a las frecuencias correspondientes a cadauna de ellas. Una tabla estadsticasirve para clasificar y ordenar los datos estadsticos.

    1.2.2.1 Tablas Univariantes o unidimensionalesSe denomina as a las tablas de frecuencias que presentan informacin de una solavariable. Sus formas generales son las siguientes:

    a. Variable cualitativa

    CLASE fi hi pi

    X1 f1 h1=f1/n p1=h1*100

    X2 f2 h2=f2/n p2=h2*100

    .. . . .

    . . . .

    Xm fm hm=fm/n pm=hm*100

    Total N 1 100

    b. Variable cuantitativa

    b.1Cuantitativa DiscretaSi los datos son discretos y no hay mucha variabilidad se presentarn directamentecada valor de la variable y sus respectivas frecuencias. El procedimiento ms simplees listar los ndatos en forma ascendente y luego elaborar la tabla de distribucin defrecuencias indicando para cada valor de la variable su respectiva frecuencia con laque aparece en la serie.

    CLASE fi Fi hi Hi pi Pi

    X1 f1 F1= f1 h1=f1/n H1= h1 p1 P1= p1X2 f2 F2= F1+ f2 h2=f2/n H2= H1+ h2 p2 P2= P1+ p2X3 f3 F3= F2+ f3 h3=f3/n H3= H2+ h3 p3 P3= P2+ p3

    . . .

    . . . .Xm fm Fm = n hm=fm/n Hm= 1 Pm Pm= 100

    Total N 1 100

    i

    kki

    i

    i hhhh

    n

    FH

    121

    ...

    i

    k

    kiii ppppHP1

    21 ...100*

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    13/173

    13

    b.2 Cuantitativa Continua

    Para agrupar ndatos de una muestra, los pasos son los siguientes:

    1. Determine el rango R:R = Xmx - Xmn

    2. Determine el nmero de intervalos k: Tome alguna de las siguiente recomendaciones:

    - El valor kdebe ser mayor que 5 y no mayor que 20.Regla de Sturges: k = 1 + 3,322 log n.

    - Regla de la raz cuadrada: nk .- Regla de la potencia de 2: kes el menor valor entero tal que 2k> n.

    Siempre es un nmero entero. Si la estimacin tiene decimales, se toma el enteroms prximo.

    3. Calcule el ancho o amplitud de intervalo w:w = R / k

    Se redondea al nmero inmediato superior de acuerdo a la cantidad de decimalesque tienen los datos o segn la precisin con que se desea trabajar. Puede haber intervalos con distinta amplitud. Puede haber intervalos con amplitud indefinida (intervalos abiertos).

    4. Determine los lmites de cada intervalo. Partiendo del dato de menor valor Xmin se determinan cada uno de los lmites de

    intervalos sumando la amplitud de clase a cada valor obtenido. Si los datos con cuantitativos continuos, el lmite superior de un intervalo es el lmite

    inferior del siguiente intervalo. Se considera que el intervalo es abierto en el lmiteinferior y cerrado en el lmite superior, con excepcin en el primer intervalo en el quelos dos lmites son cerrados.

    Si los datos son cuantitativos discretos se cumple el punto anterior, pero tambin se

    puede tomar todos los lmites de intervalos cerrados si el valor del lmite superior deun intervalo es una unidad menor que el lmite inferior del siguiente intervalo.

    5. Calcule la marca de clase o centro de clase X: Punto medio de cada clase. Es la semisuma de los lmites de cada clase.

    Representa a todos los datos que estn contenidos en una clase,

    6. Construya la tabla de distribucin de frecuencias realizando la agrupacin y conteode los datos segn la clase a la que corresponda.

    [yi-1 yi> xi fi Fi hi Hi pi Pi

    Mn Mn +aX1= Mn + Mn+a

    2f1 F1 = f1 h1=f1/n H1= h1 p1 P1= p1

    Mn+a Mn+2aX2= Mn +a+ Mn+2a

    2f2 F2= f1+ f2 h2=f2/n H2= h1+ h2 p2

    P2= p1+p2

    Mn+2a Mn+3aX3= Mn +2a+ Mn+3a

    2f3 F3 h3=f3/n H3 p3 P3

    . . . . . . . .

    . . . . . . . .

    Mn+ka MxXm= Mn +ka+ Mx

    2fm Fm= n hm Hm= 1 pm Pm= 100

    Total n 1 100

    Ejemplo: Los datos en el cuadro Interrupciones corresponden al nmero deinterrupciones semanales en el sistema de red de una prestigiosa universidad

    registrado el ltimo ao. La tabla de distribucin de frecuencias para estos datos semuestra continuacin.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    14/173

    14

    INTERRUPCIONES4 0 0 0 3 0 1 2 2 5 0 0 0

    2 0 3 0 1 0 2 1 0 2 1 0 2

    0 3 0 1 1 1 3 3 0 0 1 2 21 1 0 0 0 1 4 1 0 1 1 3 1

    Luego de identificar los valores de la variable Nmero de interrupciones se harealizado el conteo de cada uno de dichos valores. Posteriormente se ha calculadola frecuencia relativa hi dividiendo cada fi entre n y finalmente multiplicando estevalor por 100 para obtener el pi%.El tablero de

    distribucin defrecuencias

    obtenido es:

    De donde podemos interpretar que es usual que se produzcan tres o menos interrupciones porsemana en el sistema de red de dicha universidad.

    Ejemplo: El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre losimpuestos que pagan los vecinos del distrito. La tabla en Excel muestra los pagos de impuestos,en nuevos soles de 48 viviendas elegidas al azar en el 2013.

    La tabla de frecuencias para la variablepago por impuestos municipales ao 2013 sera:

    Mximo 351,1

    Mnimo 145,1

    Rango 206

    Cantidad de datos (n) 48

    k (por regla de Sturges) 6,585

    k (entero) 7

    w (Amplitud) 29,42N. de decimales de los datos 1

    w (redondeada) 29,5

    Interrupciones f hi pi%

    0 20 0.3846 38.46

    1 15 0.2885 28.852 8 0.1538 15.38

    3 6 0.1154 11.54

    4 2 0.0385 3.85

    5 1 0.0192 1.92

    Total 52 1 100

    145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7

    151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6

    159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7

    195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    15/173

    15

    A continuacin la tabla de distribucin de frecuencias:

    Distribucin de frecuencias del pago de impuestos municipales del ao 2013

    Pago de impuestos Marca de clase fi hi Fi Hi[145,1 ; 174,6] 159,8

    3 0,0625 3 0,0625

    ]174,6 ; 204,1] 189,3

    3 0,0625 6 0,1250

    ]204,1 ; 233,6] 218,8

    10 0,2084 16 0,3334]233,6 ; 263,1] 248,3

    12 0,2500 28 0,5834

    ]263,1 ; 292,6] 277,8

    7 0,1458 35 0,7292]292,6 ; 322,1] 307,3

    7 0,1458 42 0,8750

    ]322,1 ; 351,6] 336,8

    6 0,1250 48 1,0000Total 48

    De donde podemos interpretar que:

    f2 = 3En tres viviendas pagaron ms de 174,60 nuevos soles y hasta de204,10 nuevos soles

    F2 = 6 En seis viviendas pagaron hasta 204,10 nuevos soles

    h3 = 0,2084El 20,84% de las viviendas pagaron ms de 204,10 nuevos soles y hasta233,6 nuevos soles

    H3 = 0,3334 El 33,34% de las viviendas pagaron hasta 233,60 nuevos soles

    EjercicioA continuacin, se muestra el tiempo de servicio, en meses, de los trabajadores del rea de serviciosde una gran empresa. Usando la regla de Sturges construya la tabla de distribucin de frecuencias,

    10 24 38 40 43 44 51 53 55 57

    16 25 39 40 43 46 51 53 55 57

    21 31 39 40 43 46 52 53 55 58

    21 31 40 43 44 47 53 54 55 62

    23 33 40 43 44 48 53 54 55 65

    Solucin

    Clculo de los lmites de los intervalos

    Mximo

    Mnimo

    Rango

    Cantidad de datos (n)

    k (por regla de Sturges)

    k (entero)

    w (Amplitud)

    N. de decimales de los datos

    w (redondeada)

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    16/173

    16

    Clculo de las frecuencias Seleccione el rango en el cual aparecern las frecuencias respectivas.

    Haga clic en el icono de Insertar funcin, seleccione Frecuencia y de Aceptar.

    En la ventana de Frecuencia, ingrese en Datos el rango de los datos que se desea contar. EnGrupos, ingrese el rango de celdas de los lmites superiores de los intervalos.

    Manteniendo presionado Ctrl + Shift, presione Enter, con lo cual aparecern las frecuenciasabsolutas.

    Calcule las dems frecuencias y las marcas de clase.

    Distribucin del tiempo de servicio de los trabajadores de la empresa ptima

    Tiempo de servicio Marca de clase fi hi Fi Hi

    Interprete:

    1.2.2.2 Tablas bivariantes o bidimensionales

    Se denominan as a las tablas que presentan informacin de dos variables en formaconjunta. Sus formas generales son las siguientes:

    Tablas bivariantes de frecuencias absolutas

    [yi-1 yi>

    [xi-1 xi>[y1 y2> [y2 y3> [y3 y4> [y4 y5>

    .....[yn-1 yn>

    fi.

    [x1 x2>f11 f12 f13 f14 f1n f1.

    [x2 x3>f21 f22 f23 f24 f2n f2.

    [x3 x4>f31 f32 f33 f34 f3n f3.

    . . . . .

    . . . . .

    [xm-1 xm>fm1 fm2 fm3 fm4 fmn fm.

    f.j f.1 f.2 f.3 f.4

    f.n n

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    17/173

    17

    De igual manera se puede construir tablas bivariantes para frecuencias relativas o porcentualesde acuerdo a las necesidades de presentacin de informacin.

    Ejemplo:

    Distribucin de individuos por gnero musical y grado de identificacin del candidato.

    Los datos tambin pueden ser representados en barras apiladas de porcentajes donde lacantidad para cada valor de la variable elegida para el eje horizontal representa el total parcial (oel 100%) y las cantidades (o los porcentajes) de la segunda variable van a dar lugar a dichacantidad (o el 100%).

    1.2.3. Cuadro Estadstico:Se utiliza para presentar la informacin estadstica en forma ordenada y de fcil lectura paracualquier usuario, se presenta en informes finales y tiene las siguientes partes:

    1.2.3.1 Componentes de un cuadro:

    Una grfica, cuadro o una tabla, debe constar de:Ttulo adecuado: Claro y conciso, que responda a las preguntas: Qu relaciona?,cmo?, cundo?, y dnde se hicieron las observaciones?.

    El cuerpo: o cuadro en s, donde debe considerar el o los tipos de variables arelacionar, el pblico a quien va dirigido y presentarse las frecuencias que sean msnecesarias.

    149 97 55 301

    49.5% 32.2% 18.3% 100.0%

    84.2% 63.0% 58.5% 70.8%

    35.1% 22.8% 12.9% 70.8%

    12 30 35 77

    15.6% 39.0% 45.5% 100.0%

    6.8% 19.5% 37.2% 18.1%

    2.8% 7.1% 8.2% 18.1%

    16 27 4 47

    34.0% 57.4% 8.5% 100.0%

    9.0% 17.5% 4.3% 11.1%

    3.8% 6.4% .9% 11.1%

    177 154 94 425

    41.6% 36.2% 22.1% 100.0%

    100.0% 100.0% 100.0% 100.0%

    41.6% 36.2% 22.1% 100.0%

    Recuento

    % de Identif ica al

    candidato

    % de Gnero musical

    % del total

    Recuento

    % de Identif ica al

    candidato

    % de Gnero musical

    % del total

    Recuento

    % de Identif ica al

    candidato

    % de Gnero musical

    % del total

    Recuento% de Identif ica al

    candidato

    % de Gnero musical

    % del total

    Plenamente

    Medianamente

    No identif ica

    Identif ica al

    candidato

    Total

    Reggaeton Vals Cumbia

    Gnero musical

    Total

    84%63% 59%

    7%

    19% 37%

    9% 18%4%

    0%

    20%

    40%

    60%

    80%

    100%

    Reggaeton Vals Cumbia

    Distribucin de individuossegn identificacin de un

    candidato por gnero musical

    Plenamente Medianamente

    35%23%

    13%

    3%

    7%

    8%

    4%6%

    1%

    0%

    10%

    20%

    30%

    40%

    50%

    Reggaeton Vals Cumbia

    Distribucin de individuos por

    gnero musical y grado deidentificacin

    Plenamente Medianamente No identif ica

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    18/173

    18

    Notas Explicativas: En ella se presentan aclaraciones respecto a la informacin quese est presentando. Este componente es opcional.Fuente:Corresponde al rea de la empresa o institucin responsable de la elaboracinde la informacin.Una tabla de frecuencias o cuadro estadstico debe presentar los siguientes elementos

    bsicos:

    1.2.4 Grfico EstadsticoUna grfica o diagrama estadstico es un dibujo complementario a una tabla o cuadro, quepermite observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico delas variables ah relacionadas.

    1.2.4.1 Componentes de una grfica:Una grfica, cuadro o una tabla, debe constar de:Ttulo adecuado: Claro y conciso, que responda a las preguntas: Qu relaciona?,cmo?, cundo?, y dnde se hicieron las observaciones?El cuerpo:Es el grfico en s, cuya eleccin debe considerar el o los tipos de variablesa relacionar, el pblico a quien va dirigido y el diseo artstico del grfico.Fuente:Corresponde al rea de la empresa o institucin responsable de la elaboracinde la informacin

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    19/173

    19

    1.2.4.2 Principales tipos de grficosExiste una gran cantidad de grficos para la representacin de datos estadsticos, entrelos principales tenemos:

    a. Grfico de Barras:El grfico de barras, como su nombre lo indica, est constituido por barras

    rectangulares de igual ancho, conservando la misma distancia de separacin entres. Se utiliza bsicamente para mostrar y comparar frecuencias de variablescualitativas o comportamientos en el tiempo, cuando el nmero de tems esreducido.Se construye de la siguiente manera la base de las barra la conforman lascategoras de la variable y su altura se presenta con la frecuencias simples(absoluta, relativa o porcentual).

    Se clasifican por:

    Barras Simples: Compara valores entre categoras de una variableBarras Dobles: Compara valores entre categoras de dos variablesBarras Mltiples Compara valores entre categoras de dos variablesBarras Verticales: Las categoras de la variable deben ubicarse en el eje X

    Barras Horizontales: Las categoras de la variable deben ubicarse en el eje YBarras Apiladas: Compara entre categoras el aporte de cada valor en el total

    Fuente: DATUM

    b. Grfico de Sectores Circulares (Pie):Usualmente llamado grfico de pastel, debido a su forma caracterstica de unacircunferencia dividida en sectores, por medio de radios que dan la sensacin de unpastel tajado en porciones.Se usa para representar variables cualitativas en porcentajes o cifras absolutascuando el nmero de tems no es superior a 5 y se quiere resaltar uno de ellos.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    20/173

    20

    Fuente: DATUM

    c. Grfico de Lneas o Tendencia:Usado bsicamente para mostrar el comportamiento de una variable cuantitativa atravs del tiempo. El grfico de lneas consiste en segmentos rectilneos unidosentre s, los cuales resaltan las variaciones de la variable por unidad de tiempo.Cuando se tienen varias variables a representar, con el fin de establecercomparaciones entre ellas (siempre que su unidad de medida sea la misma); seutiliza plasmarlos en un slo grfico, el cual es el resultado de representar variasvariables en un mismo plano. A este tipo de grfico se le conoce como grfico delneas compuesto.

    Fuente: DATUM

    d. Histograma de Frecuencias:Es un grfico de barra pero unidas. Se utiliza bsicamente para mostrar ladistribucin de frecuencias de variables cuantitativas. El histograma se construyedibujando barras contiguas que tienen como base la amplitud de cada intervalo ycomo alturas las frecuencias respectivas.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    21/173

    21

    Edades de los participantes de la Olimpiada de Video Juegos 2013

    Fuente: Excel Foro Blogspot.com

    e. Polgono de Frecuencias:Es un grfico poligonal cerrado. Se utiliza bsicamente para mostrar la distribucinde frecuencias de variables cuantitativas. Para la construccin de un polgono defrecuencias, se marcan los puntos medios (marcas de clase) de cada uno losintervalos en la parte superior de cada barra del histograma de frecuencias, los

    cuales se unen con segmentos de recta.

    Frecuencia de Visitas externas a la Piscina de un Colegio Privado

    f. Histograma de Frecuencias Acumuladas:Se utiliza bsicamente para mostrar la distribucin de frecuencias acumulada devariables cuantitativas. El histograma de frecuencias acumuladas tambin esobtenido a partir de una distribucin de frecuencias, tomando en el eje horizontal lasclases de la variable, y en el eje vertical las frecuencias acumuladascorrespondientes a cada intervalo. Se construye de la misma manera que unhistograma, pero utilizando frecuencias acumuladas. Se puede mostrar mediante lasbarras o bien mediante un polgono abierto. Para la construccin de un histogramade frecuencias acumulado, se marcan los lmites superiores de cada uno losintervalos en la parte superior de cada barra del histograma de frecuenciasacumulado, los cuales se unen con segmentos de recta. Este grfico se le conocetambin con el nombre de Ojiva de frecuencias.

    Distribuidora Del Valle S.A.: Ventas Diarias en artculos deprimera necesidad

    Distribuidora Del Valle S.A.: Ventas Diarias enartculos de primera necesidad

    Venta diarias (miles de sles) Venta diarias (miles de sles)

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    22/173

    22

    g.Diagramas de dispersin o nubes de puntos:Este tipo de grfico es til para representar la relacin existente entre dos variablesde tipo cuantitativoLa representacin grfica de este tipo de variables es en realidad semejante a larepresentacin de puntos en el plano, usando unos ejes de coordenadas. Cadapareja de valores da lugar a un punto en el plano y el conjunto de puntos que se

    obtiene se denomina "diagrama de dispers in o n ube de puntos".Televisores: Relacin entre Unidades Vendidas y Precio

    h. Pictograma:Tiene la caracterstica de que las unidades de la variable se debe representar consmbolos que lo identifique y su tamao va en relacin a la frecuencia de lacategora de la variable

    i. Pirmide:Se utiliza principalmente para presentar la distribucin de la poblacin por gruposetreos y gnero

    Pirmide Poblacional construida en el Excel.

    Precio (Dlares)

    Venta

    15% 10% 5% 0% 5% 10% 15%

    20-24

    25-29

    30-34

    35-39

    40-44

    45-49

    50-54

    55-59

    60-64

    65-69

    +70

    Varn Mujer

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    23/173

    23

    j. Mapa:Se utiliza principalmente para presentar informacin estadstica por zonas geogrficasde un pas, regin, etc.

    k. Diagrama de ParetoEl diagrama de Pareto es una representacin grfica que permite identificar yseleccionar los aspectos prioritarios que hay que tratar en un determinado problema.Tambin se conoce como diagrama ABC o Ley de las prioridades 20-80, que dice: el80% de los problemas que ocurren en cualquier actividad son ocasionados por el 20%de los elementos que intervienen en producirlos. Sirve para conseguir el mayor nivelde mejora con el menor esfuerzo posible. El objetivo de esta representacin esclasificar dichos elementos es en dos grupos: lospocosvitalesy los muchostriviales.Los pasos para la elaboracin del diagrama de Pareto son:

    Construya una tabla de distribucin de frecuencias ordenando las categoras en formadescendente respecto a la frecuencia.La categora Otrosdeber ser colocada en la ltima posicin, no importa cuan grandesea, porque est compuesta de un grupo de categoras cuyas frecuencias son menoresen relacin al valor de la variable con frecuencia ms pequea listado individualmente.Agregue a la tabla de distribucin de frecuencias una columna para las frecuenciasacumuladas absolutas F.Elabore el diagrama de Barras y agregue la lnea de frecuencias acumuladas relativas

    H F n .

    Ejemplo:Para crear un diagrama de Paretodebemos preparar los datos.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    24/173

    24

    Posteriormente insertar una grfica de columnas seleccionando toda la tabla de datos.

    Ahora debemos convertir el grfico del porcentaje acumulado en un grfico de lnea.

    Ahora debemos agregar el eje secundario. Para ello se selecciona la grfica de lnea yen las opciones de Formato elige trazar el eje secundario.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    25/173

    25

    Ahora que tenemos un diagrama de Paretobsico podemos terminar dndole algnformato especial y de manera opcional agregar una lnea que muestre una constantedel 80%

    ACTIVIDAD N2

    Resuelva los ejercicios propuestos a continuacin utilizando el archivo ACTIVIDAD N2 y presntelosde manera formal, puedes realizar el trabajo en el Excel o de manera analtica. Para ambos casospresenta el desarrollo paso por paso, tablero de frecuencia, grfico y tres interpretaciones por cadacaso.

    1. Los sistemas de cmputo colapsan por muchas razones, entre ellas las fallas de hardware osoftware, errores del operador, sobrecargas del sistema mismo y a otras causas. Los resultadosobtenidos en un estudio acerca de las causas de colapso en una muestra de 98 sistemas decmputo se encuentran en la hoja Colapso. Suponga que se debe priorizar entre las dosprincipales causas de colapso de los sistemas de cmputo. Elaborar un grfico adecuado quepermita establecer una estrategia apropiada.

    2. El tiempo de inactividad es la cantidad del tiempo en el que un sistema de computadora no operadebido a una falla de hardware y software. Cuando el sistema se encuentra inactivo durante msde una hora todos los archivos de trabajo actuales se pierden. Los datos agrupados en la hojaInactividadcorresponden a los tiempos de inactividad (en minutos) registrados en una muestrade 30 y 28 sistemas de computadoras del turno maana y tarde respectivamente.

    Turno maana Turno tarde

    i Lim Inf Lim Sup Marca f h f h1 20.5 25.5 232 25.5 30.5 283 30.5 35.5 33

    4 35.5 40.5 385 40.5 45.5 436 45.5 50.5 48

    30 28

    a. Construir el polgono de frecuencias para los datos agrupados del turno maana y tarde en unsolo grfico.

    b. Elaborar un informe sustentado en el grfico obtenido en el punto anterior.

    3. Una distribuidora de circuitos integrados para computadoras vende su producto en lotes de 100circuitos. Para la inspeccin de calidad se examinan 20 circuitos elegidos al azar de cada lote yse rechaza en caso de encontrar ms de 4 circuitos defectuosos. Los datos en la hoja Circuitosmuestra el nmero de circuitos defectuosos luego de inspeccionar 52 lotes. Construir una tabla dedistribucin frecuencias para la variable en estudio.

    4. Se quiere comparar los resultados obtenidos por tres operadores, en cuanto a los tiempos (enminutos) utilizados en el restablecimiento de servicio de redes en el sistema de una importanteentidad bancaria. Los resultados obtenidos se encuentran en la hoja Operador.

    a. Construir las tablas de distribucin de frecuencias para los tres operadores por separado. Usela regla de Sturges.

    b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada grfico.c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.

    5. El jefe del rea de sistemas de una empresa realiz un estudio para analizar el tiempo quedemoran los empleados en detectar y resolver un problema informtico de software o hardware.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    26/173

    26

    El estudio trata de estudiar las diferencias de tiempos en los turnos de trabajo A y B de unaempresa. La hoja Tiempo muestra los datos obtenidos para una muestra de 40 problemasinformticos presentados en el turno A y 100 problemas informticos presentados en el turno B.

    a. Construir la tabla de distribucin de frecuencias para el turno A. Use la regla de Sturges.b. Construir los histogramas respectivos. Use la frecuencia relativa simple para cada grfico.

    c. Elaborar un informe sustentado en los grficos obtenidos en el punto anterior.

    6. Se tiene informacin sobre los problemas de soporte tcnico encontrados durante la instalacin yconfiguracin de Exchange 2000 Server y Exchange Server 2003. Construya un grfico apropiadopara poder identificar los problemas principales. Los datos se encuentran en la hoja Instalacin.La descripcin de los problemas mencionados y la tabla de distribucin de frecuencias semuestran a continuacin.

    Problema Descripcin

    A Error de actualizacin de Exchange Server 5.5

    B Permisos insuficientes

    C Problemas con el sistema de nombres de dominio (DNS)

    D Forestprep o Domainprep no finalizaron correctamenteE Permisos de Active Directory insuficientes

    F Falta el contenedor de conexiones de Active Directory

    Otros Otros problemas

    Problema f h F H

    A 200 0.357 200 0.357

    B 150 0.268 350 0.625

    C 100 0.179 450 0.804

    D 50 0.089 500 0.893

    E 30 0.054 530 0.946F 20 0.036 550 0.982

    Otros 10 0.018 560 1.000

    560

    ACTIVIDAD ADICIONAL1. Alpha Softes una compaa dedicada a brindar servicios informticos a empresas que deseen

    tener una presencia firme y contundente en la red. Esta compaa se dedica al tendido de redesLAN, instalacin de equipos, servidores y toda una gama de productos tecnolgicos que puedanresultar imprescindibles para una empresa. Como parte de un estudio realizado porAlpha Softseanaliza la informacin correspondiente a las siguientes variables:

    I. Tipos de lenguajes de programacin (Cobol, Java, Informixs-4gl, etc)II. Cantidad de servidores por empresa.III. Costo de las licencias de software (en dlares)IV. Sistema operativo instalado (Windows, UNIX, etc)V. Fecha de mantenimiento del software.

    Para la lista anterior identifique el tipo de variable y la escala de medicin correspondiente.

    2. La empresa Beta Internet llev a cabo un estudio entre los usuarios de Internet en Lima parapoder analizar el mercado de posibles compradores a travs de este servicio. Como parte delestudio realizado se analiz la informacin correspondiente a una muestra de 1500 usuarios conrelacin a las siguientes variables:

    I. Edad del principal usuario.II. Nmero de computadoras en casa con servicio de Internet.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    27/173

    27

    III. Calidad del servicio de Internet (bueno, regular, deficiente).IV. Tiempo diario de uso del servicio de Internet (en horas).V. Marca de la computadora con mayor uso del servicio de Internet.

    De acuerdo al enunciado anterior identificar la poblacin, muestra, el tipo de variable y la escalade medicin correspondiente.

    3. Los datos en la hoja Dominios tiene informacin para una muestra sobre los dominios desegundo nivel registrados bajo la categora .pe. La tabla de distribucin de frecuencias para estosdatos se muestra a continuacin.

    Dominio f h p

    com.pe 285 0.570 57.0

    org.pe 106 0.212 21.2

    edu.pe 64 0.128 12.8

    gob.pe 26 0.052 5.2

    net.pe 3 0.006 0.6

    Otros 16 0.032 3.2500

    a. Construir un grfico de barras.b. Construir un grfico circular.

    4. Los datos en la hoja Interrupcionescorresponden al nmero de interrupciones semanales en elsistema de red de una prestigiosa universidad registrado el ltimo ao. La tabla de distribucin defrecuencias para estos datos se muestra continuacin.

    Interrupciones f

    0 201 152 83 64 25 1

    Total 52

    Construir un diagrama de barras y lneas.

    5. Enigma Systems S.A.emprendi un estudio para determinar el comportamiento de un sistema de

    grabacin de programas informticos. Para que el proceso funcione adecuadamente la sealdebe estar entre 9.2 y 10 voltios. Se instalaron los sistemas de grabacin y se tomaron lecturasrespectivas. Los datos registrados se encuentran en la hoja Lecturas.a. Construir la tabla de distribucin de frecuencias usando la regla de Sturges.b. Elaborar segn la tabla anterior el histograma, polgono y ojiva.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    28/173

    28

    TEMA 03

    1.3 MEDIDAS DESCRIPTIVAS

    En los temas anteriores, se trat sobre la clasificacin, ordenacin y presentacin de datosestadsticos en distribuciones de frecuencia, limitando el anlisis de la informacin a su interpretacinporcentual.Una distribucin de frecuencias presenta siempre varios valores. Si tratamos de saber cules deestos valores por s solos definen mejor al conjunto, no es posible decidir por cual de ellos.El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales puedarecaer la representacin de toda la informacin, realizndose esta representacin en las medidasdescriptivas o tambin denominadas medidas de resumen.Las principales medidas descriptivas se clasifican en:1.3.1 Medidas de Tendencia Central y Posicin1.3.3 Medidas de Asimetra1.3.2 Medidas de Dispersin1.3.4 Medidas de Kurtosis

    1.3.1 MEDIDAS DE TENDENCIA CENTRAL Y POSICINLas medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de lainformacin.De tendencia porque no necesariamente son valores que la distribucin presenta, sino valores hacialos cuales tiende o aproxima.Centrales porque, normalmente, en el grfico de frecuencias sern siempre valores medioscentrales.Las medidas de tendencia central responden a la necesidad de describir una colectividad en funcinde una sola medida que la caracterice y distinga, ya sea porque son los ms frecuentes (moda) oporque alrededor de ellos se agrupa la mayor parte de la poblacin o muestra (media o mediana),Las medidas de tendencia central, son tambin medidas de posicin ya que, de todas manerasocupan un lugar dentro de la informacin, los parmetros posicionales son muy tiles en la

    interpretacin porcentual de la informacin.Este tipo de medidas son de gran importancia en el manejo de las tcnicas estadsticas, sin embargo,su interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que larepresentatividad de ellas est asociada con el grado de concentracin de la informacin.Las principales medidas de tendencia central y posicin son:

    1.3.1.1 Media aritmtica.1.3.1.2 Mediana1.3.1.3 Moda.1.3.1.4 Media Ponderada1.3.1.5 Cuantiles (Medidas de localizacin)

    1.3.1.1 MEDIA ARITMTICADefinida matemticamente como el cociente entre la suma de todos los valores de la variabley el nmero de observaciones.a. Simbologa:

    Si la media muestral es calculada de una poblacin se simboliza mediante

    Si la media muestral es calculada de una muestra de una poblacin se simboliza mediante

    x

    b. Clculo de la MediaLa media, mediaaritmticaopromediode un conjunto de datos es la suma de dichos valoresdividida entre el nmero total de datos.

    Datos no agrupados

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    29/173

    29

    Media poblacional:

    N

    i

    ix

    N 1

    1 Media muestral:

    n

    i

    ix

    nx

    1

    1

    Datos agrupados

    Media poblacional:

    k

    i

    ii fxN 1

    /1 Media muestral:

    k

    i

    ii fxn

    x1

    /1

    donde k es el nmero de intervalos,i

    x es el valor del dato individual., /i

    x la marca

    de clase, n es el tamao de la muestra y N es el tamao de la poblacin.

    Ejemplo :La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas dela ciudad fueron:

    10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 1713 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39

    Calcule e interprete la media.Solucin:Obtenemos

    Interpretacin: En promedio las pequeas empresas invierten 20.125 nuevos soles alao.

    b.2 Para datos agrupados

    o

    Ejemplo 2: Variable DiscretaSe selecciona al azar 140 vendedores de una gran compaa de seguros. A

    continuacin se muestra el nmero de plizas vendidas durante una semana. Calculee interprete la mediaN de

    PlizasVendedores

    1 2

    2 10

    3 15

    4 20

    5 40

    6 24

    7 15

    8 12

    9 2

    Solucin:Completando la siguiente tabla para el clculo de la media aritmtica

    N de Plizas Vendedores Xi*fi1 2 22 10 203 15 454 20 805 40 2006 24 1447 15 105

    8 12 969 2 18Total 710

    n

    fxX

    ii iihxX

    125.2032

    39...3010401210

    n

    x

    X i

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    30/173

    30

    El promedio es:

    Interpretacin:

    El nmero de plizas que se venden en promedio en dicha empresa es 5.

    Ejemplo 3: Variable ContinuaEl siguiente cuadro muestra las ventas registradas en 388 facturas de la EmpresaPasaly, calcule e interprete la venta promedio por factura.

    Montos Facturas

    1 500 - 2 900 27

    2 900 - 5 700 58

    5 700 - 8 700 216

    8 700 - 11 000 52

    11 000 - 14 000 2314 000 - 17 000 12

    Solucin:Completando la siguiente tabla para el clculo de la media aritmtica

    Montos Facturas Xi Xi*fi

    1 500 - 2 900 27 2200 59400

    2 900 - 5 700 58 4300 249400

    5 700 - 8 700 216 7200 1555200

    8 700 - 11 000 52 9850 512200

    11 000 - 14 000 23 12500 28750014 000 - 17 000 12 15500 186000

    Total 388 2849700

    El promedio es:

    Interpretacin: El monto promedio de facturacin de dicha empresa es de 7344.59

    c. Propiedades de la media aritmtica- La suma de las diferencias de los datos con respecto a la media aritmtica es igual cero.

    - La suma de las diferencias cuadrticas de los datos, con respecto a la Media Aritmtica,

    es mnima.

    - La media aritmtica de una constante es la misma constante.

    - Si a cada uno de los resultados le sumamos o le restamos una constante k , la Media

    Aritmtica queda alterada en esa constante.

    - Si cada uno de los datos se multiplica por una constante k, entonces la media aritmtica

    queda multiplicada por esa constante

    - La media aritmtica de la suma o diferencia de dos variables es la suma o diferencia desus medias.

    59.7344388

    2849700

    n

    fxX

    ii

    07.5140

    710

    n

    fxX

    ii

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    31/173

    31

    d. Ventajas de la media aritmtica- Es fcil de entender y usar.- Hace uso de todos los datos de la distribucin, por lo cual es una medida de tendencia

    central eficiente.- Es el ms conocido y popular de los promedios, el primero en el que piensan las

    personas, aunque no sepan estadstica.- El hecho de que su definicin no sea lgica sino matemtica hace que sea la medida de

    tendencia central usada con preferencia en Inferencia Estadstica y en la mayora detests estadsticos.

    e. Desventajas de la media aritmtica- Puede ser influenciada por valores extremos, que la hagan perder su valor como medida

    de tendencia central- En ciertos casos puede no representar un valor observable, lo cual en el caso de

    variables discretas resulta artificioso.- No puede calcularse para series cualitativas.

    - Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato

    de nuestro clculo.- Somos incapaces de calcular la media para un conjunto de datos que tiene clases de

    extremo abierto, ya sea en el inferior o en el superior de la escala.

    1.3.1.2 MEDIANASu definicin no es matemtica sino lgica, entendemos por mediana aquel valor de lavariable que divide en dos partes iguales a un conjunto ordenado de datos.

    a. SimbologaSe simboliza con Me

    b. Clculo de la Mediana

    b.1 Para datos no agrupadosPara el clculo de la mediana los datos deben estar ordenados de menor a mayor, ydeja a su izquierda y derecha el mismo nmero de elementos, es decir, el valor queocupa el lugar central es la mediana.Lo anterior tiene sentido en caso de que la serie tenga un nmero impar deelementos, si por el contrario tuviera un nmero par habra dos valores centrales, y eneste caso se toma como mediana la media aritmtica de los dos valores centrales.

    Ejemplo:Si el nmero de datos es par

    La inversin anual (en miles de soles) de un grupo de pequeas empresas de laciudad fueron:

    10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 1713 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39

    Calcule e interprete la mediana.Solucin:

    Primero debemos ordenar los datos en forma ascendente (de menor a mayor)10 10 10 11 12 13 13 14 14 14 15 15 16 17 17 18

    18 19 20 20 21 22 25 26 27 28 30 30 30 30 39 40

    Luego el nmero de datos se divide en dos partes iguales 162

    32

    2

    n

    Se elige los valores centrales de la variable que tiene la posicin i=16 y i=17 que parael ejercicio son 18 y 18

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    32/173

    32

    La mediana ser:2

    1818Me 18Me

    Interpretacin:El 50% de las pequeas empresas han invertido como mximo 18 mil nuevos soles alao.

    Ejemplo:Si el nmero de datos es impar

    La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas dela ciudad fueron:10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 17 1813 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39

    Calcule e interprete la mediana.

    Solucin:Primero debemos ordenar los datos en forma ascendente (de menor a mayor)

    10 10 10 11 12 13 13 14 14 14 15 15 16 17 17 18 1818 19 20 20 21 22 25 26 27 28 30 30 30 30 39 40

    Luego el nmero de datos se divide en dos partes iguales 5,162

    33

    2

    n

    Se elige el valor centrales de la variable que tiene la posicin i=17, X17=18La mediana ser: 18Me

    Interpretacin:El 50% de las pequeas empresas han invertido como mximo 18 mil nuevos soles alao.

    b.2 Para datos agrupados

    El primer paso es identificar el intervalo en el que por primera vez la frecuenciarelativa acumulada es por lo menos 0.5. Dicho intervalo ser el que contenga el valorde la mediana.

    Mediana poblacional:

    1

    2LMe i

    i

    i FN

    f

    w

    Mediana muestral:

    1

    2Lme i

    i

    i Fn

    f

    w

    dondei

    L es el limite inferior del intervalo que contiene a la mediana, w es el ancho

    de clase, if es la frecuencia absoluta simple del intervalo que contiene a la mediana,

    1iF es la frecuencia absoluta acumulada del intervalo anterior al que contiene a la

    mediana, n es el tamao de la muestra y N es el tamao de la poblacin.

    Ejemplo 2: Variable Discreta

    Se selecciona al azar 140 vendedores de una gran compaa de seguros. Acontinuacin se muestra el nmero de plizas vendidas durante una semana.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    33/173

    33

    N dePlizas

    Vendedores

    1 2

    2 10

    3 15

    4 20

    5 40

    6 24

    7 15

    8 12

    9 2

    Calcule e interprete la mediana.Solucin:Como los datos tabulados ya estn ordenados, debemos encontrar el valor de lavariable que ocupa la posicin central, entonces dividimos al conjunto de datos nen

    dos partes: 702

    140

    2

    n

    Entonces ubicamos en la tabla el valor que tenga la posicin 70, para eso calculamosla frecuencia acumulada. Como regla prctica se busca el primer valor en el Facumulado que contenga a al n/2, en este caso es el F5 cuyo valor es 87 siendomayor que 70 por primera vez en el acumulado.

    N dePlizas

    Vendedores Fi

    1 2 2

    2 10 12

    3 15 27

    4 20 47

    5 40 87

    6 24 111

    7 15 126

    8 12 138

    9 2 140

    Entonces la mediana es: 5Me

    Interpretacin:El 50% de los vendedores vende 5 o ms plizas .

    Ejemplo: Variable Continua

    El siguiente cuadro muestra las ventas registradas en 388 facturas de la EmpresaPasaly, calcule e interprete la venta mediana

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    34/173

    34

    Montos Facturas

    1 500 - 2 900 27

    2 900 - 5 700 58

    5 700 - 8 700 216

    8 700 - 11 000 5211 000 - 14 000 23

    14 000 - 17 000 12

    Calcule e interprete la mediana.

    Solucin:Para aplicar los valores en: debemos encontrar la

    clase j denominada clase mediana

    La clase mediana es aquella que contiene a la mitad de del conjunto de datos, esto es

    el que contenga la posicin 1942

    388

    2

    n , para eso calculamos la frecuencia

    acumulada:

    Montos Facturas Fi

    1 500 - 2 900 27 27

    2 900 - 5 700 58 85

    5 700 - 8 700 216 301

    8 700 - 11 000 52 353

    11 000 - 14 000 23 376

    14 000 - 17 000 12 388Total 388

    Entonces aplicando en la frmula:

    Interpretacin:____________________________________________________________________

    ____________________________________________________________________

    1.3.1.3 MODAEntendemos por moda el valor de la variable que ms veces se repite, y en una distribucinde frecuencias el valor con mayor frecuencia absoluta simplePuede darse el caso de que no haya moda (amodal), slo una (unimodal), dos modas(bimodal) o varias modas (multimodal).

    a. SimbologaSe simboliza con Mo

    b. Clculo de la Moda

    b.1 Para Datos no agrupados

    En este caso la determinacin de la moda es inmediata por simple observacin. Aquelvalor de la variable con mayor frecuencia es la moda.

    j

    j

    jjf

    FnwLiMe

    12/

    9.7213)216

    85194(30005700

    Me

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    35/173

    35

    Ejemplo:La inversin anual (en miles de nuevos soles) de un grupo de pequeas empresas dela ciudad fueron:

    10 12 40 10 30 14 16 20 25 28 30 26 30 10 18 1713 17 21 14 15 19 27 22 14 11 13 15 18 20 30 39

    Calcule e interprete la moda.

    Solucin:Buscamos el valor que ms se repita, en este caso es: 30Mo

    Interpretacin: Las pequeas empresas con mayor frecuencia han invertido 30 milnuevos soles al ao.

    b.2 Para Datos AgrupadosEl primer paso es identificar el intervalo con mayor frecuencia absoluta simple. Dichointervalo ser el que contenga el valor de la moda.

    Moda poblacional: 1

    1 2

    Mo Li

    dw

    d d

    Moda muestral:

    21

    1Lmo

    dd

    dw

    i

    dondei

    L es el limite inferior del intervalo que contiene a la moda, w es el ancho de

    clase,11

    ii ffd es la diferencia entre la frecuencia absoluta simple del intervalo

    que contiene a la moda y la frecuencia absoluta simple del intervalo anterior,

    12 ii ffd es la diferencia entre la frecuencia absoluta simple del intervalo que

    contiene a la moda y la frecuencia absoluta simple del intervalo siguiente, n es el

    tamao de la muestra y N es el tamao de la poblacin.

    Ejemplo: Variable DiscretaSe selecciona al azar 140 vendedores de una gran compaa de seguros. Acontinuacin se muestra el nmero de plizas vendidas durante una semana.

    N dePlizas

    Vendedores

    1 2

    2 10

    3 15

    4 20

    5 406 24

    7 15

    8 12

    9 2

    Calcular e interpretar la Moda.

    Solucin:El clculo es bastante sencillo, slo ubicamos el valor que tenga la mayor frecuencia,que para el ejercicio es: 5Mo

    Interpretacin:En dicha empresa es usual vender 5 plizas por semana.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    36/173

    36

    Ejemplo 3: Variable ContinuaEl siguiente cuadro muestra las ventas registradas en 388 facturas de la EmpresaPasaly, calcule e interprete la venta modal

    Montos Facturas

    1 500 - 2 900 27

    2 900 - 5 700 58

    5 700 - 8 700 216

    8 700 - 11 000 52

    11 000 - 14 000 23

    14 000 - 17 000 12

    Solucin:

    Montos Facturas

    1 500 - 2 900 27

    2 900 - 5 700 58

    5 700 - 8 700 216

    8 700 - 11 000 52

    11 000 - 14 000 23

    14 000 - 17 000 12

    Para aplicar los valores en:

    211Lmodd

    dwi

    debemos encontrar la clase j denominada clase modalLa clase modal es aquella que tenga la mayor frecuencia, entonces para nosotros esla clase que tiene la frecuencia 216

    Entonces aplicando en la frmula:

    05.7172)52216()58216(

    5821630005700mo

    Interpretacin: El monto de facturacin que ms se repite es de 7172.05

    Ejemplo: Las medidas de tendencia central se pueden obtener para los datosagrupados del turno maana de una empresa respecto al tiempo de produccin decierto producto de la siguiente forma:

    Turno maana

    i Lim Inf Lim Sup Marca f h F H1 20.5 25.5 23 1 0.0333 1 0.03332 25.5 30.5 28 3 0.1000 4 0.13333 30.5 35.5 33 0 0.0000 4 0.1333

    4 35.5 40.5 38 2 0.0667 6 0.20005 40.5 45.5 43 20 0.6667 26 0.86676 45.5 50.5 48 4 0.1333 30 1.0000

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    37/173

    37

    30

    Media muestral: 17.41123530

    1

    30

    1 6

    1

    /

    i

    ii fxx minutos

    Mediana muestral: 75.4262

    30

    20

    55.40me

    minutos

    Moda muestral: 15.431618

    1855.40mo

    minutos

    CARACTERSTICAS DE LA MEDIA ARITMTICA

    - Es un promedio razonablemente estable, siendo la medida descriptiva ms conocida y usadaen Estadstica, debido a su estabilidad general ya que est bien definida.- Es nica, es decir, un conjunto de datos tiene solamente una media.- Se calcula tomando en cuenta a todos y cada uno de los datos.- Su significado es de fcil entendimiento.- Como la media localiza el medio fsico ( centro de gravedad) de una distribucin de datos, es

    una medida de tendencia central muy sensible a los valores extremos y estos valores si sondesproporcionados desplazan el valor de la media hacia los extremos reduciendo su utilidad.

    - La media aritmtica depende de todos los datos observados, en consecuencia es afectada osesgada por valores extremos.

    - La media aritmtica puede ser calculada tambin en una distribucin de frecuencias porintervalos de amplitud diferentes, siempre que se pueda determinar los puntos medios de losintervalos.

    CARACTERSTICAS DE LA MEDIANA

    - Como estadgrafo de posicin, la mediana le sigue en importancia y usos a la media.- Es una medida nica, es decir, una distribucin de datos tiene solamente una mediana.- La mediana depende slo del nmero de datos ordenados y no del valor de los datos, por lo

    tanto no es sesgada por algn valor grande o pequeo.- El valor de la mediana depende nicamente del valor o valores centrales.- No cambia de valor si se agregan un mismo nmero de datos mayores o menores que ella.

    En consecuencia no es sensible a valores extremos.- La mediana puede ser calculada para distribuciones de frecuencia con intervalos de diferente

    amplitud, siempre que se pueda determinar el lmite inferior del intervalo de la mediana.- La mediana puede ser calculada para variables con valores en escala ordinal.

    - La mediana es ms recomendable que la media aritmtica cuando:Existan valores extremos excepcionalmente grandes o muy pequeos que difierenconsiderablemente del resto, ya que la mediana no est afectada por los valores extremoscomo sucede con la media. En estos casos la mediana es ms representativa que la mediaya que localiza mejor el centro de la distribucin de datos.Se trabaja con tablas de frecuencias con intervalos en donde no se indica el extremo inferiordel primer intervalo o no se indica el extremo superior del ltimo intervalo o ambos casos.Esto no indica que no exista la media, la cual existe y siempre se puede calcular.Se tiene datos cualitativos, susceptibles de ordenarse de acuerdo a rangos, calificaciones ocategoras.

    CARACTERSTICAS DE LA MODA

    - Le sigue en importancia a la media y mediana.- Es un estadgrafo muy til cuando los datos son del tipo cualitativo.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    38/173

    38

    - Su fcil interpretacin y su clculo sencillo hacen de la moda una medida de localizacin msusual y prctica.

    - No es una medida nica como la media y la mediana.- Un conjunto de datos puede tener ms de una moda. Mediante una clasificacin adecuada

    una multimodal se puede convertir en una unimodal.- El clculo de la moda es independiente del valor de los datos.

    La moda puede permanecer igual variando los valores o incrementando el nmero de ellos.

    1.3.1.4 MEDIA PONDERADASe utiliza cuando los datos a promediar no tienen la misma importancia, peso o ponderacindentro del conjunto total.

    1

    1

    n

    i i

    iw

    n

    i

    i

    x w

    x

    w

    dondei

    x es el dato original yi

    w es el peso o ponderacin asignado a cada dato.

    Ejemplo: Una empresa tiene tres turnos de trabajo en sus dos locales. Los trabajadores encada uno de estos turnos participan de acuerdo a la siguiente tabla:

    TurnoSalario

    por hora(S/.)

    Nmero de horas trabajadas

    Local 1 Local 2

    Maana 12 50 40Tarde 15 20 35Noche 18 10 25

    El salario promedio por hora en cada local es:

    Local 1: 12 50 15 20 18 10

    13.5050 20 10

    wx

    nuevos soles

    Local 2: 12 40 15 35 18 25

    14.5540 35 25

    wx

    nuevos soles

    Luego, el local 2 tiene un mayor salario promedio por hora.

    1.3.1.4 CUANTILES

    Las medidas de posicin o cuantiles son los valores que determinan la posicin de un datorespecto a todos los dems datos de una serie y que previamente ha sido ordenada de menora mayor. Los cuantiles ms importantes dividen a los datos ordenados de menor a mayor en100, 10 y 4 cantidades iguales de datos, denominndose centiles, deciles y cuartilesrespectivamente.

    CENTIL: Tambin conocido como percententil o porcentil. El centil k, Pk. es el valor numricotal que el kpor ciento de los datos ordenados est por debajo de ese valor y el (100k) porciento de los datos est por encima de ese valor.

    DECIL: Se denomina as a cada uno de los nueve centiles: P10, P20, P30 P90 y se les denotacomo D1, D2, D3, , D9respectivamente.

    CUARTIL: Se denomina as a cada uno de los tres centiles: P25, P50, P75y se les denotacomo Q1, Q2y Q3respectivamente.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    39/173

    39

    Adems, se define el rango intercuartil(llamado tambinpropagacin media) como ladiferencia entre el tercer cuartil y el primer cuartil en una serie de datos, es decir:

    Rango in tercuart i l (RIC)= Q3Q1

    CUANTILES PARA DATOS NO AGRUPADOS

    Los clculos se centrarn en encontrar los valores de los centiles. Para hallar valores dedeciles o cuartiles simplemente encontraremos el valor del centiles correspondientes.

    Si tenemos n datos ordenados de menor a mayor y queremos determinar el valor del centilPk.

    Localizacin:La posicin que ocupa el centil Pken la lista de datos ordenados est determinada por laexpresin:

    kn

    .100

    1

    Identificacin:Si la posicin del centil es un nmero entero, el centil buscado ser el dato que ocupa dichaposicin en la serie ordenada.

    Si la posicin del centil no es un valor entero, es decir, el centil est entre dos valoresubicados consecutivamente, entonces el valor del centil se obtiene de la siguiente expresin:

    )).(( posicindedecimalpartemenordatomayordatomenordato

    CUANTILES PARA DATOS AGRUPADOS EN INTERVALOSSi tenemos ndatos agrupados en clases y queremos determinar el valor del centil Pk.

    Localizacin:

    La posicin que ocupa el centil Pken la lista de datos ordenados esta determinada por laexpresin:

    kn

    .100

    Identificacin:Identificamos primero la clase en la que se encuentra el centil Pk. El valor del centil sedetermina por al siguiente expresin:

    )100

    .( F

    kn

    f

    wLP ik

    donde:Li : lmite inferior de la clase del centil.f : frecuencia de la clase del centil.F : frecuencia acumulada de la clase que precede a la clase del centil.w : amplitud de clase.n : nmero de datos.

    EjemploComo ejemplo efectuamos el clculo del primer cuartil Q1. En primer lugar tomemos los datosno agrupados correspondientes a las edades de los 80 estudiantes entrevistados cuyosresultados se encuentran en la siguiente tabla:

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    40/173

    40

    Estudiante peso estudiante peso estudiante peso estudiante peso

    1 45 21 59 41 64 61 692 4 22 59 42 64 62 03 51 23 60 43 65 63 04 51 24 60 44 65 64 15 52 25 60 45 65 65 26 52 26 60 46 65 66 3 53 2 61 4 66 6 4 53 2 61 4 66 6 59 54 29 61 49 66 69 510 54 30 61 50 66 0 611 55 31 62 51 6 1 612 55 32 62 52 6 2 13 56 33 62 53 6 3 14 56 34 62 54 6 4 15 5 35 63 55 6 5 916 5 36 63 56 6 6 01 5 3 63 5 6 11 5 3 63 5 6 419 5 39 64 59 6 9 5

    20 59 40 64 60 69 0

    Solucin:

    El primer cuartil Q1es equivalente al 25 centil P25,

    Localizacin:

    a25,2025.

    100

    180k.

    100

    1n=

    +

    =

    +

    Identificacin:

    Est entre el dato 20 y el dato 21 , como ambos datos tienen un valor de 59, entonces elvalor del primer cuartil es 59.

    Ahora consideremos los mismos datos pero agrupados en clases . El primer cuartil Q1es:

    Localizacin:

    o2025.

    100

    n=

    El dato 20 se encuentra en la clase 5763.

    Identificacin:

    86,58)71100

    25.80(20

    657PQ 251

    ClaseMarca

    de clasex

    f F

    4551 48 4 45157 54 13 175763 60 21 386369 66 23 61

    6975 72 8 697581 78 8 778187 84 3 80

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    41/173

    41

    Ejemplo para una Variable DiscretaSe selecciona al azar 140 vendedores de una gran compaa de seguros. A continuacinse muestra el nmero de plizas vendidas durante una semana. Calcule e interprete:

    1. Cuartil 12. Cuartil 2

    3. Cuartil 34. Decil 3

    5. Decil 96. Percentil 5

    7. Percentil 788. Percentil 99

    N dePlizas

    Vendedores

    1 2

    2 10

    3 15

    4 20

    5 40

    6 247 15

    8 12

    9 2

    Total 140

    Solucin:Clculo de Cuartil 1

    Como los datos tabulados ya estn ordenados, debemos encontrar el valor de la variableque contiene el i=25% de los datos, entonces calculamos el 25% de n: 35)140%(25

    Entonces ubicamos en la tabla el valor que tenga la posicin 35, para eso calculamos lafrecuencia acumulada

    N dePlizas

    Vendedores Fi

    1 2 2

    2 10 12

    3 15 27

    4 20 47

    5 40 87

    6 24 111

    7 15 126

    8 12 138

    9 2 140

    Entonces el cuartil 1 es: 4251 PQ

    Interpretacin: Hay un 75% de vendedores que venden 4 o ms plizas por semana.

    1. Q1= 5. D9=

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    42/173

    42

    2. Q2= 6. P5=

    3. Q3= 7. P78=

    4. D1= 8. P99=

    Ejemplo 3: Variable ContinuaEl siguiente cuadro muestra las ventas registradas en 388 facturas de la Empresa Pasaly,calcule e interprete:

    1. Cuartil 1

    2. Cuartil 23. Cuartil 34. Decil 3

    5. Decil 9

    6. Percentil 57. Percentil 788. Percentil 99

    Montos Facturas

    1 500 - 2 900 27

    2 900 - 5 700 58

    5 700 - 8 700 216

    8 700 - 11 000 52

    11 000 - 14 000 23

    14 000 - 17 000 12

    Total 388

    Solucin: Clculo del Cuartil 1 (Q1):

    Para aplicar los valores en: debemos encontrar la clase j

    denominada clase del i-simo percentil.

    La clase del i-simo percentil es aquella que contiene el i%=25% del conjunto de datos,

    esto es el que contenga la posicin 97

    100

    25(388)

    100

    %

    ni, para eso calculamos la

    frecuencia acumulada:

    Montos Facturas Fi

    1 500 - 2 900 27 27

    2 900 - 5 700 58 85

    5 700 - 8 700 216 301

    8 700 - 11 000 52 353

    11 000 - 14 000 23 376

    14 000 - 17 000 12 388

    Total 388

    Entonces aplicando en la frmula:

    j

    j

    jjif

    FniwLiP

    1%

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    43/173

    43

    251

    PQ

    Interpretacin: Hay un 25% de facturas con montos menores o iguales que 5866.7.

    1. Q1= 5. D9=

    2. Q2= 6. P55=

    3. Q3= 7. P78=

    4. D1= 8. P99=

    ACTIVIDAD N3Resuelve formalmente los siguientes problemas con la ayuda del Excel o de manera analtica ypresntalos en el folder del curso.1. Los datos mostrados en la siguiente tabla corresponden a la vida (en aos) de 48 bateras

    similares de automvil de la marca Enigma. El fabricante de las bateras garantiza que stasduran tres aos.

    2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6

    3,4 1,6 3,1 3,3 3,8 3,1 4,7 3,7

    2,5 4,3 3,4 3,6 2,9 3,3 3,9 3,1

    3,3 3,1 3,7 4,4 3,2 4,1 2,0 3,4

    4,7 3,8 3,2 2,6 3,9 3,0 4,2 3,5

    1,7 2,3 2,6 3,2 3,5 4,3 4,8 4,0

    De acuerdo a los datos mostrados se pide:

    a. Determine la poblacin objetivo, la unidad de muestreo, la variable estudiada, su tipo y suescala de medicin.

    b. Elabore la tabla de distribucin de frecuencias tomando en cuenta que se desea que losdatos estn agrupados en intervalos, que el lmite inferior del primer intervalo sea 1,5aos y que la amplitud de intervalo sea de medio ao.

    c. Elabore el histograma y la ojiva correspondiente.d. Con los datos ofrecidos, es posible saber qu porcentaje de la produccin de bateras

    marca Enigma supera el periodo de garanta indicado por el fabricante?. Sustente surespuesta.

    e. Tomando en cuenta la tabla de distribucin de frecuencias, calcule las medidas de

    tendencia central.f. Elabore un breve informe con las conclusiones del anlisis de los resultados obtenidos.

    7.5866)216

    8597(3000570025

    P

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    44/173

    44

    2. En una planta que fabrica 4 modelos de motos y se quiere resolver un problema de fallasreportadas en las ltimas 12 semanas, para lo cual se recopil la siguiente informacin:

    Modelo M18 Modelo M19 Modelo M20 Modelo M21

    Falla de frenos 3 12 4 9

    Falla de transmisin 6 42 1 30Falla de encendido 3 9 2 6

    Falla en las luces 2 6 1 3

    Falla de ensamblaje 8 61 9 28

    Falla en la suspensin 4 3 4 2

    Falla en acabados 3 38 2 18

    Utilizando el diagrama de Pareto, analice los datos presentados y decida cul es la estrategiams conveniente para enfrentar los problemas en la planta.

    3. Las notas que obtuvieron 120 alumnos en el examen parcial de Nivelacin de Matemticasson presentadas parcialmente en la siguiente tabla:

    ClaseMarca

    de clasex i

    frecuenciaabsoluta

    f i

    frecuenciarelativa

    h i

    Frec. abs.acumulada

    Fi

    Frec. rel.acumulada

    Hi

    - 0,15

    6 - 0,45

    - 0,70

    - 13,5

    - 0,10

    a. Si se desea analizar el rendimiento que han tenido los alumnos en dicho examen, definacon precisin la poblacin objetivo, la unidad de anlisis, la variable, su tipo y su escala de

    medicin.b. Complete la tabla de distribucin de frecuencias y luego elabore la ojiva correspondientee indique qu porcentaje de las notas se encuentren aproximadamente en el intervalo [4, 14].c.

    4. Enigma Systems S.A. emprendi un estudio para determinar el comportamiento de unsistema de grabacin de programas informticos en el que para que el proceso funcioneadecuadamente la seal debe estar entre 9,2 y 10 voltios. Se instalaron sistemas degrabacin tanto en una ubicacin antigua como en una nueva ubicacin y se tomaronlecturas. Los datos registrados se muestran en la siguiente tabla:

    Ubicacin antigua Ubicacin nueva

    8,05 9,84 10,03 8,51 9,19 9,55 10,018,72 9,87 10,05 8,65 9,27 9,60 10,03

    8,72 9,87 10,05 8,68 9,35 9,63 10,05

    8,80 9,95 10,12 8,72 9,36 9,64 10,05

    9,55 9,97 10,15 8,78 9,37 9,70 10,09

    9,70 9,98 10,15 8,80 9,39 9,75 10,10

    9,73 9,98 10,26 8,82 9,43 9,85 10,12

    9,80 10,00 10,26 8,82 9,48 9,87 10,12

    9,80 10,01 10,29 8,83 9,49 9,95 10,15

    9,84 10,02 10,55 9,14 9,54 9,98 10,15

    a. Elabore las tablas de distribucin de frecuencias de los datos de ambas muestras de tal

    manera que permita su comparacin apropiadamente.b. Elabore los histogramas para su comparacin.c. En un solo grfico elabore las ojivas respectivas.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    45/173

    45

    d. Calcule el Rango intercuartil.e. Elabore un informe sustentado de sus conclusiones.

    5. A continuacin se presentan los datos correspondientes a la duracin (en horas) de unamuestra de 40 focos de 100 watts producidos de la marca A y una muestra de 40 focos de

    100 watts de la marca B.

    Marca A Marca B

    684 697 720 773 821 819 836 888 897 903

    831 835 848 852 852 907 912 918 942 943

    859 860 868 870 876 952 959 962 986 992

    893 899 905 909 911 994 1 004 1 005 1 007 1 015

    922 924 926 926 938 1 016 1 018 1 020 1 022 1 034

    939 943 946 954 971 1 038 1 072 1 077 1 077 1 082

    972 977 984 1 005 1 014 1 096 1 100 1 113 1 113 1 116

    1 016 1 041 1 052 1 080 1 093 1 153 1 154 1 174 1 188 1 230

    a. Agrupe los datos de cada muestra en clases y elabore las respectivas tablas dedistribucin de frecuencias.

    b. Compare en un solo cuadro los polgonos de frecuencias de ambas muestras. Interprete.c. Grafique las ojivas de cada muestra en una misma grfica.d. Calcule la media, mediana y moda de cada marca.e. Elabore un breve informe en el que presente el anlisis y las conclusiones de los

    resultados obtenidos.

    6. El Jefe de Control de Calidad en Enigma Autos S.A. en su estudio de la calidad de losproductos que distribuye su empresa, desea comparar varias caractersticas de diseo demodelos de automviles norteamericanos y europeos. La siguiente tabla contiene lasfrecuencias acumuladas absoluta y relativa (en porcentaje) de las distancias que recorren losautos (en pies) cuando son frenados a una velocidad de 140 Km./h. para una muestra de 25modelos de automviles de fabricacin estadounidense y 72 modelos de automviles defabricacin europea obtenidos en un ao reciente.

    Distancia defrenado

    Modelos de automvilesestadounidenses

    Modelos de automvilesEuropeos

    (en pies) Nmero Porcentaje Nmero Porcentaje

    210 - 220 1 4,0 1 1,4

    220 - 230 2 8,0 4 5,6

    230 - 240 3 12,0 19 26,4

    240 - 250 4 16,0 32 44,4250 - 260 8 32,0 54 75,0

    260 - 270 11 44,0 61 84,7

    270 - 280 17 68,0 68 94,4

    280 - 290 21 84,0 68 94,4

    290 - 300 23 92,0 70 97,2

    300 - 310 25 100,0 71 98,6

    310 - 320 25 100,0 72 100,0

    a. Qu porcentaje de automviles de fabricacin estadounidense tienen distancia defrenado de 248 pies o ms?.

    b. Elabore completamente la tabla de distribucin de frecuencias.

    c. En un solo cuadro, presente los polgonos de frecuencia correspondiente.d. En un solo cuadro, presente las ojivas correspondientes a las dos series de datos.

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    46/173

    46

    e. Compare la media, mediana y moda de los modelos de acuerdo a su procedencia.f. Elabore un breve informe en el que est su anlisis y las conclusiones de los resultados

    obtenidos de la comparacin de los dos grupos de datos.

    ACTIVIDAD ADICIONALConstruye el tablero de frecuencias de las series de datos presentadas en el laboratorio archivo

    EJERCICIOS_MEDIDAS_DE_TENDENCIA_CENTRAL.exe y calcula en cada uno de ellos susindicadores estadsticos estudiados. Presenta tu trabajo de manera formal en la siguiente clase.

    1.3.2. MEDIDAS DE DISPERSINEl anlisis estadstico o el estudio de una serie estadstica no puede quedarse slo en elclculo de las medidas de tendencia central o de posicin tales como la media, mediana, moda,percentiles, ya que no estaramos siendo absolutamente fieles a la realidad, suele existir datosextremos inferiores y superiores a la media aritmtica, los cuales no estn siendo bienrepresentados por este parmetro, hay veces que la media, por s sola, no es muy significativa.Adems puede ocurrir que series absolutamente distintas pueden tener medias iguales y estehecho no significa que las distribuciones sean exactamente iguales. Por lo tanto es necesarioprofundizar en su estudio, para lo cual se requiere ver si los valores de la variable estn muy o

    poco separados de la media aritmtica.La media aritmtica es ms representativa cuanto ms agrupados estn los valores de la serierespecto a ella y al revs y a la mayor o menor separacin de los valores respecto a la mediase le llama dispersin o variabilidad.Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientesindicadores o medidas de dispersin:1.3.2.1 Rango o recorrido1.3.2.2 Recorrido semi intercuartil1.3.2.3 Desviacin media

    1.3.2.4 Varianza1.3.2.5 Desviacin tpica o estndar1.3.2.6 Coeficiente de variabilidad.

    1.3.2.1 RANGO O RECORRIDOEs la medida de dispersin ms sencilla ya que slo considera los dos valoresextremos de una coleccin de datos, sin embargo, su mayor utilizacin est en el

    campo de la estadstica no paramtrica.Clculo del Rango

    R = XmaxXmin

    1.3.2.2 RECORRIDO SEMI INTERCUANTILLa desviacin cuartil de un conjunto de datos est definida por:

    Q = (Q3- Q1)/2Donde Q3y Q2son el primer y tercer cuartil de los datos. A veces se usa el Recorridointercuartil Q3Q1 El recorrido semi-intercuartil o desviacin cuartil, da una idea de la dispersin del 50%de los datos centrales. Suele utilizarse cuando la mediana es el ndice msrepresentativo.

    1.3.2.3 DESVIACIN MEDIALa desviacin media, mide la distancia absoluta promedio entre cada uno de los datos,y el parmetro que caracteriza la informacin. Usualmente se considera la desviacinmedia con respecto a la media aritmtica:Cuanto ms alta es la desviacin absoluta media mayor es la dispersin y menosrepresentativa la media aritmtica.

    Clculo de la Desviacin Media

    Para datos no agrupados

    n

    xx

    DM

    n

    i

    i

    1

    Para datos agrupados

    n

    fxx

    DM

    i

    m

    i

    i

    1

  • 7/26/2019 Estadistica Descriptiva Material 2014 Pgqt

    47/173

    47

    1.3.2.4 VARIANZA

    La varianza es uno de los parmetros ms importantes en estadstica paramtrica, sepuede decir que, teniendo conocimiento de la varianza de una poblacin, se haavanzado mucho en el conocimiento de la poblacin misma.Numri