Anal is is 001

Embed Size (px)

Citation preview

I n t r o d u c c i n

DESCRIPCION 1. 7 Por qu estudiar dstica? 1.2 B lenguaie de a estadstica 1.3 Estadstica descriptiva inferencia! 1.4 Inferencias y nes 1.5 El papel de la computadeduccioe esta-

OBIETIVOS

DEL

CAPITULO

En este captulo estudiaremos: > > > > > os dos significados La diferencia La dierena La dierena de! trmino estadstica. v una muestra. paramero. y estadstica inferencia! induc-

entre un poblacin

entre un estadsuco y un entre estadstica descriptiva la probabilidad

Cmo se relacionan cin y la deduccin.

y la estadstica

con ia

> >

Por qu es Importante

estudiar

estadstica. estadstica.

El pape! de ia computadora

en la

dora en la estadstica

a razn principal de que una empresa sea abandonada por sus cuentes es J L / u n mal servicio. Los directores y los profesionales del desarrollo organizativo tienen el reto de ayudar a sus empresas a mejorar el servicio al cuente, satisfacer al mismo y mantener el lugar de ventas. Segn un artculo de Stum y Church , la investigacin lo demanda; ellos- citan los siguientes hechos1

obtenidos mediante tcnicas estadsticas y que ilustran as distintas formas de usar la informacin estadstica para el manejo de la toma de decisiones. De acuerdo con un estudio de Forum, el motivo principal de que un cliente acuda a un competidor es un mal servicio. La American Management Associaon asegura que el 6 0 % de ventas nuevas deben provenir de clientes antiguos, que muestran lealtad de recompra. E l consultor R. L. Desatnick seala que, por ejemplo, en la industria automotriz un cuente leal representa un ingreso de 140,000 dlares a lo largo de su vida. L a Consumer Affairs Office advierte que siete de cada diez personas pueden suspender una relacin con un proveedor basndose en el tipo de trato recibido durante el primer contacto. La ATT reporta que el nmero de 800 lneas telefnicas usadas a menudo por compaas que desean proporcionar informacin o asistencia al cliente, crece anualmente un 25 por ciento. El Technical Assistance Research Project (TARP) afirma que una compaa nunca tendr conocimiento del 9 0 % de sus cEentes insatisfechos, aunque estas personas molestas les cuenten a otras 10 sus experiencias negativas, pero que cuando los clientes insadsfechos los emplazan legalmente, su lealtad aumentar significativamente si sus demandas se resuelven en forma satisfactoria.

2 i

Capitulo 1 Inmucar,

Seccin !.' Por qu estudiar estadstica! 3

Panorama

dei

captulo

Las personas \emos a estadstica oesde perspectivas distintas, suele vrsele como algo relacionado con porcentajes, promedios, cuentas y grficas; para algunos, ia estadstica es un rea de estudio consistente en reglas v mtodos para tratar informacin; oara otros, ia estadstica es una forma de actuar y de oensar con resoecto a los sucesos mundanos aue ocurren irregularmente v aue estn gooemados por ciertas ieyes de mcertidumbre. Este captulo introduce las ideas bsicas y e! lenguaje de la estadstica.

Como consumidores de informacin estadstica y usuarios potenciales de tcnicas estadsticas, necesitamos entender las ideas bsicas v las herramientas de esta disciplina. Muchos de nosotros estamos influidos diariamente por algn aspecto de la estadstica manejada en la informacin aue obtenemos de ia radio y de la televisin, o de peridicos revistas. Por ; ejemplo, podemos leer u or que: 1. Algunos estudios sugieren que alrededor de! 50% de todos ios ahoeamientos de adolescentes y adultos estn asociados con el uso del alcohol. 2. Las familias con slo uno de los padres constituyen actualmente el 26% de todas las familias estadounidenses con nios menores de 18 aos contra sioel 3% en 1970. 3. Siete de cada diez estadounidenses no tienen facultad de decisin. 4. El predominio de ia diabetes en personas con sobrepeso es casi ei mple que en personas sin sobrepeso. 5. Ms de 3,000 compaas aseguradoras pagan arriba de 8.800 millones de dlares anuales por reclamaciones. 6. Hay un 50% de probabilidades de que e! perdedor nunca ms vuelva a competir. 7. Los nios que cepillan sus dientes cor. la pasta dentfrica marca X tienen un 35% menos caries. 8. El importe neto medio de las jubilaciones recientes para los beneficanos de la Segundad Social de 1981 a 1982 estuvo entre los 64,700 y los 68.300 dlares para matrimonios y entre los 17,000 y os 30.000 dlares para los solteros. 9. En 1960 se estim que slo ei 1% de los estudiantes del ltimo ao de bachillerato haba probado la mariguana, mientras que en 1980 se estim que el 60% lo haba hecho. 10. Algunos estudios sugieren que el sentimiento de desamparo est correlacionado con una marcada disminucin de as clulas que combaten enfermedades en vanos sistemas inmunolgicos. Estos ejemplos indican que la informacin estadstica se usa por una gran cantidad de razones. Entre ellas encontramos: I Informar al pblico, como en los ejemplos anteriores. Proporcionar comparaciones, ejemplos 2,4. 8 y 9. Explicar acciones que se han efectuado, ejempios i. 4 y 10. Influir en decisiones que han de tomarse, ejemplos 1 y 7. Justificar un reclamo o afirmacin, ejempios 1 . y 10.7

SECCION

7.7

Por qu estudiar

estadstica?

Existen cuando menos cuatro buenas razones para estudiar estadstica, al hacerlo seremos capaces de: 1. Aprender las reglas y mtodos para tratar informacin estadstica. 2. Evaluar y cuancar la importancia de los resultados estadsticos que veamos publicados. 3. Conocer los aspectos dei pensamiento estadstico como un componente esencial de una educacin humansdca. 4. Entender mejor ei mundo real de nuestro entorno. Quiz una de las razones ms importantes para estudiar estadstica en este nivel, sea que nos permite tomar crticamente la informacin estadstica proporcionada por los medios de comunicacin, por ejemplo, consideremos las afirmaciones siguientes hechas en algunos anuncios en estos medios. Usaremos X en lugar del nombre de una marca comercial: 1. La llanta marca X trena un 35% mas rapidcrr^MaTrapidcrque qu?) 2. En un periodo de euauo aos, el rendimiento de la gasolina para el coche X aument en 50%. (50% de qu'') 3. El jabn marca X es 99.44% puro. (Puro en qu El jabn?)1

4. Noventa por ciento de todos los coches de la marca X vendidos en los ltimos 10 aos estn todava en circulacin. (Con esta afirmacin, supondremos enneamente que los coches se vendieron en aproximadamente ei mismo nmero todos los aos, pero muchos de los autos en circulacin fueron adquindos durante los lmos tres o cuatro aos.) 5. El calmante marca X contiene el doble de calmante. (Significa eso que caima ms eficazmente el dolor que cualquier otro calmante )11

6. Cuatro de cada cinco dentistas interrogados declararon preferir la pasta dentfricaX. Cuntos dentistas fueron interrogados? Cmo fueron escogidos'.') 7. Ninguna aspirina caima mejor el dolor que ia de marca X. '.Esta afirmacin no dice que ia marca X sea mejor que cualquier otra, slo dice que a marca X es tan buena como cualquiera otra, i i Las mujeres que usan ia marca X reportaron un 30% de aiivio curante las Dnmeras horas. Puede medirse ei aiivioen trminos de porcentaje.' Que significa esto''1

Predecir futuros resultados, ejempio 6. Estimar cantidades desconocidas, ejemplos i y 9. Establecer una relacin o asociacin entre dos factores, eiempios 1.4 y ] 0. Como somos consumidores de informacin estadsuca. podemos usar ia

estadstica para estudiar y entender mejor muchos sucesos cambiantes que contribuirn a nuestracomprensin ael mundo. Estudiarestadstica nos permitir dar una interpretacin razonable a cada uno de los ejempios antenores; asi. ia cantidad 55% del ejemplo puede interpretarse libremente porque no conoce7

9. El calmante marca X es recomendado por mucha de ia gente ms conocedora..Ms conocedorasoore que? 'Sobre cualquier tema?

4

i

Capitulo 1 Introduccin

Seccin 1.1 iPor qu estudiar estadstica"! mos la base de la umparxin: puede ser difcil si no imposible, encontrar una pasta de dientes que permita tener 3 5 % menos caries que cualquier otra pasta de dientes cuando se prueoa bajo condiciones similares en grupos de runos semejantes e independientes, pero sera extremadamente simple encontrar un nio que use pasta de la marca X y ,ue tiene ?5 r menos canesc

5

vanos

iidad: .t tipo de programa de ejercicios permitir calificar a un asegurado para -:> obtener una prima reducida?, de cunto debe se: la reduccin? y qu factores de nesgo deben descalificar a un asegurado enrolado en un programa de ejercicios para obtener una reduccin en ia pnma? Una persona con una slida formacin estadsnea es quien podr asesorar a la compaa de seguros para evaluar los mritos dei nuevo programa. EJEMPLO 1.4 Qu papel juega la dieta en las afecciones cardiacas de coronaria? Durante casi dos generaciones se ha debatido el papel de la dieta en as afecciones cardiacas de coronaria. La teora dieta-corazn afirma que la reduccin del colesterol en la sangre mediante la dieta disminuye elriesgode contraer alecciones cardiacas de coronaria: para probar parcialmente la relacin entre la reduccin del colesterol en la sangre y las afecciones cardiacas de coronaria se emprendi un estudio que utiliza el frmaco colesterarmna. medicamento reductor del colesterol. Ei estudio utiliz a 3,800 hombres de edad intermedia; todos teman niveles de colesterol en ia sangre de al menos 265 miligramos por decilitro de sangre, que los colocaban dentro del 5% de . | ! ; ; I I | i adultos estadounidenses con ms altos niveles de colesterol. y se encontr que todos estaban libres de cualquier sntoma de afecciones cardiacas de la coronaria al empezar el estudio. Mil novecientos hombres fueron asignados aleatoriamente a cada uno de los dos grupos: un grupo con tratamiento y un grupo de control. Los pamcipantes en el grupo con tratamiento recibieron dosis diarias de colestiramina y una dieta para reducir el colesterol, durante 7.4 aos en promedio, mientras que los participantes en el grupo de control no recibieron colestiramina, sino un placebo indistinguible de sta. E! estudio concluy que el grupo con frmaco tuvo menos ataques al corazn (155 personas contra 187 del grupo de control) y menos muertes por ataques al corazn (30 personas contra 38). Se juzg que la diferencia entre los dos grupos es estadsticamente significanva; la probabilidad no se debe slo'a factores de suerte, los hallazgos apoyan la creencia de que la reduccin de colesterol en la sangre usando colestiramina en hombres de edad intermedia con niveles de colesterol superiores a 265 miligramos, es eficaz para reducir las afecciones cardiacas de coronaria/ EsbuenaianuevaCocaCola?Apnncipiosde 1985. la compaa Coca Cola anunci i ;;

que algn otro nio, por ejemplo uno que no se los lava. Como consumidores cotidianos de informacin estadstica, debemos estar conscientes de los usos y abusos en ei manejo de dicha informacin. En este curso aprenderemos FIGURA 1.1 cmo puede obtenerse cada uno de los nmeros mencionados en los ejemplos de esta seccin. Como consumidores de informacin estadstica encontramos con frecuencia grficas que la proporcionan. Por ejemplo, los padres han gastado aproximadamente 142.700 dlares en un hijo cuando ste llega a los 17 aos. La grfica de pastel de la figura 1.1 indica cmo se ha distribuido ese dinero": podemos ver de un vistazo que de! presupuesto total, los gastos debidos a comida, vivienda y transporte tienen montos ms o menos iguales y los hechos en diversiones, atencin mdica y varios, tambin tienen montos casi iguales. Como usuarios potenciales de los mtodos y tcnicas estadsticos, necesitamos estar familiarizados con el quehacer de la investigacin estadstica bsica, con la descripcin de los resultados de nuestra bsqueda cientfica, con la toma de decisiones basadas en sta y con la estimacin de cantidades desconocidas. Los ejemplos 1.1.1.2 y 1.3 ilustrarn cmo puede usarse la estadstica en general, y los ejemplos 1.4, 1.5 y 1.6 mostrarn aplicaciones de la estadstica que responden a cuestiones de inters general.

Cmo se gastan 142,700 dlares para mentener a un nio hasta los 17 aos de edad

EJEMPLO

1.1

; En comercial de televisin se afuma que una marca de un producto es supenor a todas las otras marcas: si la afirmacin se basa en una encuesta cientfica se estar usando para educar a los televidentes; pero si dudamos de la afirmacin, en un intento : para desmentirla podemos recopilar datos relevantes sobre todas las marcas del ; producto en cuestin, analizar los resultados usando procedimientos estadsticos : apropiados y tomar una decisin respecto a a afirmacin del anuncio. Con frecuencia ' las afirmaciones de los anuncios se basan en informacin insuficiente o en anlisis defectuosos de la misma. EJEMPLO 1.5

que estaba cambiando en secreto la frmula para fabncar esa bebida, una frmula que haba usado desde 1886; luego de que la nueva Coca Cola fue lanzada al mercado. los miembros de Consumer Reports intentaron responder preguntas como stas: a qu sabe realmente la nueva Coca Cola?, es mejor que la antigua? y cmo se compara con la Pepsi Cola? El equipo de invesugacin realiz tres pruebas de sabor a ciegas con 95 de sus miembros y 532 copas de plstico. Los resultados del estudio no mostraron diferencia en los gustos entre Pepsi Cola y la nueva Coca Cola; ambos productos fueron preferidos sobre la vieja Coca Cola por un margen de 2 a 1. Se encontr que las tres frmulas consistan en cerca de 99% de agua carbonatada y azcar, cada una con entre 6.14% y 6.22% de fructosa y entre 4.54% y 4 7 3 % de dextrosa azcar de maz." Tradicin y otros factores humanos diversos pueden afectar as preferencias de los consumidores; aunque el experimento parece indicar que la nueva Coca Cola es superior en sabor a a anngua. ia Coca Cola clsica esta desplazando a ia nueva en muchas regiones'eEstadoyUniosv-

EJEMPLO

1.2

Suponga que queremos determinar quin es el mejor maestro del Excel College. Cmo debemos proceder para hacerlo'.' Podemos preguntar a los estudiantes de Excel quien es ei mejor maestro, anazar los resultados y llegar a una conclusin. Debemos preguntara cada estudiante?, cmo debe conducirse laencuesta?. como se analizar la informacin? y de que manen se determinara quin es ei mejor maestro' Uno de los prooositos centrales de a estadstica es dar respuestas a estas y a otras preguntas.

EJEMPLO

1.3

Una compaa de seguros de vida esta pensando onecer primas reducicas a los aseguraoos que se enroien en un programa de ejercicios. Para ayudar a ia compaa ae seguros a tomar ia decisin, se recolectar y analizara informacin sobre mona-

EJEMPLO

1.6

Daa ei humo del tabaco a ios no fumadores? Se sabe desde hace mucho que a ios fumadores es hace dao fumar. Para determinar si ei humo dei tabaco es daino para los no fumadores, en ia Universidad de California en San Diego se realizo un estudio

6

Capitulo Introduccin

tecin 1.2 El lenguaje dla estdisiica 7

-asado sn pruebas sobre funciones pulmonares: estas pruebas fueron realizadas en .".. Note que en este ejemplo las instrucciones I SET Cij y i M E A N C l son

El papel de a computadora

en k estadstica

las rdenes dadas por e! usuano. A l final de cada orden el usuario debe oprimir la tecla de entrada, enter o return para que ingresen las rdenes en el sistema de la computadora; este modo de comunicacin con el sistema de la computadora es la razn de que a MINTTAB se le llame sistema operado mediante rdenes, en oposicin a un sistema operado por men, donde la seleccin en el men da lugar a una accin particular de la computadora.

Con la introduccin de las microcomputadoras. ei trabajo pesado de clculos asociado con un gran nmero de datos y con anlisis complicados, ha sido relegado a ias computadoras. Como las manipulaciones tediosas de os datos se hacen con la computadora, el usuario puede concentrarse en ei anlisis de los resultados. Hay muchos programas computacionales amigables disponibles en el mercado que permiten a los estudiantes y a los especialistas realizar los clculos estadsticos tediosos con poca o ninguna dificultad. Algunos de los programas ms usuales incluyen MINTTAB. SPSSx, SAS. B M D P y SYSTAT. Todos permiten al usuario comunicarse con el sistema de la computadora mediante comandos sencillos. En este texto hemos escogido usar MINTTAB para ilustrar las aplicaciones estadsticas que utilizan computadora. Este programa, desarrollado originalmente en la Pennsylvania State University como una herramieriia para ensear estadstica, hoy en di? se usa omni'.a^.Ca.t t ^ i t o en la enseanza ccmo-en-ut ' W' ~ii-:>hm n

MTB

>SET C l

DATA > 34 68 39 21 42 DATA > END MTB > MEAN C l MEAN = 40.800 MTB>

en todo Estados Unidos; puede instalarse en

Las computadoras son herramientas muy eficaces cuando se necesita procesar una gran cantidad de datos, realizar alguna tarean forma repetitiva o cuando los resultados deben analizarse rpida y cuidadosamente. Los problemas que se encuentran en este libro utilizarn conjuntos de datos relativamente pequeos; pero aun as algunos de los clculos pueden resultar tediosos en una calculadora; es deseable que se entiendan los clculos manuales hechos en el texto y realizar cada una de sus etapas en forma sucesiva al resolver muchos de los ejercicios. Una vez hecho esto, usted comprender los usos y las limitaciones de cada procedimiento. Tambin ser capaz de entender e interpretar los resultados que ellos proporcionan; si usted tiene acceso a una computadora, puede usar un paquete estadstico, como NNIT.AB. para efectuar procedimientos similares en el futuro. Muchos de los conjuntos de datos, en las aplicaciones prcticas de este

umaades centrales de procesamiento, as como en mim y microcomputadoras, ya que ofrece una gran capacidad de clculo tanto para el estuoiante como para el investigador de la estadstica. MJNITAB es un programa interactivo operado mediante ordenes; una vez cargado en la computadora, el usuario se comunica con el sistema y da ordenes que son ejecutadas de inmediato. Es muy fcil de usar. La aparicin del smbolo MTB > en la pantalla del monitor le informa al usuario que el sistema est listo para aceptar una orden de un dispositivo de entrada, como el teclado. Despus de que los datos se han introducido en ei programa, ei usuario da una orden oprimiendo la tecla de entrada y el sistema proporciona inmediatamente el valor deseado.

La pantalla 1.1 muestra las rdenes de MlNlTAB y las correspondientes respuestas usadas para determinar la media i promedio i de

texto, se usan para mostrar en pantalla el uso de M I N I T A B y cumpiir al menos cinco propsitos: 1. ilustrar la sencillez del uso de M1NIT.AB. 2. Visualizar las rdenes que debe proporcionar ei usuano para lograr los resuitados estadsticos deseados. 3. Conocer ei formato y a notacin usados en ias resouestas de a computadora. ~. Saber ia magnitud de a potencia de calcuio estadstico disponible con MINiTAB y con otros paquetes estadsticos. 5. Ensear ei uso de MINTTAB en ei desarrollo de algunas tareas estadsucas.

las curas 34.68.39.31

y 43. Despus

del smbolo del sistema MYB >. ei usuario escribe 5ET Cl y presiona ia tecla ue entrada ta computadora no se entera de la orden sino hasta que ia tea; de entrada es opnmidai. Esta accin informa a MlNlTAB que debe crear una columna, identificada en la memoria como C!. que contendr Sos datos. Ei sistema responder con ei

simDoio DATA">: aqu el usuario escribe ias

curas: 54. oS. 59, 2! y 42. . ocnme

ia tecla de entrada oara registrarlos en la memoria del sistema, conde se usan espacios en vez de comas para separar os nmeros; a comoutaoora responde otra vez con ei simooio DATA > y como no habr mas informacin, ei usuario escr.be LVD para

^& i

Capitulo ! introduccin

REPASO

')EL

CAPITULO

TRMINOS IMPORTANTES

I

Los trminos siguientes, pertenecenies al captulo, se han mezclado para proporcionar una prctica ms eficaz. Para cada uno d una definicin con sos propias palabras; despus verifique sus respuestas con ias proporcionadas en el texto.or

2DESCRIPCION 2.7 Datos: los bloques de a construccin 2.2 Organizacin estadstica de da> > > grfica > > rae tos mediante afa/as 2.3 Representacin de datos

Estadstica o r g a n i z a c i n de

descriptiva: datos

en

estimar estadstica descriptiva estadstica inferencial estadstica confiabilidac

sistema operado por induccin poblacin estadstica parmetro

rdenes

deduccin inferencia muestra MINITAB

OBJETIVOS

DEL

CAPITULO

En este captulo estudiaremos; Datos. Dos tipos generales de datos. Datos clasificados segn el upo de escala de medicin usado. Cmo organizar y resumir los datos mediante abas. Cmo mostrar los datos mediante distintos tipos de grficas. ^*?sw^^-w!

I I I I C B S B ^

e realiz un estudio dividido en dos partes con dos muestras a fin de medir 1,300 usuarios de una vasta regin que inclua Estados Unidos. Canad y Gran Bretaa; la otra muestra const de cerca de 900 personas prestadoras de servicios representantes de nueve organizaciones diferentes. L a primera parte de los cuestionarios del estudio se construy sobre 17 aspectos del servicio al cliente y los entrevistados se refirieron a cada aspecto en dos niveles: importancia y pericia. Los niveles de importancia preguntaban a los entrevistados: "Qu tan importante considera usted que es esta dimensin para un servicio eficiente al cliente?" Las respuestas posibles iban desde 5, extremadamente importantes, hasta uno, no importante. L a encuesta sobre pericia preguntaba a los entrevistados: "Qu tan bien cree usted que el personal de prestacin de servicios al cliente aprovecha este aspecto cuando interacta?" En donde las respuestas iban desde 5, siempre lo aprovechan bien, hasta uno, nunca lo aprovechan. L a segunda parte del estudio se dise para medir el impacto del servicio al cliente sobre la decisin de los consumidores de repetir e! negocio; una pregunta era: "Cunto influye un buen servicio en su decisin de volver a tratar con esta organizacin?" En la escala de cinco puntos, las respuestas iban desde 5, tiene un gran efecto, hasta uno, poco o ningn efecto. Una segunda pregunta a los entrevistados era: "Qu tan seguido comenta usted con otras personas si recibi un servicio a clientes excelente o malo?" Las categoras de respuestas fueron "nunca", "ocasionalmente" y "con regularidad". Los resultados indicaron que el sentir de ios cuentes sobre la calidad del servicio difiere del sentir de los prestadores de servicios. La tabla 2.1 lista los puntajes medios delssntii- dt losclkntes-y de^prnonai de servicios al cuente para 5 de ios 17 aspectos del servicio al cliente; las figuras 2.1 y 2.2 muestran el impacto del servicio al cliente en los negocios. En este captulo, conoceremos distintas clases de datos y como organizados y presentarlos usando tablas y tambin grficas, como aqu.

18 Estadstica aescripth-a: organizador oe aos

Seccin 11 Datos: los bloques de construccin de a estadstica

,

19

TABLA 2.1 Puntajes de clientes y personal de prestacin | de servicios.Aspecto Comunicacin Sensibilidad del cliente Capacidad de decisin Conocimiento del trabajo Motivacin para servir a ios clientes

Muestra de clientes

Muestra de^stadores j de se ;':. _'5

EJEMPLO

2.1

Ejemplos de datos cuanmavivos son ei peso dado er. los. ia edad en aos, ia iongiruc en centmetros, el voiumen en metros cbicos, el precie en pesos. Los datos cualitativos representan categora atributo -cus -jueden clasifi>

Importancia

4.05 i$2 3.S4 4.10 3.97

Provecho

mponancia

2.95

4.55 -.38 4.34 4.54 4.27

Pxveeho carse sesn un cnteno o cualidad. Ejempios de datos cualitativos son ei sexo: hombre, muier: e! coior: roio. verde, azul, la religin: catlica, protjame, juda: ei upo ae sangre: A. 8. AB. 0: ia marca favorita de coche: Ford. Chevrolet; o una marca de comoutadora: IBM. Kavprc

2.67 2.96 2"?

'

3.53 3 56 3.32 EJEMPLO.

i

!

| FIGURA 2.1 I Efectos de un buen serj vicio Muestra de contacto personal con clientes

Gran efecto

moderado

Efecto

Poco 0 ningn efecto

Zenith. Compaq. Los datos consistentes en nmeros se pueden clasificar en trminos cuantitativos o cualitativos, dependiendo de cmo se usen. Si se usan como una etiqueta para propsitos de identificacin, son cualitativos; en otro caso, son cuantitativos vase el ejemplo 2.3); sin embargo, algunas mediciones pueden hacerse mediante escalas cuantitativas o cualitativas, como en el ejemplo 2.4. EJEMPLO 2.3 Si un nmero de sene de un radio se usa para identificar e! nmero de radios fabricados hasta ese momento, ser una medida cuantitativa, pero si se usa sio para propsitos de identificacin, es un elemento de informacin cualitativa. EJEMPLO 2.4 Si ia estatura de un individuo se mide en pies y pulgadas, entonces la informacin es cuantitativa: pero si se mide como bajo, medio o ano. es cualitativa Ademas, la estatura puede medirse usando datos cuantitativos, pies \, pero representarse por datos cualitativos, bajo, medio o alto. Los datos cuantitativos pueden clasificarse como discretos o continuos.

9< 7 S3%

2%

4? e refieren a iniorrr.acion numence. ono cuentov

de datos continuos, pero e: nmero de personas en ana piau un rvr. de -emarii concurrido no sena continuo poraue es una cantidad que > se ?uede cenia:.

cuanto.-. < se miaer, en una escala numrica.

20

Estadstica descnpt/va: organizacin de dalos

Seccin 2.7 Datos: los bloques de construccin ae U estadstica

i

21

Cualquier proceso de medicin que proporcione dates continuos est mitado por la precisin dei instrumento de medicin utilizado. Por ejemplo, si un instrumento es preciso hasta los dcimos de pulgada y se usa para medir la altura de un individuo, entonces hay slo un nmero finito de medidas posibles que pueden obtenerse y ias estaturas asi medidas se redondearn hasta dcimos de pulgada Una medida de este tipo representa una aproximacin a la medida real. Las medidas reales son tericas.y representan dato* continuos, mientras que las medidas aproximadas son datos discretos poraue hay slo un nmero finito de formas de medir algo con un instrumento de precisin dado. E n realidad, todas las medidas fsicas son discretas: ia restriccin de una precisin limitada se aplica slo a los instrumentos de medicin, no a los datos: stos son de naturaleza continua y se redondea su valor de acuerdo con la precisin de los instrumentos usados para obtenerlos. Nuestro propsito principal al analizar datos es efectuar una interpretacin que tenga sentido. Como regla general, la cantidad de informacin contenida en los datos depende de su naturaleza: las dicotomas cuantitativo-cualitativo y discreto-continuo no siempre son adecuadas para la clasificacin de datos segn la cantidad de informacin que contienen: los datos tambin se pueden clasificar segn la escala de medicin o el procedimiento que los gener. Considere el dgito 4 en las siguientes situaciones: ai El nmero de la camiseta de ftbol de Juan es el 4. b) Juan su en ei 4 gradee c) Juan registr la temperatura como 4 Celsius. d) Juan cultiv un pepino que midi 4 pulgadas de largo. Estas situaciones representan cuatro niveles distintos de informacin, resultantes del uso de escalas diferentes de medicin. La medida en la situacin del inciso a, por ejemplo, se usa slo para identificar o clasificar a Juan como el jugador de ftbol nmero 4; el 4 grado en ei caso de la situacin del incisoo

Las situaciones vistas de a a d son representativas de cuatro .o ie escalas de medicin que discutiremos con detalle porque el tipo de escala de medida usada determina ia cantidad de informacin contenida en cualquier dato proporcionado. Cuatro tipos de escalas de medicin usados en estadstica 1. Normai 1. Ordinal 3. De intercalo 4. De razn

Escala

nominal^

Existen escalas nominales tanto para los datos cuantitativos como para los cualitativos. Una escala nominal para datos numricos asigna nmeros a ias categoras para distinguirlas como en el ejemplo 2.7. Una escala nominal para datos cualitativos, como en ei ejemplo 2.S. es un agrupamiento no ordenado de los datos en categoras discretas, donde cada dato puede incluirse solamente en uno de los grupos. Las escalas nominales se usar? principalmente con propsitos de identificacin o de clasificacin.

EJEMPLO

2.7

Emre ios atos numricos que son nominales se incluyen ios nmeros en las camisetas deportivas, los nmeros de cdigo de las zonas postales, los nmeros telefnicos y los puntajes de ftbol americano. 6 puntos por un touchdown. i punto por la patada extra. 2 puntos por una escapada exira y 3 puntos por un gol de campo.

EJEMPLO

2.8

Los datos nominales que son cualitativos incluyen el gnero, la raza, ei tipo de sangre y la religin.

Escala

ordinal

Los datos medidos en una escala nominal ordenada de alguna manera s denominan datos o r d w k s Una escala ordinal coloca las medidas en categoras, cada una de las cuales ndica un nivel disnto respecto a un atributo que se est midiendo.

b, tambin es una clasificacin, pero da ms informacin porque nos da el nivel del grado, ms avanzado que el 3 grado y menos que el 5. aunque quo

tanto ms o menos es algo que no podemos medir. En la situacin del inciso c. de nuevo vemos niveles de comparacin, pues 4 indica que la temperatura es ms alta que una temperatura de 2 Celsius y ms baja que una temperatura de 7 Celsius. Es ms, una temperao

EJEMPLOo

2.9

La lista de datos ordinales comprende: 1. Clasificaciones por letra: A. B, C. D y F; estos grados indican categoras de perfeccionamiento, as como os niveles alcanzados. 2. Rangos acadmicos: instructor, asistente de profesor, profesor asociado y profesor, donde un profesor nene mayor rango acadmico que un instructor. 3. La numeracin de ias casas en ias calles: caile Norte 42. calle Norte 42; \ as sucesivamente. La casa correspondiente al domicilio calle Norte 423 se localiza entre as casas iocaiizaoas en caile Norte 421 \e Norte 423. 4. La evaluacin de un maestreo: pobre, razonable, buena y superior. 5. Los raaos ae a escueia: primero, secundo, tercero, etctera.

tura de 4 Celsius es 1.5 ms alta que una de 2.5. porque la diferencia entre 4 y 2.5 es 1.5. Sin embargo, una temperatura de 4 Ceisius no es ei dobleo o

de caliente que una temperatura de 2 Celsius.o

Finalmente, en el inciso , la medida 4 identifica al pepino como miembro de una ciase de pepinos que miden 4 pulgadas de largo; sabemos tambin que este pepino es ms iargo que uno de 3 pulgadas de longitud, que excede de pulgada a uno ae 3 y que es ei doble de iargo de un pepino ae 2 pulgadas de longitud.

.

J U

i , uescnotrva: orzanuadn ae datos

Seccin 2.7 Datos.- los bloques de constmKn .le i estadstica

21

No es posible determinar ia diferencia o distancia entre ios valores medidos en uoa -escala-ordinal.-.Ajm cuando solemos codificar ia letra dei grado A como 4. B como 3. C como 2. D como 1 y F como 0. nc diramos, por ejemplo, que una A es el doble de buena que una C o que un estudiante con A sabe el doble ae un estudiante con C. iodo lo que podemos decir es que ia calificacin A es mejor o de un grado supenor a la C. yaque una escaia^ ordinal no admite unidad de distancias \\': SAPLO 2.11

ausencia completa de calor, 'a escaia Cetsius no es una escala de razn; r..-r otra pane, la escala Keivin de temperatura, donde 0 K corresponde a -273* C. es un ejemplo de una escala de razn e temperatura.

Las escalas de razn incluyen escalas usadas comnmente para medir unidades como pies, libras, dlares y centmetros: los resultados de contar objetos tambin son datos de razn: diez manzanas es ei doble que cinco manzanas. Con una escaia de razn, una persona que pesa 200 libras siempre pesara ei doble que una persona de O libras, aunque se use otra escala de razn, como onzas, gramos o kiios.

Escala de intervalo

Los datos medidos en una escala ordinal para los cuales pueden caicuiars* las distancias entre valores, se llaman datos de intervalo. L a distancia^ ntre dos valores es importante y ios datos de intervalo son cuantitativos por necesidadr'una escala de intervalo no siempre tiene un punto cero, un punto que indique la ausencia de o que se quiere medir. I APLICACIN 2.1 ' i '

Suponga que se hace una encuesta a un grupo de maestros con respecto a su religin y que 15 son protestantes, 2 i catlicos y 7 judos. Qu tino de datos0

son stos Solucin:

1

La respuesta de cada profesor es protestante, catlico o nidio v

EJEMPLO

2.10

Las listas de datos de intervalo comprenden: 1. Puntajes en las pruebas de inteligencia: un puntaje de inteligencia de 110 es cinco puntos supenor a uno de 105 (datos ordinales i. En este caso, no solo podemos decir que un puntaje de 110 es superior a uno de 105, sino que tambin podemos decir que es cinco puntos ms alto; pero no podemos decir que una persona con un puntaje de inteligencia de 180 es doblemente lista que una persona que tiene uno de 90. y una determinada diferencia entre dos puntajes de inteligencia no siempre tiene el mismo significado; por ejemplo, las diferencias entre 100 y 90 y entre i 50 y 140, pueden tener interpretaciones d^atas-awique^nbflrsean iguales a 107Aunque una persona con 140 es ms inteligente de acuerdo con la prueba de inteligencia que una persona con 100. no podemos decir que quien tiene un puntaje de 150 es tanto ms inteligente que una persona con 140. o que lo es una persona con un cociente ae inteligencia de 100 respecto a una persona con uno de 90. 2. Temperaturas Celsius. Una temperatura de 80 es 40 ms caliente que una temperatura de 40. pero no es correcto decir que 80 es el doble de caliente que 40, Ntese tambin que una temperatura de 0 no representa la ausencia i GRUPO DE EJERCICIOS Habilidades bsicas 2.1

estas respuestas constituyen datos nominales de categoras o cualitativos: por otro lado, los nmeros 15, 21 y 7 resultan de contar los datos cuantitativos. Las cifras obtenidas al realizar operaciones con datos, como la suma, no deben confundirse con la coleccin de datos.

Es importante ser capaz de clasificar datos de acuerdo con ia escala de medida usada. A l realizar una inferencia sobre una poblacin ue inters, as tcnicas usadas dependen de! tipo de escala medida. Por e;empio. si se trabaja con una muestra de datos ordinales, debe utilizarse una tcnica estadstica que use datos ordinales: al clasificar los datos segn ei tipo de escala de medida usada, el investigador puede identificar la mejor estadstica para analizar los datos.

j ^

^ C22T

HCn?" Q

total de calor. El punto cero en la escala de temperatura Celsius fue escogido arbitranamente como el punto de congelamiento e indica que est presente algo de calor. Tencameme. -273 C representa ei mnimo absoiuto de temperatura, la temperatura en laque ias molculas de una sustancia se mueven a una velocidad casi de cero. 3. Fechas. Ronaid Reagan fue investido como el 40" presidente de Estados Unidos en 981.192 aos despus de George Washington - 7789' Podemos especificar ia distancia entre estos dos sucesos oroenados. i92 aos, pero si existiera el ao cero, no representara ia ausencia de tiempo.

1. Clasifique los datos siguientes en cuantitativos y cualitativos: CcC^Aa) Estaturas en pulgadas de cinco jugadores de basquetbol. o r f \ Peso en onzas de doce pollitos. Ouoii ci Clasificacin tnica de empicados. CwW di Nmeros telefnicos de amigos.

d i Fechas de cumpleaos de ios miembros de su familia. 3. Gasifique os datos siguientes come discretos o continuos: c\. Ei numero de defectos en caca umeau ue un ote ue cOcocnes nuevos, p; Puntales de matemticas en u prceca ue aptitud

JN/* \yO

2. Clasifique tambin como cuantitativos o cualitativos: C U a) Calificaciones numer.cas PPG ce os miembros ce a c;ase eiementcu. C C A * ^ Ccactones con erra de 15 estudiantes cei grupo 209 ae filosofa,

acadmica de 30 alumnos dei iraw ao de preparatoria. -' DisQiKia-en yaraas recorrida por ur. mediocimpista en cada juego amanee ta iama ;er.coradu. C^c Peso oerdiuo en libras por 20 personas aebicc a una dieta.

Escala de razn

i

Los datos medidos en una escaia de intervalo con un pumo cero aue stgruii "ninguno", se laman, datos-de-raron^con datos medidos en una escaia de razn, podemos determinar cuntas veces es mayor una meaida que OUE.

24

Estadstica descriptiva: oraritnn de datos

Seran 2.2 Organizadn de datos mediante tibias 25

4. Clasifique ios datos siguientes como discren.s o continuos: (*3 a) E! numero de carreras anotadas en caria juego por Ies Piratas en ia temporada de 1900. C b) l.r.s sueldos ganados en el ltimo mes por 50 directores de nsututos. C l c) Las temperaturas promedio dianas de los ltimos 30 das. (~ di El nmero de granos de arena en cada una de i 00 playas. La tabla siguiente connene la distribucin de vehculos registrados en Excel College. ct Clase Tipo dec V

Diga si la informacin ante;. es cuar.ctanva o : caaniativa. D i Clasifique ios datos de cada categora como discretos, continuos o cerno ninguno de los dos. c: Ordene ia informacin como nominal ordinal, ae mervaioocerazon P,W\

es ennde, ei arreglo puede ser difcil de manejar o de comprender: por eso a menudo se usan tablas como una aproximacin general a la organizacin de datos en bruto. En esta seccin estudiaremos vanos tipos de tablas usadas para organizar datos: en ia seccin 2.3 discutiremos medios grficos para mostrar datos no agrupados organizados en forma tabular. E l upo de datos nominal, ordinal, de intervalo o de razn determinar la forma en que se coloquen. La frecuencia de una medida o de una categora, es ei numero de veces, que aparecen en una coleccin de datos.,, El uso de frecuencias es mis conveniente para datos cualitativos o discretos: el smbolo / se usa para denotar ia frecuencia de una medida. L a muestra de datos siguiente representa el nmero de tiros libres fallados por un equipo de basquetbol durante los ltimos siete juegos:7 2 i

La sura de abate muestra una escaia numrica para medir la efectividad de ia enseanza.

Cifra

i QV Necesita meiorarse

1

i Verdaderamente extraordinana

Efectiva y competente

vehculo Coche Camioneta ; Motocicleta

registrada

\ 7

;

& 25 10

a) Identifique el tipo de escala de medicin. b) Suponga que 30 estudiantes usan esta escaia para evaluar a su maestro de estadstica. Sera ms fcil interpretar esos resultados que ios que se obten dran si los 30 estudiantes evaluaran a su maestro mediante una opinin escrita de respuesta libre Explique. 8. Los estudiantes de una universidad se clasifican como de pnmer ao, de segundo ao. de penlumo ao y de ltimo ao. Qu tirio de escala de medicin es sta? TABLA 2.2 9. D un ejemplo distinto de los mencionados en ia seccin de una escala ordinal para datos cuantitativos. 10. Toda informacin numrica proporciona datos cuan6 1

E! nmero

7

aparece con una frecuencia de / = 2. 2 aparece con una fre-

cuencia de / = 3. 8 y 4 aparecen con una frecuencia d e / = 1. Existen dos tipos generales de tablas para reportar datos usando frecuencias, stas son: t a i s r d e T f t c u e n c i a s n o a g r u p a d a s y t a b l a s d e f r e c u e n c i a s5

o 4

l Bicicleta

/ a) Clasifique los datos de cada una de las tres columnas como cuanntativos. / b) Identifique los datos de la tercera columna como discretos o continuos. " ~ , c) Determine ios datos de cada una de las tres columnas como nominales, ordinales, de intervalo o de razn. 6. El Memorial Hospital registra la informacin siguiente de cada uno de los pacientes: A, nmero de segundad social f ^ fecha del ltimo ingreso , fecha de nacimiento C compaa de seguros C A patrn direccin particular telfono particular 11.

g r u p a d a s . ' A m b a s tablas se mencionan como t a b l a s d e f r e c u e n c i a y estudiaremos primero las tablas de frecuencias no agrupadas. Tablas de frecuencias no agrupadas * Los datos sobre tiros libres citados anteriormente pueden resumirse como lo muestra la tabla 2.2. donde x denota las medidas y / , la frecuencia de cada medida; la tabla 2.2 es un ejemplo de una tabla de frecuencias no agrupadas para datos discretos.

Tabla de frecuencias de datos sobre tiros libres 7

titauvos? Por quG

0

N O

APLICACION 2.2

Construya una tabla de frecuencias para los datos siguientes, correspondientes al nmero de faltas a ciases durante el periodo de otoo de 1988 para estudiantes inscritos en la materia Estadstica 101. y2 1 ~ 2

G

Toda informacin no numenca nos ofrece datos cua5i

litativos? Explique.

8

7

S a5 3

32

i ? 3: i 5 6 J 3 20

1 0

SECCIN 2.2

Organizacin

de datos mediante

tablas

9

9

-

a

3

5 5

9 "

El objetivo de la organizacin de datos es acomodar un conjunto de datos en iorma til para revelar sus caractersticas esenciales y simplificar ciertos anlisis. Los datos que no estn organizados se denominan datos no agrupados. Una manera de acomodados es construir un arreglo ordenado: esto es. acomodando ios datos de abajo hacia amba o ai revs: si ei numero de datos Solucin: Como paso intermedio usaremos m a r c a s d e c u e n t a para ayudar

a determinar ia frecuencia / de cada observacin, donde .r representa el numero de faltas.

26

saoi'stca escrip&f: organizacin de ditos

Seccin 2.2 Organizacin de datos mediante labias

27

escala / intervalo, y para cantidades grandes de datos que no se midan con V al meri :na escaia de intervalo, debe usarse una tabia de frecuencias no agrupadas. Supongamos que el Memorial Hospital quiere saber si su servicio en la sala

ii mi mi ni mi

de emergencias es adecuado. Para empezar el estudio, ei gerente dei departamento corresponente registra el nmero de personas que ocupan la sala de emergencias cada da durante un periodo de 12 das, con los resultados siguientes: Da i 2 3 4 5 6 " 36 8 18 9 23 10 21 11 15 12 52

Sum.de pacientes 1 43 En correspondencia con cada observacin, hacemos una marca i I i en ia

8 22

13 28

Para simplificar los datos, el gerente construye seis agrupamientos o clases: la primera clase representa de 1 a 10 pacientes; la segunda, de 11 a 20; la tercera, de 21 a 30 y as sucesivamente. A partir de esta clasificacin, prepara una tabla de frecuencias agrupadas (tabla 2.3) para mostrar qu tan a menudo, a lo largo de los doce das, cae en cada grupo el nmero de pacientes. Las clases de frecuencias agrupadas poseen lo que se llama l m i t e s de clase. Para la clase 1-10, a 1 se le llama lmite inferior de clase, y a 10, lmite supenor TABLA 2.3 de clase. Existen dos medidas que caen entre 1 y 10. inclusive: tres medidas que caen entre 11 y 20, inclusive; cuatro medidas que caen entre 21 y 30. inclusive; una medida que cae entre 31 y 40. inclusive y as sucesivamente. La distancia entre cualquiera de dos lmites superiores consecutivos o entre cualquiera de dos ) b'mites inferiores consecutivos es llamada a m p l i t u d de d a s e . La amplitud de cada clase en la tabla 2.3 es 10. La distancia entre el limite superior de la primera clase y el lmite superior de la segunda clase es 20 -10 = 10. Cada clase en una tabla de frecuencia tiene lmites de clase tericos llamados fronteras de clase; al lmite superior terico se le llarna/ronrera superiory al lmite inferior terico de clase se le llama frontera inferior. L a frontera infenor para la primera clase es 0.5 y la frontera superior para esa misma ciase es 10.5. Para esta tabla de frecuencias, la frontera supenor de cada clase se encuentra sumando 0.5 al lmite superior, y la frontera inferior de cada clase se encuentra restando 0.5 del lmite inferior de cada clase. Note que cuando se examina una tabla de frecuencias agrupadas sin los datos no agrupados, esto es, antes del procesamiento estadstico, no conocemos las medidas individuales: por ejemplo, en la tabla 2.3 vemos que dos medidas caen en la clase 1 a 10, pero no sabemos cules son estas, lo cual no sera el caso para una tabla de frecuencias no agrupadas donde se conocen todas las medidas. Cualquier tabia de frecuencias agrupadas debera poseer ias tres caracten'sncas . siguientes: !. Uniformidad: cada clase debera tener ia misma amplitud. 2. Unicidad: aos ciases no se traslapan. 3. Compietez: cada uno de ios datos debe pertenecer a alguna ciase. Tabla de frecuencias

columna de marcas al lado del valor observado; cuando se han hecho todas las marcas se cuentan las de cada medida x para determinar la frecuencia. Note que la suma de todas las frecuencias de una tabla de frecuencias es igual al numero de datos de la coleccin. En este caso, la suma de ias frecuencias (42) representa las 42 clases para las cuales se registraron las faltas, i

APLICACION 2.3

Cinco miembros. Jones. Smith, Baker, Brown y Thomas. de la junta directiva de una pequea universidad, fueron nominados para presidirla y los datos siguientes muestran el resultado de la eleccin; construva una tabla de-tecuenci, _ .

agrupadas para los datos de la saia de emergencias Clase 1-10 . 11-20 . 21-30 . 31-40 . 41-50 . 51-60 . Frecuencia ( f 2 3 4 1 1 1

- Smith Jones Brown Brown Jones Thomas Brown Brown Thomas Jones Jones Brown

Jones Smith Smith Smith Solucin:

Jones Baker Smith Thomas

Smith Baker Smith Smith

La tabla de frecuencias es como sigue: Miembro de la junta Bakei^ Brown Jones Smith Thomas Frecuencia (/) 2 5 6 8 3

Tablas de agrupadas

frecuencias

Las tablas de frecuencias como la tabla 2.2 se denominan apropiadamente tablas de f r e c u e n c i a s no a g r u p a d a s porque cada medida nene ia frecuencia correspondiente. U ^ o a t o ^ f c & e e i u a c r e en contraste, pr*. serna las frecuencias de acuerdo con grupos o ciases de medidas Las tablas de frecuencias agrupadas se usan comunmente para resumir grandes cantidades de datos continuos que contienen relativamente pocas repeticiones: tales resmenes ractlitan'cierroscicuios estadsticos y presentaciones grficas cuando no se usa la computadora: para usar una tabla de frecuencias ahupadas a fin de resumir ios datos, estos deben medirse al menos con una

8

Estadstica descriptiva: organizacin de dalos

Seccin 2.2 Organizacin de datos mediante tablas

29

Las fronteras de clase y as amplitudes de ciase de una tabla de frecuencias agrupadas se determinan considerando.Ja unidad o precisin de ta medite. Para las clases de a tabla 2.3. ia precisin de la medida es el nmero entero ms cercano, ya que estamos contando individuos, as que la unidad de medida es 1. ^ o a t r a werior de ciase de un intervalo se localiza mema unidad abajo dei* 'nftit.'fl Donara.supenor de, clase.dfi.un imerwato se focatea faMa unifott^* arriba del lmite* Para la primera clase de la tabla 2.3. la frontera inferior de clase es f 1 - 0.5(1)] = 0.5 y la frontera supenor es [10+0.5(1)] = 10.5. Ninguno de los datos cae en la frontera de un intervalo, por lo tanto, las medidas 0.5 y 10.5 no pueden caer en la primera clase, pero cualquiera de las medidas entre 0.5 y 10.5 si. Desde luego, 0.5 y 10.5 no son medidas posibles, as que las fronteras de* clase slo tienen significado matemtico.* La amplitud tv de cualquier clase de una tabia de frecuencias agrupadas puedt encontrarse restando la frontera inferior de la clase de su frontera supenof. Entonces, para la primera clase en la tabla 2,3, w = 10.5 - 0.5 = 10. Tome en cuntalos ejemplos 2.12 y 2.13.

EJEMPLO

2.13

La siguiente es una taiva de frecuencias agrupadas para ei peso en libras de 18 recin nacidos. Clase Frecuencia (f) i i

3.0-4.4 4.5-5.9 6.0-7.4 7.5-8.9

9.0-10.4

7 8

La precisin de la medida de las clases**!. 1 libras. Para la clase 7.5 - 8.9, al restar la mitad de una unidad del lmite inferior de ciase se obuene 75-1.0.5) (0,!}= 15 0.05 = 7.45. la frontera inferior de clase. La frontera supenor de clase se encuentra sumando media unidad al lmite superior de clase, obtenindose 8.9 + (0.51 (0.11 = 8.95; note que ningn peso corresponde a alguna frontera porque la precisin de ia medida es el dcimo de libra ms cercano.

En cualquier tabla de frecuencias agrupadas, la amplitud de clase puede encontrarse simplemente realizando el procedimiento siguiente; Determinacin de la amplitud de ciase Rstense dos lmites superiores de clase consecunvos o inferiores de clase consecuvos, o dos fronteras infenores consecutivas, o dos fronteras infenoI ' res consecutivas, o rstese la frontera tnfenor de una ciase de la frontera supenor de dicha clase. I i \ j

EJEMPLO'2712

La siguiente es una tabla de frecuencias agrupadas para el nmero de semillas en 21 naranjas. Clase 3-6 H-14 Frecuencia i f )

Para los datos de la sala de emergencia proporcionados onginalmente en la tabla 2.3, podemos calcular la amplitud de clase como se indica en la tabla 2.4.

TABU 2.4Clculo de ia amplitud de clase para la tabla 2.3

Clase 1-10 w = 20 - 10 = 10

Frecuencia ( f )

7-10

15-18 La precisin de medida para las clases es i porque los datos de la tabla son nmero* enteros.Para la clase 7-10, si sumamos (0.5) (1) = 0.5 al lmite supenor de clase 10. obtendremos la frontera supenor de clase 10.5. Para conocer la frontera inferior restamos 0.5 de! lmite inferior de clase y nos resulta 7 - 0.5 = 6.5 (vase el ejemplo 2.13). El ancho de la clase 7-10 se encuentra entonces restando la frontera inferior de ciase de la frontera supenor. es decir, w = 10.5 - 6.5 = 4. Lmites de clase 7

1-20 w = 31 = 0 1-30

f ; 31-40

41-50 51-60

Sin embargo, note que la amplitud de clase no se encuentra restando el lmit l>

inferior de clase dei lmite superior.* Eieccn de cases oara 10.5 L :abas ce frecuencias zsrvpszs'' Si se quiere construir una tabla de frecuencias agrupadas para una cierta coleccin de datos, es necesario responder tres preguntas relativas a las. clases. i. ^Cuntas ciases deben usarse' 1 Cul debe ser ia amplitud de case'?' J . En qu vaior debe empezar la pnmera clase ?

65 I Fronteras de clase

30

tstaistica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de datos mediante tabks 31

Escoger ei nmero de ciases requiere vanas consideraciones. Si todos los datos se agrupan en un nmero pequeo de clases, ias caractersticas de los datos originales se ocultan y puede perderse informacin relevante: por otro lado, demasiadas clases dan demasiados detalles y se pierde ei f*etsi*Q del agrupamiento. que es condensar los datos de manera significad va y fci de interpretas Adems, demasiadas clases pueden dar lugar a que muchas clases queden vacas quitndole sentido al agrupamiento de ios datos. El iifflllet d4atcs>ienotado por & depende de la situacin y dei tota!l

Como la medida menor debe caer en ia primera ciase, ei lmite inferior de ia primera ciase debe estar en. o un poco antes de. la medida menor L. As que podemos establecer un acuerdo generai soore ias clases de nuestras tablas de frecuencias agrupadas, empezando siempre iapnmera clase con la medid menor* esto nos ser especialmente til cuando verifiquemos nuestras respuestas. En la prcuca. es comn que la primera clase empiece en un nmero que permita expresar las clases de intervalos convenientes, pero hay ocasiones en que se justifica una excepcin a la regia (vase el ejercicio 33 al final de esta seccin i. Cuando ia primera clase comienza con la menor de ias medidas, el valor mnimo que puede tomar w depende de a unidad de medida. Ei valor mnimo para la amplitud de ciase w se determina redondeando ei cociente R/c al siguiente valor entero.

de los datos obtenidos. Como no hay un acuerdo genera! entre los estadsticos acerca del nmero de clases que deben usarse y dado que la eleccin es arbitraria, en este texto usaremos de 5 a 15 clases, inciusive.

Nmero de clases para una tabla de frecuencias agrupadas: Entre 5 y 15 clases (inclusive). Una sugerencia til para el nmero de clases est dado por la regla de Sturges, que establece como nmero de clases necesario, aproximadamente. ft* alumnos de nuevo ingreso

Frecuencias relativas 0.01 0.06 0,12 0.23 0.3! 0.18 0.08 0.01

Frecuencia relativa acumuiada 0.01 0.07 0.19 0.42 0.73 0.91 0.99 1.00

' Datos bivariados. Supongamos que estamos interesados en ei promedio diario de ! precipitacin pluvial y temperatura ambiente habidos en Athens, Georgia, durante los diez aos pasados. La poblacin consiste de os diez .aos pasados, donde un miembro de la poblacin es cada ao, y en este caso, un ao es una fuente para dos piezas de la informacin que vendran a ser el promedio diano de la precipitacin pluvial y ei promedio diario de la temperatura ambiente. Cada ao da lugar a dos medidas. Una tabla de frecuencia b i v a r i a d a es un arreglo de datos clasificados e% dos categoras;, la informacin usada para construir las tablas de frecuencia bivanada se obenen generalmente de contar frecuencias. Cada categora se identifica con un smbolo llamado variable, cada variable-representa datos de una categora; las categoras pueden ser nmeros discretos, intervalos numncos o valores cualitativos como gnero, color de cabello o religin.

62.5-65.5 65.5-68.5 68.5-71.5 71.5-74.5 74.5-77.5 77.5-80.5 80.5-83.5

Esta tabla, que utiliza fronteras de clase y frecuencias rehuyas acumuladas, se puede usar para determinar percentiles. Las conclusiones siguientes son manifiestas en ia observacin de la tabla anterior: 1. Una estatura de 74.5 pulgadas es el percentil septuagsimo. EJEMPLO 2.23

. Vamos a suponer que la informacin se obtuvo de una muestra de votantes a los que ; se pregunt su filosofa poltica y su filiacin partidista; a cada uno se le pidi!

2. Ei percentil nmero cincuenta est entre 71.5 y 74.5 pulgadas. 3. El percentil 19 es 68.5 pulgadas.

idenficar sufilosofapoltica como: liberal, conservadora u otra, y su filiacin partidista como demcrata, republicana u otra: las dos variables de clasificacin son

4. El septuagsimo quinto percenl se ubica entre 74.5 y 77.5 pulgadas.

filosofa poltica y filiacin parodista. La variable filosofa poltica uene tres categoras o niveles de clasificacin: liberal, conservadora u otra; la segunda variable tiene tambin tres categoras o niveles: demcrata, republicana, otra; los datos estn1

P

APLICACION 2.7

Supongamos que el percentii nmero setenta de peso de los hombres adultos es 175 libras y que el 85 es 195 libras. Qu porcentaje de hombres tienenG

tabulados en la tabla 2.15. Filosofa poltica Filiacin partidista Demcrata Republicana Ou-a Total Liberal "8 34 38 200 Conservadora 65 "9 46 190 i6 60 Otra 37 Total ISO l"0 !00 "50

pesos mayores que 175 libras y menores que ]95? Solucin: Por definicin. 7 0 % de los hombres adultos pesan menos de 1":

TABLA 2.15 Tabia de frecuencia Divariada

libras y 8 5 % pesan menos de 195; por lo tanto: 0.85-0.70 = 0.15= 15% de los hombres adultos tienen pesos comprendidos entre 175 y 195 libras, Tablas biv aadas i

Si tenemos datos resultantes de medir dos aspectos distintos de los rniembrrfs de una poblacin, entonces os llamamos datos b i v a r i a d o s / S e usan dos variables para representar los dos aspectos de cada miembro; un miembro puede ser un objeto, persona o fuente: Supongamos que queremos investigar ia altura y ei peso de todos los jugadores de basquetboi de ias preparatorias en Allegany County. Marviand: :aaa miembro es un iucador de basquetboi La informacin que sigue, entre otras, pueae leerse fcilmente ce ia taoia: 1. Hoo "75 votantes que dijeron ser liberales demcratas. 2. "9 oersonas manifestaron .-.er conservaoores republicanos. 3. Se entrevist a 450 individuos.

40 i Estadstica descriptiva: organizacin de datos

arcin 2.2 Organizacin de datos meaiante tablas i

41

4. Hubo 1 0 republicanos entrevistados.7

Actitud haca 1 c r.'.o colectivo Czio Profesor Prof. Asociado Pro;. Asistente Instructor Total A favor ^5 : 42 121D En contra 8 16 19 4 Abstencin 2 5 4 u _23_ Total 55 50 65 ?n_ 200_

5. 60 votantes clasificaron su filosofa poltica como otra. APLICACION 2.8

En la tabla siguiente estn anotadas ias calificaciones en estadstica y ei sexo de 32 estudiantes universitarios. Construya una tabla de frecuencia para ios datos bivariados. Estudiante 1 i 4 5 6 8 9 10 11 12 13 14 15 16 Solucin: Paso 1. Usamos marcas de cuenta pan Hp.rpn de las diez combinaciones sexo-calificacin. nardos-totales-para-cada una Calificacin B C Sexo M F F M F F M M F M F F M F F F 18 19 20 21 22 23 24 i^ 26 2" 28 29 30 31 32 Esrudiante C"alineado n C E C B D E B B C C D B D A E A Sexo p p M F .VI M M M M p M F F M M F .

Use la labia para responder cada una de estas preguntas; a: /.Que porcentaje ue los acadmicos esta en contra uei contrato colectivo 0/p b i Qu porcentaje corresponde a profesores asociados1 1

c cB B A

ci Qu tanto por ciento de ios profesores estar, a favor de! contrato colectivo? A & d.Instructores que estn a favor de dicho contrato, en porcentaje'1( 1

cC B

D

e i .Quienes se oponen al contrato Qu tanto por ciento corresponde a protesores

A C D D A

. . ^

f) Qu porcentaje del total de los acadmicos representan los profesores. asociados o de rango supenor. que estn a favor de! contrato?

Solucin: 3)47/200 = 23.5%. bi 50/20 = 25%. cl 45/55 = 81.8%. d) 12/30 = 405. el Cuarenta y siete acadmicos se oponen al contrato colectivo de trabajo y. de ellos. 8 son profesores. En consecuencia, os profesores constituyen el 8/47 = 17.02%- de quienes se oponen al contrato coiecnvo. 142 -r 31 +451/200 = 59%. ^ ^ '

Calificacin Sexo H M CW1

Paso 2. A continuacin encontramos los totales para los dos renglones, cinco columnas v diez combinaciones sexo/calificacin. Calificacin Sexo H Ai Total D Total';15:

GRUPO

DE EJERCICIOS

2.2

Habilidades i.

bsicas c i L = ?9. U= 130. f = 13 d ) L = 13.64. U = ~5.24.;= !0

Determine la amplitud de ciase w para cada uno de ios conjuntos guienies:

a!=!7. i ' = S i . c = 8

Calcule los limites supenores pane: primer intervalo ue ciase en cada una ue ias siguientes condiciones: APLICACION 2.9 ai L - U. i = ! . La suborden se escribe seguida de un punto, el cual informa a MlNlTAB que no siguen ms subrdenes y que deben ejecutarse la orden principal y la suborden, si no se escribe e! punto, MlNlTAB responde con otro smbolo de suborden, S U B C > . MlNlTAB usa tres columnas en la respuesta; la columna del extremo izquierdo, llamada de profundidad, nos dice cuntas hojas estn en la lnea o acumuladas de esa lnea hacia atrs o hacia adelante, dependiendo de qu extremo est ms cercano. Por ejemplo, el 9 de la tercera lnea contando de arriba a abajo, significa que hay nueve hojas en esa lnea o debajo de ella; el 3, en la tercera lnea partiendo de abajo significa que hay tres hojas en esa lnea o debajo de ella. La lnea con parntesis contiene la observacin central si el nmero total de observaciones es impar, y las dos observaciones centrales si el nmero total de observaciones es par. Los parntesis encierran el nmero de hojas en esa lnea. E! segundo rengln de arriba hacia abajo contiene nueve valores y la mediana; siete valores caen arriba del segundo rengln y nueve valores caen despus de ste. La segunda columna muestra los tallos, mientras que los nmeros a la

puede llevar a su valor origina! multiplicando por O.i. As. trataremos los nmeros como de tres dgitos comprendidos entre 106 y 165. Si usamos taiios de dos dgitos, obtenemos el siguiente diagramn ordenado: 10 6 67 8 8 8 3 112

! 1 2 2 3 3 4-6 8 0 18 139;

13 14 i5 16

3 3 5

La hoja 5 en el tallo 16 representa 16.5 centavos. Podemos determinar fcilmente que un 20% de los costos promedio son superiores a 13.1 centavos; en esta aplicacin no seria aconsejable usar hojas de dos dgitos v ramas de un dgito porque todas las hojas estaan en el mismo tallo, y deL

qu servira un d. de t. h. con un solo tallo'?

La pantalla 2.1 ilustra el uso de MlNlTAB para construir un d. de L h. para los datos de la aplicacin 2.10. Pmtalk 2.7 M1B>hl C l DATA>16.5 14.5 14.3 13.9 13.8 13.1 12.8 12.1 12.0 11.3 DATA > 11.6 11.4 11.3 11.3 11.2 11.2 11.1 11.1- 10.8 10. DATA > 10.8 10.8 10.7 10.6 10.6 DATA > END MTB > STEM C l ; SUBC>INCREMENT=1. STEM-AND-LEAFOFC! LEAFUN1T = 0.10 10 6678888 11 112233468 12 018 13 189 14 33 15 16 N=25 Pama/la 2.2

derecha del tallo son las hojas. La pantalla 2.2 contiene un d. de t. h. de doble tallo para los datos de la aplicacin 2.10. Note que la suborden INCREMENT = 1 no se us en la pantalla 2.2 y que esto origin un d.tie L h. de doble rama.

MTB > STEM C l STEM-AND-LEAF OF Cl N = 25 LAFUNIT = 0.10 7 (7) 11 9 7 6 5 3 i 1 1 1 -1 106678888 11 11223341168 1201 128 131 13 89 14 3 145 15 15 16 16.5

Note que STEM es una abreviatura del trmino ingls stem-and-eai diagram, que corresponde a d. de t. h. Slo es necesario que el usuaria teclee las primeras cuatro letras de'una orden. Vea tambin que la orden STEM-AND-LEAF tiene varias subrdenes; una de las subrdenes disponibles es INCREMENT, usada para especificar los

estadstica descriptiva: organizacin de datos

Seccin 23 Representacin granea de datos

53

APLICACION 2.11

Los ciatos siguientes rcptcscian cambios porcentuales de un ao. en nmero de onsioneros en 25 sesiones federales v estatales."0.6 10.S 7.0 11.7 -10.1 0.19.2 0.6

mbucin 1 Tallo 'iotas

Distribucin Hoias

Distribucin Hoias

68

Construya un d. de t. h. pan ios datos. Solucin: Si ignoramos el punto decimal, observamos que los datos corren

de -111 a 208. Usemos valores de tallo de - 1 , - 0 , +0,1 y 2; para lograr que iodos los valores sean nmeros de tres dgitos, pongamos un cero delante de os valores con dos dgitos; as 4.1 se representa por 041. Necesitamos dos tallos para cero para indicar los signos de los nmeros. Por ejemplo, el tallo para el valor 0.6 es -t-0, el tallo para 7.0 es +0 y el tallo para -1.7 es -0. E l valor 0.6 debe estar representado en el d. de t. h. como +006: 7.0 debe estar representado como +070 y -1.7 como -017. E l d. de t. h. se muestra aqu: -i : +0 1 2 i o ii 02 04 0606 2125 4170 88 98 08 17 29 63 92 06 08 APLICACION 2.12 Distribuciones de La idea de construir un histograma para frecuencia no agrupada de ios datos, es representar cada frecuencia por una barra cuya rea sea proporcional a ella. Tpicamente, el ancho de cada barra se escoge como 1 y as ei rea de la barra es ieual a la frecuencia de la medida. Histogramas Un histograma es un tipo de grfica de barras para una distribucin de frecuencia. _istograraas pueden construirse para distribuciones de frecuencia agrupada y no agrupada, Consideraremos primero histogramas para distribuciones de frecuencia no agrupada.

-0 \5 12 14 17 32 44

frecuencias no agrupadas

Recuerde que cada valor en el diagrama debe convertirse multiplicando por 0.1 antes de hacer la interpretacin. Las hojas en esta aplicacin tambin pueden contener decimales; en ese caso, no necesitaramos multiplicar los valores en el diagrama por 0.1 antes de realizar las interpretaciones que deban hacerse. El correspondiente d. de t. h. es: -1 j -0j

La tabla siguiente contiene el nmero de nios en edad escolar en cada una de las 50 familias de una muestra. Construya un histograma para datos. Nmero de nios en edad escolar 0 i Frecuencia / 5e"

0.1 1.1 0.5 1.2 1.4 1.7 3.2 4.4 0.2 0.4 0.6 0.6 2.1 2.5 4. 0.8 1.7 2.9 6.3 9.2 0.6 0.8 7.0 FIGURA 2.5

014

+0 | 1! 2i

4

3

94

I

Histograma para ia Los d. de t. h. tambin son tiles en otras aplicaciones, como a continuacin se indica: 1. Se pueden comparar dos distribuciones similares si uenen los mismos tallos. En este caso, las hojas de un d. de t. h. pueden colocarse a la derecha de los tallos y las hojas del otro a la izquierda de las ramas, como se muestra aqu: Hojas 86 9875 86 5430 2. Tallo 5 7 8 Hojas 3 68 27 355"6 5 345 frecuencia de los datos de a aplicacin 2.12

Se,puedan.comparar mas de dosdisnbusicnes-orreeli^-iw en forma de columnas si comparten taiios comunes; ios tallos se pueden eoiocar en e; extremo izquierdo de un diagrama y las hojas asociarse como en el diagrama sisuiente:

VNmero de nios

JI

i tstadistca descriptiva: organizacin de dalos

Seccin 2.3 Representacin grfica de datos t

55

Solucin:

Nuestro histograma contendr cinco barras.' Colocaremos el n-

FIGURA

2.6

Clase 5.2-6.6 67-8.1 8.2-9.6 9.7-11.1 i 1.2-12.6 12.7-14.1

Fronteras :..:-6.cc 6.65-8.15 S.15-9.65 9.65-11. i: 1 .15-12.6: 2.65-14.::

mero de nios

en

\ud escolar

a

io

largo

del eje horizontal, la frecuencia a

Histograma para ios datos de desemoleo

lo largo del eje vertical y el punto cero t'.Oj en el eje horizontal, a la derecha de su posicin usual, la interseccin de ios dos ejes. Esto nos permitir centrar las barras sobre los valores de manera q e el eje vertical no pase por ia u pnmera barra. Si escogemos el ancho de cada barra como 1 y ia altura de cada barra como la frecuencia, entonces el rea de cada barra ser igual al producto de la frecuencia por 1. La suma de las reas de las cinco barras sera igual a la suma de las frecuencias; el histograma se ilustra en lafigura2.5. Adviena que el eje horizontal se rompe para llamar ia atencin sobre el hecho de que la escala horizontal no comienza en cero; rompemos el eje para indicar que no estamos tratando de distorsionar la perspectiva deliberadamente.

Paso 2. Se traza luego una grfica de barras usando las fronteras de clase y las frecuencias; las fronteras se colocan a lo largo del eje horizontal y las frecuencias a lo iargo del eje vertical, como lo muestra la figura 2.6.

Histogramas para frecuencias agrupadas por datos

Para construir un histograma para datos medidos en una escala de intervalo o en una escala de razn, se acostumbra seguir dos pasos. 1. Se organizan los datos de una tabla de frecuencia agrupada. 2. Se construye una grfica de barras usando las fronteras de ciase para colocar las barras, y las frecuencias para indicar las alturas de ias barras.

Un histograma mejora nuestra habilidad para comparar las frecuencias de ciase correspondientes; se puede comparar con facilidad la frecuencia de una clase con las de las clases vecinas; podemos ver inmediatamente que la segunda clase del histograma ilustrado en la figura 2.6 uene la mayor frecuencia, y que la frecuencia de esa clase es el doble de la que est representada en la tercera clase: hay una declinacin rpida en el nmero de ciudades representadas en las clases cuya tasa de desempleo est sobre el 8.15 y el 11.5 por ciento. La forma de un histograma puede cambiar drsticamente con una variacin

APLICACION 2.13

La tabla de frecuencias agrupadas siguiente representa la tasa de desempleo, en porcentajes, para 27 ciudades del este.'" Tasa de desempleo (en porcentajes! 3.7-5.1 5.2-6.6 6.7-8.1 8.2-9.6 9.7-11.1 11.2-12.6 12.7-14.1 12 6 1 0 EJEMPLO 2.26 1 Nmero de ciudades

en el nmero de intervalos n o en la amplitud de los intervalos w. Por esta razn, debemos ser cuidadosos al sacar conclusiones usando la forma de ias distribuciones mustrales.

Los tres histogramas mostrados en la figura 2.7, representan una muestra de 100 medidas para valores distintos de n y w. El histograma en ia parte la) tiene n = 5 y n- = 9.95; el de la parte (bl tiene n = 8 y w = 6.22; y el histograma en la parte (c) tiene n = 5 v w = 4.60. Advierta cmo cambia la apanencia cuando cambiael numero ': de intervalos v el ancho de clase. Jr i35 . 30 25 20 !5 10

T27

Realice un histograma con estos datos. Solucin: El histograma se construye colocando primero las fronteras de

FIGURA2.7 Efectos en la apariencia del histograma al cambiar el nmero de intervalos v el ancho de ciase. El eje horizontal representa longitudes en pulgadas

clase en el eje horizontal y las frecuencias en el eje vertical. Se traza una barra rectangular para cada clase usando las fronteras de clase para medir el ancho de la barra y la frecuencia para medir la altura; como todas las ciases en una tabla de frecuencia agrupada tienen ei mismo ancho, las reas de las baas sern proporcionales a su altura; es decir, a las frecuencias de las clases. Para construir ei histograma seguimos estos pasos; Paso . Primero caiatiamos asfronteras de case. Sote que ia unidad de 10.5n0.1)

r

medida es 0.! de porcentaje, por o tanto, para cada ciase se resta:

= 0.0:- dei lmite interior de dase-p ara encontrar ia frontera interior de eme y se aade ftft> al lmite superior de ciase para encontrar ia frontera

0

supenor de ciase.

00

6 Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin granea de datos

57

Note que la suborden INCREMENT = 8 especifica que el ancho de cada intervalo de clase va a ser 8, y la suborden START = 21.5 indica que el punto medio de la primera clase va a ser 21.5, por lo tanto, la primera clase comienza con 17 y ei primer intervalo de clase es 1 8 - 2 MINITAB no muestra los intervalos, slo los puntos medios o marcas de cada uno.

Histogramas relativa(C)

de ryecuencia

Se puede construir un h i s t o g r a m a de f r e c u e n c i a r e l a t i v a cambiando ia escaia vertical de un histograma de frecuencias. En lugar de empezar con una tabia de frecuencia agrupada comenzamos con una tabla de frecuencia relativa agrupada; la altura de las barras en un histograma de esta naturaleza indicar la proporcin dei total representado por cada clase. Su forma bsica

Se puede usar MlNlTAB para construir un histograma de datos sin agrupar. La pantalla 2.3 contiene un histograma hecho con MINITAB para los datos adjuntos, que representan as edades en aos de una muestra de 40 turistas que viajaron recientemente a japn por American Airlines durante un periodo de un mes. EJEMPLO 2.27

se parece a la del histograma de frecuencia conespondiente.

La tabla de frecuencia relativa correspondiente a los datos de la aplicacin 2.13 se muestra en la tabla 2.18, y el histograma de frecuencia conespondiente aparece en la figura 2.8.

67 36 62 60 Pana/la 2.3

18 63 74

28 44 41 62 72

60 69 44 66 58 68 43 54 65 61 57 61 51 52 TABLA 2.18 Tabla de frecuencia relativa para los datos de desempleo

26 50 34 44 43 54 63 61 45 66 71 80

Clase 3.7-5.1 5.2-6.6 6.7-8.1 8.2-9.6 9.7-11.1 11.2-12.6 12.7-14.1

Fronteras 3.65-5.15 5.15-6.65 6.65-8.15 8.15-9.65 9.65-11.15 11.15-11.65 12.65-14.15 0.190.44

65 70

0.22 0.04 0.00 0.04 0.07 1.00

MTB> SETC1 DATA > 67 18 63 74 28 44 60 69 44 66 DATA > 36 26 50 34 44 41 58 68 43 51 DATA > 62 43 54 63 71 62 54 65 61 52 DATA > 60 61 45 66 80 72 61 57 65 70 DATA > END MTB>HISTC1; SUBC > INCREMENT = 8; SUBC>START = 21.5. HISTOGRAM OFC1 N=40 MIDPOINT 21.50 29.50 COUNT 1 2 ** FIGURA 2.8

0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0

Frecuencias relativas para los datos de desempleo de la aplicacin 2.13

_

o

Extensin de desempleo

38

Estadstica descriptiva: organizacin de datos

Seccin C.3 Representacin grfica de los ditos

59

Grficas lineales polgonos

o

Una grfica lineal o polgono de frecuencia se construye usando una taola de frecuencia agrupada con marcas de ciase. La grfica de lneas ofrece una alternativa til respecto ai histograma: la eleccin de cul se usar es generalmente de upo personal: una grfica lineal crea ia impresin de que las frecuencias cambian ms suavemente, mientras que un histograma sugiere que las frecuencias cambian abruptamente: puede construirse una granea lineal o un polgono de frecuencia para ios datos exhibidos, en una tabla de frecuencia agrupada identificando cada marca de ciase y su correspondiente frecuencia > X.f) con un punto de la grfica. Estos puntos se unen formando una sucesin de segmentos, como se ve en la aplicacin 2.14.

FIGURA

2.9

de frecuencia

ingresos promedio de trabajadores fabriles

APLICACION 2.14

ingreso! promedio (tasa ias 100 mas cercanos)

La tabla de frecuencia agrupada siguiente reporta los ingresos anuales promedio, hasta ios 100 ms cercanos, de los trabajadores fabriles en 27 ciudades del este de Estados Unidos. " Construya un polgono de frecuencia1

Las caractersticas notables de ios datos estn exhibidas en ia grfica lineal de la figura 2.9. 1. La mayora de las ciudades caen entre los extremos de la escala. Slo una ciudad tiene trabajadores fabriles con un ingreso promedio anual de aproximadamente 13,400 dlares y slo una ciudad posee trabajadores que ganan un promedio anual de alrededor de 26,700 dlares. 2. Los datos parecen tener su centro aproximadamente en 19,000 dlares.

para esos datos. Ingreso promedio $12.500-14.300 14.400-16.200 16.300-18.100 18.200-20.000 20,100-21,900 22.000-23.800 -_S9flO- 25.700 ~ 25.800-27,600 'i

Nmero de ciudades 5 3 7 6,

Ojivas

Una grfica lineal construida a partir de una tabia de frecuencia acumulada o de una tabla de frecuencia relativa acumulada, se llama ojiva. Las ojivas ofrecen un medio grfico para interpolar o aproximar el nmero o porcentaje de observaciones menores o iguales que un valor especfico. Para localizar los puntos de una ojiva, se usa una frontera supenor de clase

1 1

Solucin: Poso 1. Encontramos primero las marcas de clase, designadas por X. Ingreso promedio SI 2,500-14,300 14,400-16.200 16,300-18.100 18.200-20.000 20,100-21.900 22.000-23.800 23.900-25.700 25,800-2 .6007

y su correspondiente frecuencia acumulada o frecuencia relativa acumulada; despus se unen los puntos consecutivos por segmentos de recta; las frecuencias acumuladas o las frecuencias relativas acumuladas, se colocan siempre en el eje vertical. La aplicacin 2.15 ilustra la construccin de una ojiva

/ !5

X 13,400 15.300 17.200 19.100 21.000 22,900 24.800 26.700

3 7 1 3 1

APLICACION 2.15

Trace una ojiva usando frecuencias acumuladas para los datos de la aplicacin 2.14. Solucin: Paso 1. Primero encontramos ias frecuencias acumuladas. Ingreso promedio S12.500-14.300 14.400-16.200 16.300-18.100 8.200-20.000 20.100-21.900 22.000-23.800 23.900-25,700 25.800-Z .6001

Frontera supenor 14.350 16.250 18.150 20.050 21.950 23.850 v -so 27.650 ..

/i 5

Frecuencias acumuladas 1 6 9 !6. . 22 -3 26 2"

Paso 2. Ahora construimos la grfica de lneas mostrada en la figura 2.9. Las marcas de clase se colocan en el eje horizontal y as frecuencias en el eie vertical. Note que la grfica de lneas se "baja" en ambos extremos, concertando ei primero y el itimo puntos a puntos del eje horizontal aue distan w = 1900 de las marcas de clase ms cercanas.

6

3

3

60

Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin grfica de ios datos ,

61

Poso 2.1 ,amos las f r o n t e ! ! e ias clases para marcar los pumos en el ejer

n

horizontal y ias frecuencias pr.i ios punios en ei eje vertical. Paso.'. Construimos la ojiva i figura 2.10). Vea que ia frecuencia acumulada para a frontera inferior de ia primera clase es 0. Podemos determinar de un vistazo el nmero de ciudades donde os trabajadores fabriles tienen ingresos promedio inferiores a una cantidad especfica. FIGURA 2.10

Paso :. Construimos ia ojiva ;Fig. 2.11 ?. Vemos que P , percentil est entre 18.150 y 20,050 aproximadamente 19.500 y que ?-,, el 75ci0

percentil. es un poco menos que 22.000; por lo tanto, casi 5 0 % de las ciudades uene trabajadores fabriles que obtienen un ingreso promedio menor de 19.500. y " 5 % de las ciudades cuentan con trabajadores fabriles con un ingreso promedio menor de 22.000. Como resuitado. aproximadamente 2 5 % de los trabajadores fabriles ganan entre 19.500 y 22.000 dlares. 1

Una ojiva para ios ingresos anuales de los trabajadores fabriles de 2~ ciudades del este de Estados Unidos

FIGURA

2.11

Ojiva de ingresos de trabaiadores fabriles

Ingresos promedio (hasta los 100 ms cercillos)

Ingresos promedio (hasta los 100 ms cercanos)

Histogramas, formas de -so^e-o/ivas-para determinar percentiles SP. pnerle iKar una ojiva de frecuencia relativa acumulada para determinar percentiles, como se describe en la aplicacin 2.16.

ojivas y poblaciones

Los histogramas y las ojivas para datos mustrales proporcionan a! investigador una idea de la forma de ia poblacin de la que se seleccion la muestra. El histograma de una muestra sugiere la fonna de la curva de frecuencia poblacional conespondiente; un histograma de irecuertaa relativa para una muestra debe tener una forma asimilar a ia de la distribucin poblacional de frecuencia relativa, y una ojiva para una muestra debe tener aproximadamente la misma forma que la ojiva de la poblacin. Como ias poblaciones se representan a menudo por curvas de frecuencia relativa o por curvas de frecuencia relativa acumulada, es mponante que entendamos sus contrapartes mustrales.

APLICACION 2.16

Construya una ojiva de frecuencia relativa acumulada para los datos de la aplicacin 2.15, y sela para aproximar el 500 percentil (P$) y el 75 percentil (P ).7i 2 Q

Recuerde que el 75 percentil es la medida por debajo de ia

cual cae el 7 5 % de las medidas.Solucin:

Paso . Primero encontramos la frecuencia relativa acumulada usando la frecuencia acumulada. Frontera Ingreso promedio 512,500-14.300 14.400-16.200 16.300-18.100 18.200-20.000 20.100-21.900 22.000-23.800 23.900-25700 25. SO-27.600 supenor 4.350 16.250 18.150 /acumulada 1 6 9 16 2" 23 26 /relativa acumulada 0.037 0.222 0.353 0.593 0.815 0.852 0.963 1.000

EJEMPLO

2.28

Suponga que un llenador automtico de botellas en una lbnca de cerveza se programa para venir 12 onzas del lquido en cada botella. Una muestra de 50 botellas proporciona los contenidos siguientes en onzas: 12.335 12.111 12.166 11.900 12.151 11.717 11.584 12.497 12.187 2.185 11.629 12.082 12.491 11.929 12.520 11.988 12.080 12.001 11.912 ! 1.786 11.853 11.923 i 1.889 12.057 11.848 12.083 12.018 11.704 12.335 1.856 1.886 2.130 2.408 1.743 12.035

! 1.990 11.748 12.103 11.655 .853 12.101 1.919

Yl KQ21.950 25.850 25 7 5 0 2" .650

12.100 11.846 12.240 12.339 1.611

12.410 1.956 2.108

El' histograma de a figura 2. 2iai lustra a distribucin dei contenido de una botella para ia nuestra de 50 boteiia de cerveza: este histograma nos aproxima a una poblacin de forma acampanada, aue es llamada distribucin normal: esto 1 0 estudiaremos con detalle en ei canitulo " v se ilustra en ia figura 2.2(bi.

Paso 2. Usamos las fronteras de ciase para coiocar los puntos en ei eje honzontai v ia frecuencia reiauva acumuiada oara ios puntos en ei eje vertical.

62 Estadstica descriptiva: organizador! de ditos

5ecor 2.1 Reoresentacior granea de ios datos

62

FIGURA

2.12

| GRUPO Habilidades

Di EJERCICIOS bsicas

2.3 9. Construva un histograma de frecuencias relavas para ei histograma adjunto.

Histograma muestral, distribucin pobiacionai v ojiva para ios datos de contenido de cerveza

.

Considere la mugir de calificaciones siguiente: A C D B C C C D F F D F A D C B C D D B Construya una ai grfica de barras y b I una grfica de pastel.

tu hII -

10 -

IT:Contenido (en onzas) Contenido (en onzas) (ai Histeramamuestra b) Curva relativa de frecuencia poblacional

2. Considere la muestra de tasas de movimiento que siguen: X R X P G P G X X R G G PG12 Trace: a luna grfica de barras y b) una grfica de pastel. 3. Construyaun histograma de frecuencia para los datos listados a conunuacin: use seis barras: 17 14 16 8 31 16 14 9 17 11 PG13 G PG

R R R G R G

a , amplitud de clase c, nmero de clases n, nmero total de medidas

SIMBOLOS IMPORTANTES

los Jes aos.

R, rango 7, medida mxima L, medida mnima

X, marca de clase j, lmite inferior de clase h, lmite superior de clase

Construya una ojiva de frecuencia reiauva para 'os datos aesentos por a grfica lineal del ejercicio 1S

HECHOS Y FRMULAS IMPORTANTES

PansDusseldor Londres

Para una tabla de frecuencia agrupada todas las clases tienen la misma amplitud Para una tabla de frecuencia agrupada, el nmero de clases debe estar entre 5 y 15, inclusive.

E l ancho o amplitud de clase se encuentra dividiendo el rango entre el nmero de clases y redondeando el resultado al rrirmo entero mayor que RIc. Para una tabla de frecuencia agrupada, la prime-

Regia de Sturges: el nmero de clases necesarias RESUMEN DEL CAPTULO grficas que permiten usarlos y entenderlos ms fcilmente. Estudiamos tambin tablas de frecuencias agrupadas y no agrupadas: ademas, vimos que la distribucin de los datos puede representarse grficamente mediante grficas de pastel, de barras, histogramas, d. de t. h.. polgonos de frecuencias o grficas lineales y ojivas. 1. Las estaturas en centmetros de 50 esfumantes mujeres de preparatoria, son las siguientes: 157 155 171 150 163 150 172 161 154 174 163 148 152 163 149 158 REPASO DEL CAPITULO 176 164 157 153 169 161 160 164 155 162 51 167 67 167 170 158 TERMINOS IMPORTANTES 163 175 169 169 158 150 156 15" 174 162 150 151 165 170 156 170 153 154 a) Construya una tabla de frecuencia agrupada usando 10 clases. b) Trace un d. de t. h. c) Grafique una ojiva usando el resultado de la parte a. di Construya un histograma usando ei resuitado del inciso a. 2. Clasifique los datos siguientes como cuantitativos o cualitativos: ai pesos en onzas de 20 manzanas; b I coiores de diez coches: o longitud en centmetros Je una regia de. i 2 pin-. gaaas; d) preterencias religiosas de 15 personas; EJERCIOOS DE REPASO en una tabla de frecuencia agrupada es aproximadamente igual a c - 3.3flog n) + l, donde n es el nmero de medidas.

ra clase siempre comienza con la medida rrinima. Las fronteras de clase se usan para construir histogramas y ojivas.

En este captulo aprendimos que los datos pueden clasificarse en cuantitativos y cualitativos; los primeros son susceptibles de clasificarse en discretos o continuos, dependiendo de que puedan contarse o no. Tambin puede clasificarse a los datos segn la escala de medicin usada; las cuatro escalas usadas comnmente son la nominal, la ordinal, la de intervalo y la de razn. Para organizar los datos se usan tablas y

e) calificaciones con letra de los estudiantes de equis ciase; f) calificaciones porcentuales de los estudiantes de una clase; g) ei sexo de 50 profesores: h) la posicin apagado/encendido de 30 interruptores de luz; i) las calles en que viven 100 parientes; j) talla de las camisetas de los miembros del equipo de ftbol: k) ei nmero .7 tpii. 3. Para el ejercicio 2, clasifique los datos como nominales, ordinales, de intervalo o de razn. 4. En el ejercicio 2. clasifique los datos cuantitativos como discretos o continuos. 5. Se les pidi a 20 personas que identificaran su preferencia religiosa. Los resultados son: C C P J P J J C J P A j P C P C P J

Los trminos siguientes del captulo estudiado se han mezclado para proporcionarle una mejor prctica de revisin. D una definicin de cada uno con sus propias palabras y despus verifique susrespuestascontra las definiciones del texto. histograma de frecuencia relativa grfica de barras tabla de frecuencia bivariada grfica de pastel diagrama de doble tallo fronteras de clase datos marca de clase lmites de clase amplitud de clase frecuencia acumulada datos sm agrupar tabla de frecuencia relativa acumulada tabla de frecuencia no agrupada frecuencia polgono de frecuencia tablas de frecuencia datos bivariados grfica tabla de frecuencias agrupadas histograma datos connuos rango profundidad datos de intervalo grfica linear datos nominaies ojiva datos ordinales percendles datos cualitadvqs datos cuantitativos punto de posicin datos de razn frecuencia relativa tabla defrecuenciarelativa diagrama de tallo y hojas regla de Sturges marca de cuenta unidad datos univanados datos discretos

A P

uonde C denota catlico. P protestante, j judo > A aleo. Construya una. ai taola de frecuencia: b) grfica de barras; o ricade pastel.

68

Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin grea de los datos 69

6.

Dados susa) 7-16 b) 3.4-7.8 c) 1.3-4.5

lmites, encuentre

as

amplitudes de

as

12. La siguiente tabla presenta la esperanza promedio devida en Estados U nidos para los ai.os 1950 y 198! 9 50 H Recin nacidos 5 aos de edad 2: aos de edad 35 aos de edad 45 aos de edad 65 aos de edad M 98 H 70.9 72.2 72.9 "3.7 74.5 79.5 M 78.3 79.3 79.6 80.0 80.5 83.8

Aplicaciones

de

computacin

2. Los datos siguientes muestran los puntajesde pruebas de inteligencia de una muestra de 100 estudiantes de 10 grado de la University High School:2

siguientes clases:

Los datos siguientes presentan los puntajes en matemticas en el PAA, de una muestra de 100 estudiantes novatos de una universidad. 411 606 425 444 507 300 548 387 432 527 508 294 578 469 640 444 261 436 442 508 520 423 556 546 363 569 457 554 624 515 527 450 509 506 374 316 566 415 576 298 401 589 474 571 455 615 439 404 447 676 333 496 559 430 660 494 449 421 690 682 349 485 505 648 475 309 531 499 503 400 550 522 553 555 473 372 505 460 550 653 560 327 458 490 557 337 513 579 403 489 454 470 495 552 600 651 519 698 568 408 Use un programa computacional paira construir: a) una tabla de frecuencia agrupada que tenga diez clases; b) un d. de t. h. para los datos; c) el histograma correspondiente a la tabla de frecuencia de la parte a.

65.5 71.0 68.6 73.5 69.4 74.0 70.2 74.5 71.6 75.6 80.0

132 89 87 94 117 71 124 123 75 95 130 120

103 112 120 99 115 95 87 117 94 83 99 92

94 95 107 89 91 86 80 114 94

78 82 95 93 90 87 71 90 83

108 86 104 86 97 97 92 109 100 116 135 93

105

98

114 120 91 78 104 149 121 86 116 69 102 80

d) 1.23-4.78 e) 0.03-0.09 7. Si una tabla de frecuencia agrupada debe contener ocho clases y a medida menor es 14 y ia mayor 94. encuentre la amplitud de cada clase. 8. Considere la siguiente tabla de frecuencias bivariadas: Aprobado Hombre Mujer Total Encuentre: a) nmero de mujeres que aprobaron; b) porcentaje de hombres que reprobaron: c) porcentaje de aprobados que son hombres. 9. Se realiz un experimento para determinar el efecto de un cierto frmaco en ios niveles de colesterol en ia sangTe. e mg/lOu mi. en nombres de 30 aosrSiT obtuvieron las medidas: 245 245 160 235 190 185 165 240 120 220 230 195 285 145 225 170 175 185 265 210 205 225 260 225 195 210 195 ... 11 14 25 Reprobado Total 15 26 10 24 25 50

124 113 100 81

98 122 79 107 97 78

a) Trace una grfica de barras para la esperanza de vida promedio de los varones en 1983. b) Construya una grfica de barras para la esperanza de vida promedio de las mujeres en 1983. 13. Los datos siguientes representan los pesos en libras de una muestra de estudiantes en una preparatoria. 114 115 116 120 123 126 128 129 131 132 132 133 134 135 135 137 138 139 142 142 143 146 147 152 157 158 161 164 165 167 168 168 170 170 172 174 174 174 175 175 176 177 177 178 180 184 184 184 186 187 189 194 195 195 200 201 202 206 207 709 a) Construya un d. de t. h. b) Construya un d. de t. h. de doble tallo. Revela este d. de t. h. algunas caractersucas de los datos que no fueron reveladas por el d. de t. h. de la parte a? Ofrezca una explicacin para la diferencia de las formas. c) Use un diagrama de la parte a, para construir un histograma de los datos sin agrupar. 14. La tabla de frecuencia adjunta connene las velocidades en millas por hora, de una muestra de 60 coches que recorren la !4a. Avenida en Nueva York, segn el registro del radar de un polica. Clase 54-39 40-45 46-51 .

80 106 90 72

86 105 128 88 94 88

93 109 116 94 99 94 73 80

134 111

98 110

Use un programa computacional para construir a) una tabla de frecuencia agrupadas que tenga doce clases.b)

un d. de t. h.

c) el histograma correspondiente a la tabla de frecuencia del inciso.

140 215

a) Construya un d. de t. t i b Haga una tabla de frecuencia agrupada con diez clases. ci Trace un histograma de frecuencia relativa usando la tabla antenor. 10. Las estaturas, hasta la pulgada ms cercana, de 33 estudiantes son las siguientes: 66 65 64 68 69 65 68 68 64 6 64 o3 "1 "0 67 69 " i 59 67 "2 "0 67 69 69 66 65 67 70 66 "0 67 64 30 Construya, UE histograma s recue-ricta grupaduquetenga ocho barras. 11. Grneme un . de:. h. de doble tallo rara los datos

. EXAMEN DE CONOCIMIENTOS