Upload
carlos
View
28
Download
3
Tags:
Embed Size (px)
DESCRIPTION
estadistica
Citation preview
TRABAJO COLABORATIVO 1
NELSON FRANCISCO BELTRN FRANCO CODIGO 328228
ESTADISTICA DESCRIPTIVA 100105_14
TUTORA: DIANA CAROLINA MNDEZ M.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA INGENIERIA DE SISTEMAS
CEAD JOSE ACEVEDO Y GOMEZ BOGOT D.C.
8 DE JULIO DE 2015
INTRODUCCIN
Dentro de la formacin integral del estudiante universitario, es importante que aprenda a analizar y construir experimentos que le permitan entender y comprender el comportamiento de la realidad, y para lograr esto, debe utilizar las probabilidades y la estadstica . Esta comprensin se realiza, aprendiendo a analizar los datos, para esto existe la asignatura estadstica descriptiva. Esta asignatura, le permite al estudiante aprender los conceptos y herramientas necesarias, para poder trabajar con los datos y buscarles la mejor explicacin e interpretacin.
JUSTIFICACION
Dentro de la formacin acadmica de los estudiantes de ingenieria, es necesario que los estudiantes adquieran una formacin integral e interdisciplinaria. Es por esta razn que se deben tener los conocimientos mnimos en el rea de las matemticas, y como la estadstica y las probabilidades forman parte de esta, los ingenieros deben tener la formacin necesaria, para poder estar a la altura de los dems profesionales, para poseer las destrezas y criterios necesarios que le permitan trabajar en equipos interdisciplinarios, contando con las mismas capacidades acadmicas y tcnicas de sus colegas. Es por esta razn se debe cursar la primera materia en el rea de las probabilidades y la estadstica. Estadstica descriptiva, esta materia le da los criterios y elementos que el estudiante de ingeniera necesita para poder analizar, crear y evaluar experimentos o hacerles seguimiento a los mismos, as como poder llegar a predecir el comportamiento de los mismos. .
OBJETIVOS
Objetivo general
Practicar por medio de ejercicios concretos, los conceptos estudiados de estadstica descriptiva.
Objetivos particulares:
Identificar que es una serie de datos.
Calcular la media o promedios, la moda la mediana de la serie de datos.
Distinguir la diferencia entre una serie de datos y los datos agrupados.
Entender que es una medida univariante de tendencia central, como se calcula que representa y significa dada una de ellas.
Construir grficos que permitan representar los resultados obtenidos, para una fcil y rpida interpretacin del comportamiento de los resultados obtenidos.
DESARROLLO DEL CONTENIDO DE LA GUIA MOMENTO 1.
Teniendo como punto de partida la base de datos suministrada, y la gua de la fase intermedia momento 1, se solicita a los estudiantes, suministrar la siguiente informacin:
Asociacin de conocimientos
Identificar: La poblacin El tamao de la muestra La ubicacin espacio temporal del estudio La unidad estadstica Las variables (cualitativas, cuantitativas: Discretas y continuas) que intervienen en el problema.
Operacionalizacin de variables
Organizar la informacin a travs de tablas de frecuencia, diagramas de tallo y otras herramientas. Presentar la informacin por medio de diferentes diagramas estadsticos, segn corresponda: (diagrama de barras, diagramas circulares, etc.), segn corresponda. Hallar la moda para cada una de las variables cualitativas.
Medidas univariantes de tendencia central
Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencia para datos NO agrupados, calcular las medidas de tendencia central, media, mediana, moda, los cuartales, decirles 5 y 7; percentiles 30 y 50 e interpretar sus resultados. Elegir una variable continua que sea representativa y siguiendo los lineamientos, disear una tabla de frecuencia para datos agrupados, calcular las medidas de tendencia central, los cuartiles, deciles 3 y 7; percentiles 25, 75 (interpretar sus resultados).
Laboratorio de diagramas estadsticos
Teniendo los trminos de referencia de esta parte del trabajo, se empieza por el tem:
Asociacin de conocimientos
a poblacin: Usuarios del servicio de urgencias del mes de junio del Hospital Federico Lleras Acosta de la ciudad de Ibagu, atendidos las 24 horas del da. En el planteamiento del ejercicio, est definida cual es la poblacin: los usuarios del servicio de urgencias del Hospital Federico Lleras Acosta de la ciudad de Ibagu. b el tamao de la muestra: La muestra tiene un tamao de 120 pacientes registrados como usuarios de los servicios de salud. c ubicacin espacio temporal del estudio: De la misma forma la ubicacin espacio temporal del estudio, la suministra la definicin del ejercicio. Espacialmente est definido en la ciudad de Ibagu, en el Hospital Federico Lleras Acosta, temporalmente, est ubicado del 1 de junio al 9 de junio, las 24 horas de cada da. Con una lectura atenta del enunciado del ejercicio, se puede conocer esta informacin. d unidad estadstica: La unidad estadstica es cada uno de los usuarios que acceden al servicio de salud en el Hospital Federico Lleras Acosta.
e Las variables (cualitativas, cuantitativas: Discretas y continuas) que intervienen en el problema: De la base de datos suministrada en Excel, se puede tener informacin relacionada con las variables:
Variables Cualitativas Variables cuantitativas Da Datos discretos Datos continuos EPS Paciente. Hora de ingreso Genero Fecha de ingreso. Hora de salida Enfermedad Fecha de nacimiento Edad Calificacin del servicio prestado
Nmero de visitas trimestre
peso
Estatura
Operacionalizacin de variables:
Organizar la informacin a travs de tablas de frecuencia, diagramas de tallo y otras herramientas. Para desarrollar este punto, se debe hacer una tabla para cada variable cualitativa, consignando en ella el dato y el nmero de veces que se repite este dato, correspondiente a la frecuencia. Es importante tener en cuentas que la sumatoria de todas las frecuencias, debe ser igual al tamao de la muestra. Estas tablas de frecuencia, se realizan con el software para estadstica recomendado por la universidad dentro de las guias de la materia Estadstica Desriptiva, Infostat versin educativa, (Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versin 2015. Grupo InfoStat, FCA, Universidad Nacional de Crdoba, Argentina. URL http://www.infostat.com.ar). Para una mejor interpretacin y lectura de las tablas de frecuencia, es importante leer el siguiente glosario. FA: Frecuencia absoluta. FR: Frecuencia relativa. FAA: Frecuencia absoluta acumulada. FRA: Frecuencia relativa acumulada. A continuacin de cada tabla se encuentra la grfica que resume la informacin registrada en cada tabla.
Tabla N1 realizada con Infostat/E: 07/07/2015 - 08:49:25 p.m. - [Versin: 10/05/2015]
Tabla de frecuencias variable Da
Variable Clase Categoras FA FR FAA FRA Da 1 DOMINGO 24 0,20 24 0,20 Da 2 JUEVES 16 0,13 40 0,33 Da 3 LUNES 23 0,19 63 0,53 Da 4 MARTES 17 0,14 80 0,67 Da 5 MIERCOLES 15 0,13 95 0,79 Da 6 SABADO 12 0,10 107 0,89 Da 7 VIERNES 13 0,11 120 1,00
0
5
10
15
20
25
Dom
ingo
Lune
s
Martes
Mircoles
Jueves
Vierne
s
Sbado
Frecue
ncia
Da
VariableDa
Se puede hacer un anlisis o comentario de cada tabla y cada grfico. El grfico de la variable da, representa que el da que ms va la gente al mdico es el da Domingo, seguido por el da lunes y el da que menos asiste la gente al servicio de urgencias es el da sbado. En la tabla esto se representa porque la frecuencia relativa es mayor esos das.
Tabla N2 realizada con Infostat/E: 07/07/2015 - 08:58:09 p.m.
- [Versin : 10/05/2015]
Tabla de frecuencias variable EPS
Variable Clase Categoras FA FR FAA FRA EPS 1 CAFESALUD 10 0,08 10 0,08 EPS 2 CAPRECOM 1 0,01 11 0,09 EPS 3 COOMEVA 14 0,12 25 0,21 EPS 4 NUEVAEPS 32 0,27 57 0,48 EPS 5 SALUDCOOP 22 0,18 79 0,66 EPS 6 SALUDTOTAL 13 0,11 92 0,77 EPS 7 SALUDVIDA 15 0,13 107 0,89 EPS 8 SANITAS 6 0,05 113 0,94 EPS 9 SISBEN 7 0,06 120 1,00
Con rNueva En la EPS. Tabl
respecto a a EPS y la
tabla esto
a N 3 r
VariableGnero Gnero
Frecue
ncia
la variable que menor
se puede
realizada -
Tabla d
e Clase 1 2
05
101520253035
Cafesalud
Frecue
ncia
01020304050607080
Frecue
ncia
EPS, la qur nmero de
identificar p
con Infos- [Versi
de frecue
CateHombrMujer
Caprecom
Coom
eva
Homb
ue mayor dee afiliados t
por el valor
stat/E: 0n: 10/05
encia var
egorasre r
Coom
eva
Nue
vaEPS
Saldtotal
EP
VariableE
re
Gen
Variablegen
emanda o atiene es Ca
r de la frec
07/07/2015/2015]
riable G
FA67 053 0
Saludtotal
Saludvida
PS
PS
M
nero
nero
afiliados tieaprecom.
uenta abso
15 - 09:1
nero
FR FAA0,56 67 0,44 120
Saludcoo
p
Sanitas
Mujer
ene es la E
oluta de cad
12:16 p.m
A FRA 0,56 1,00
Sisben
ps
da
m.
De la variable gnero, tanto la tabla de frecuencias como la grfica, reflejan que los hombres son quienes ms visitan el servicio de urgencias.
Tabla N 4 realizada con Infostat/E: 07/07/2015 - 09:31:20 p.m. - [Versin: 10/05/2015]
Tabla de frecuencia variable enfermedad Variable Clase Categoras FA FR FAA FRA Enfermedad 1 AMENAZADEABORTO 2 0,02 2 0,02 Enfermedad 2 AMIGDALITISAGUDA,NOESPECIF.. 1 0,01 3 0,03 Enfermedad 3 ASCITIS 1 0,01 4 0,03 Enfermedad 4 ASMAPREDOMINANTEMENTEALERG.. 1 0,01 5 0,04 Enfermedad 5 BLEFAROCONJUNTIVITIS 1 0,01 6 0,05 Enfermedad 6 BRONQUITISAGUDA,NOESPECIFI.. 1 0,01 7 0,06 Enfermedad 7 CALCULODELRION 1 0,01 8 0,07 Enfermedad 8 CALCULOURINARIO,NOESPECIFI.. 1 0,01 9 0,08 Enfermedad 9 CEFALEA 2 0,02 11 0,09 Enfermedad 10 CELULITISDEOTRASPARTESDELO.. 1 0,01 12 0,10 Enfermedad 11 COLICORENAL,NOESPECIFICADO.. 1 0,01 13 0,11 Enfermedad 12 CONJUNTIVITISAGUDA,NOESPEC.. 1 0,01 14 0,12 Enfermedad 13 CONTUSIONDELARODILLA 1 0,01 15 0,13 Enfermedad 14 CONTUSIONDELTOBILLO 2 0,02 17 0,14 Enfermedad 15 CONTUSIONDEOTRASPARTESDELA.. 1 0,01 18 0,15 Enfermedad 16 CUERPOEXTRAOENLACORNEA 1 0,01 19 0,16 Enfermedad 17 DEPLECIONDELVOLUMEN 1 0,01 20 0,17 Enfermedad 18 DIARREAYGASTROENTERITISDEP.. 11 0,09 31 0,26 Enfermedad 19 DOLORABDOMINALLOCALIZADOEN.. 1 0,01 32 0,27 Enfermedad 20 DOLORENELPECHOALRESPIRAR 1 0,01 33 0,28 Enfermedad 21 DORSALGIA,NOESPECIFICADA 1 0,01 34 0,28 Enfermedad 22 EMBARAZO(AUN)NOCONFIRMADO 1 0,01 35 0,29 Enfermedad 23 EMBOLIAYTROMBOSISDEVENANOE.. 1 0,01 36 0,30 Enfermedad 24 ESGUINCESYTORCEDURASDELTOB.. 2 0,02 38 0,32 Enfermedad 25 ESGUINCESYTORCEDURASQUECOM.. 1 0,01 39 0,33 Enfermedad 26 ESTADOASMATICO 3 0,03 42 0,35 Enfermedad 27 ESTADOMIGRAOSO 1 0,01 43 0,36 Enfermedad 28 FIEBRE,NOESPECIFICADA 1 0,01 44 0,37 Enfermedad 29 FRACTURADELACLAVICULA 1 0,01 45 0,38 Enfermedad 30 HERIDADEDEDO(S)DELPIESINDA.. 1 0,01 46 0,38 Enfermedad 31 HERIDASDELANTEBRAZO,PARTEN.. 1 0,01 47 0,39 Enfermedad 32 HERPESZOSTERDISEMINADO 1 0,01 48 0,40 Enfermedad 33 HIPERTENSIONESENCIAL(PRIMA.. 2 0,02 50 0,42 Enfermedad 34 INFECCIONDEVIASURINARIAS,S.. 3 0,03 53 0,44 Enfermedad 35 INFECCIONLOCALDELAPIELYDEL.. 1 0,01 54 0,45 Enfermedad 36 INFECCIONVIRAL,NOESPECIFIC.. 6 0,05 60 0,50 Enfermedad 37 INSUFICIENCIACARDIACACONGE.. 1 0,01 61 0,51 Enfermedad 38 LARINGITISAGUDA 1 0,01 62 0,52 Enfermedad 39 LUMBAGOCONCIATICA 2 0,02 64 0,53 Enfermedad 40 LUMBAGONOESPECIFICADO 3 0,03 67 0,56 Enfermedad 41 NAUSEAYVOMITO 1 0,01 68 0,57 Enfermedad 42 NEUMONIA,NOESPECIFICADA 1 0,01 69 0,58 Enfermedad 43 OSTEOMIELITIS,NOESPECIFICA.. 1 0,01 70 0,58 Enfermedad 44 OTITISMEDIASUPURATIVAAGUDA.. 1 0,01 71 0,59 Enfermedad 45 OTRAOTITISMEDIAAGUDA,NOSUP.. 1 0,01 72 0,60 Enfermedad 46 OTRASPOLINEUROPATIASESPECI.. 1 0,01 73 0,61 Enfermedad 47 OTRASQUERATITIS 1 0,01 74 0,62 Enfermedad 48 OTRASSINUSITISAGUDAS 1 0,01 75 0,63 Enfermedad 49 OTROSDOLORESABDOMINALESYLO.. 5 0,04 80 0,67 Enfermedad 50 OTROSDOLORESENELPECHO 1 0,01 81 0,68 Enfermedad 51 OTROSTRAUMATISMOSSUPERFICI.. 1 0,01 82 0,68 Enfermedad 52 OTROSVERTIGOSPERIFERICOS 1 0,01 83 0,69
EnfermEnfermEnfermEnfermEnfermEnfermEnfermEnfermEnfermEnferm
Tabl
Tabla
CALCALCALCALCAL
medad medad medad medad medad medad medad medad medad medad
De la varvisitas al gastroenten el serv
la N 5 re
as de frec
Variable LIFICACION LIFICACION LIFICACION LIFICACION LIFICACION
1
53 PARTOUN54 PORDETE55 RETENCI56 RINOFAR57 SINDROM58 SUPERVI59 TRASTOR60 TRAUMAT61 TRAUMAT62 VARICEL
riable Enfeservicio deeritis, hab
vicio de urg
ealizada
cuencias de
DEL SERVIDEL SERVIDEL SERVIDEL SERVIDEL SERVI
1
111
111
51
1
1
22
13
1
NICOESPONTANRMINAR ONDEORINA
RINGITISAGUDMEDELCOLONIRSIONDEEMBAR
RNODELTESTICISMODELACONISMOSSUPERFASINCOMPLIC
ermedad, se urgenciasiendo mucencias.
con Infos[Versin
e la varia
ClaseICIO .. ICIO .. ICIO .. ICIO .. ICIO ..
2
1 1
1
6
1123
1
4
1
121
NEO,PRESE..
DA(RESFRI..RRITABLES..RAZONORMA..CULOYDELE..NJUNTIVAY..FICIALESM..CACIONES
se puede ds, es por has enferm
stat/E: 07n: 10/05/2
able Clasif
e Categor 1 BUENO 2 EXCELE 3 MALO 4 REGUAR 5 REGULA
1
11
1 12 1 11 1 11
11
1
111231
Enfermed
122 1 3 1 4 1 1 2 1
decir que ldeterminar
medades qu
7/07/20152015]
ficacin d
as FA 27ENTE 4 45R 1AR 43
1 21
11 1
11
213
11
ad Ame
Ami
Asci
AsmpredalrBlef
0,01 84 0,18 106 0,01 107 0,03 110 0,01 111 0,03 115 0,01 116 0,01 117 0,02 119 0,01 120
a mayor frr, y le siguue son poc
5 - 09:36:
del servici
FR FAA 0,23 0,03 0,38 0,01 0,36 1
enazaaborto
igdalitisaguda
itis
madominantemergicafaroconjuntivi
0,70 0,88 0,89 0,92 0,93 0,96 0,97 0,98 0,99 1,00
recuencia due diarreaco frecuent
:25 p.m. -
io prestad
FRA 27 0,2331 0,2676 0,6377 0,64120 1,00
ne
tis
de a y es
-
do
De la varopcin msolamentefrecuenciaCalificaci Hallar la m La moda
riable calificalo tiene ee un 4%, a absolutan servicio.
moda para
es el dato q
VariablDa EPS
GeneroEnferm
Clasific
44
cacin del el 45% de esto se ve
a de cada.
cada una d
que ms se
le
o medad
cacin serv
Calific
servicio, sla serie de
e reflejado a una de
de las varia
e presenta o
vicio
27
45
cacinservic
e puede vee datos, y
en la tablestas op
bles cualita
o repite en
MoDomNue32HomPor22Ma
4
cio
er con facila alternatila de frecuciones de
ativas
una muest
oda mingo, freceva EPS, fr
mbre, frecur determina
alo, frecuenc
Buen
Excel
Malo
Regu
ilidad, que va excelen
uencia, en la variab
tra..
cuencia: 24recuencia:
uencia: 67ar: frecuenc
cia: 45
no
ente
o
lar
la nte
la ble
cia
Medidas univariantes de tendencia central: Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencia para datos NO agrupados, calcular las medidas de tendencia central, media, mediana, moda, los cuartales, decirles 5 y 7; percentiles 30 y 50 e interpretar sus resultados.
Variable discreta Variable continua Nmero de visitas en el trimestre
Peso
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3
El paso siguiente es ordenar los datos que se encuentran en esta tabla, de esta forma se puede calcular el primer cuartil ( ), que corresponde al 25%, el segundo cuartil ( ), que corresponde al 50% y que es igual a la media o mediana, y el tercer cuartil ( ), que corresponde al 75%. (Navidi, 2006) , (Devore J. L., 2008). En esta tabla se tiene un total de 120 datos,
Visita # de visitas1 86 2 26 3 8
Total 120 La media aritmtica ponderara es igual a:
1.35 En ese caso se calcula la media ponderada, que significa que en promedio se cada persona realiza 1.35 visitas en el trimestre.
La mediana es el valor central o la media de los dos valores centrales de los datos ordenados. En este caso, como el nmero de datos es par, n= 120, entonces se hace:
60, en la lista ordenada ascendentemente, el valor es correspondiente a promediar la posicin 60 y 61, y es igual a 1. que corresponde con el valor de la mediana. La moda es el dato que ms se repite, en esta serie es: 1, que se repite 86 veces. Para el clculo de los cuartiles, se debe analizar el 25% de los datos, el 50%, y el 75% de los mismos., Esto se hace, ya que los cuartiles, dividen la muestra en cuartos. Los deciles en decenas y los percentiles en 10 partes. (Martinez C. B., 2011), (Triola. M.F., 2009), (Ortegon M. & Cabrera F., 2010). El primer cuartil, correspondiente al 25%, es: ( 1). Qu indica el primer cuartil? Este valor, indica el dato que se encuentra en el punto que corresponde al primer cuarto del total de los datos de la muestra, esto quiere decir que en este caso, la muestra tiene 120 datos, entonces al ordenarlos en orden ascendente, el dato correspondiente al lugar 30 de la lista, es el primer cuartil. (Martinez C. B., 2011), (Ortegon M. & Cabrera F., 2010). El segundo cuartil, correspondiente al 50%, es: ( 1). En el caso del segundo cuartil, corresponde al dato que se encuentra en la mitad de la lista de los datos ordenados en orden ascendente, es igual a la mediana de la muestra. (Martinez C. B., 2011), (Ortegon M. & Cabrera F., 2010). El tercer cuartil, correspondiente al 75%, es: ( 2). En el caso del tercer cuartil, corresponde al dato que se encuentra en las tres cuartas partes de la lista de los datos ordenados en orden ascendente, tambin hay que anotar que es igual al percentil 75. (Ortegon M. & Cabrera F., 2010)
El decil 3, es igual a 1. En el caso del decil 3, corresponde al dato que se encuentra en en el primer 30% de la lista de los datos ordenados en orden ascendente. Y esto quiere decir que ese valor esta por encima del 30% de los datos de la muestra. (Ortegon M. & Cabrera F., 2010). El decil 7, es igual a 1. En el caso del decil 7, corresponde al dato que se encuentra en el primer 70% de la lista de los datos ordenados en orden ascendente. Y esto quiere decir que ese valor esta por encima del 70% de los datos de la muestra. (Ortegon M. & Cabrera F., 2010). El percentil 25, es igual a 1. En el caso del percentil 25, corresponde al dato que se encuentra en el primer 25% de la lista de los datos ordenados en orden ascendente. Y esto quiere decir que ese valor esta por encima del 25% de los dems datos de la muestra. Este valor es igual al del primer cuartil. (Ortegon M. & Cabrera F., 2010). El percentil 75, es igual a 2. En el caso del percentil 75, corresponde al dato que se encuentra en el primer 75% de la lista de los datos ordenados en orden ascendente. Y esto quiere decir que ese valor esta por encima del 75% de los dems datos de la muestra. Es importante aclarar, que este valor es igual al del tercer cuartil. (Ortegon M. & Cabrera F., 2010). Los clculos anteriores fueron realizados con Excel y con el programa Infostat/E. que es el recomendado en la gua del curso
Tabla N 6 realizada con Infostat/E: 08/07/2015 - 05:26:13 p.m. - [Versin : 10/05/2015]
Tabla de frecuencia variable visitas ltimo trimestre
Variable Clase LI LS MC FA FR FAA FRA N VISITAS ULTIMO TRIMESTR.. 1 [ 1,00 1,33 ] 1,17 86 0,72 86 0,72 N VISITAS ULTIMO TRIMESTR.. 2 ( 1,33 1,67 ] 1,50 0 0,00 86 0,72 N VISITAS ULTIMO TRIMESTR.. 3 ( 1,67 2,00 ] 1,83 26 0,22 112 0,93 N VISITAS ULTIMO TRIMESTR.. 4 ( 2,00 2,33 ] 2,17 0 0,00 112 0,93 N VISITAS ULTIMO TRIMESTR.. 5 ( 2,33 2,67 ] 2,50 0 0,00 112 0,93 N VISITAS ULTIMO TRIMESTR.. 6 ( 2,67 3,00 ] 2,83 8 0,07 120 1,00
Tabla N 7 realizada con Infostat/E: 08/07/2015 - 05:00:04 p.m. - [Versin : 10/05/2015]
Medidas resumen
Resumen N VISITAS ULTIMO TRIMESTR.. n 120,00 Media 1,35 Mn 1,00 Mx 3,00 Mediana 1,00 Q1 1,00 Q3 2,00 Suma 162,00 P(05) 1,00 P(10) 1,00 P(25) 1,00 P(50) 1,00 P(75) 2,00 P(90) 2,00 P(95) 3,00 Percentil 3 1,00 Percentil 7 1,00
Este es el diagrama de cajas, que representa los cuartiles, la media y los valores extremos, fue realizado con el software Infostat/E.
tudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin E
di il i di il i di il i di il
0,90
1,45
2,00
2,55
3,10
N V
ISIT
AS
ULT
IMO
TR
IME
STR
E
N VISITAS ULTIMO TRIMESTRE
Medidas univariantes de tendencia central: Elegir una variable continua que sea representativa y siguiendo los lineamientos, disear una tabla de frecuencia para datos agrupados, calcular las medidas de tendencia central, los cuartiles, deciles 3 y 7; percentiles 25, 75 (interpretar sus resultados).
La variable continua que se va a trabajar en este ejercicio, es la variable peso, los datos estn dados en kilogramos.
Variable: peso 2,6 9,7 16,9 45,8 54 57,3 58,6 60,5 62,7 65,2 67,2 70 72,9 78,5 85
3,1 11,9 18,3 45,8 54,9 57,6 58,8 60,5 62,9 65,2 67,2 70 72,9 78,5 85 3,1 12,5 19,7 45,9 55 57,8 58,9 60,6 62,9 65,4 67,2 70 73,8 78,6 85
3,4 14,2 23 50,2 55,2 57,9 60 60,8 63,2 65,6 67,2 70,2 75,3 78,6 85,83,9 15,3 24,5 52,6 55,9 58 60 60,8 63,8 65,7 67,5 70,8 78 78,6 85,8
5,2 15,9 30,5 52,7 56 58,2 60 60,8 64,3 65,7 67,9 72 78,1 78,9 85,98,9 16,5 45 52,9 56,8 58,2 60,2 61,6 64,3 65,8 67,9 72,5 78,4 79,5 87,2
9,4 16,7 45,2 53,8 56,9 58,3 60,3 62,3 65 65,9 68,9 72,9 78,5 80,9 87,5
Tabla N 7 realizada con Infostat/E: 07/07/2015 - 11:17:13 p.m. - [Versin : 10/05/2015]
Tabla de frecuencia variable Peso Variable Clase LI LS MC FA FR FAA FRA Peso 1 [ 2,60 16,75 ] 9,68 16 0,13 16 0,13 Peso 2 ( 16,75 30,90 ] 23,83 6 0,05 22 0,18 Peso 3 ( 30,90 45,05 ] 37,98 1 0,01 23 0,19 Peso 4 ( 45,05 59,20 ] 52,13 28 0,23 51 0,43 Peso 5 ( 59,20 73,35 ] 66,28 47 0,39 98 0,82 Peso 6 ( 73,35 87,50 ] 80,43 22 0,18 120 1,00
Esta tabla presenta 6 clases, para agrupar los datos, ya que el software, utiliza otro algoritmo diferente a la ecuacin se Sturges, para calcular el nmero de las clases. Pero en contexto, despus de haber analizado los datos, se puede verificar que los valores con aproximados, siendo el error mnimo, para el desarrollo el presente ejercicio.
Tabla N 8 realizada con Infostat/E: 07/07/2015 - 11:18:55 p.m. - [Versin : 10/05/2015]
Medidas resumen
Resumen Peso
n 120,00 Media 55,98 Mediana 60,80 Q1 52,70 Q3 70,00 P(05) 5,20 P(10) 14,20 P(25) 52,70 P(50) 60,80 P(75) 70,00 P(90) 78,60 P(95) 85,00 Percentil 03, 3,40 Percentil 07 9,70
Esta es la tabla resumen, que contiene los valores de:
el nmero de datos la media, la mediana los cuartiles los percentiles 5, 10, 25, 50, 75, 90, 95, 3, 7. En este caso es
importante notar que Estos dos valores son iguales conceptualmente y numricamente, ya que estn ubicados en el primer cuarto de la serie de datos. Esto se repite en el cado de
La grfica de cajas y bigotes, que aparece a continuacin, representa
los estadsticos calculados y contenidos en la tabla resumen, adems datos dispersos, por fuera del 1.5IQR de la serie antes de
, y despus de . A continuacin aparece el histograma con una representacin de la
distribucin normal de los datos. Las clases que aparecen, fueron generadas por el software.
A continuacin se encuentran los clculos que se realizaron de forma manual, y al final, se pueden comparar los resultados, y se puede comprobar que no se alejan de los clculos contenidos en las tablas anteriores. Estos clculos realizados a la misma serie de datos, se realizaron para comparar y comprobar si los valores tenan una diferencia grande, pero despus de compararlos, se comprueba que en ambos casos los resultados son aceptables.
El primer paso es calcular el rango de los datos
Para esta serie de datos, el rango es 88 2 = 86
Nmero de clases: aplicando la regla de Sturges:
1 3.322 log 120 7.91 8
Amplitud de los intervalos de clase:
A = 10.75 11
tudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin E
di il i di il i di il i di il
-1,65
21,70
45,05
68,40
91,75
Pes
o
Grafico de cajas para la variable peso
tudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin Etudiantil Versin Estudiantil Versin Estudiantil Versin EstudiantilVersin Estudiantil Versin Estudiantil Versin Estudiantil Versin E
di il i di il i di il i di il
-4,47 9,68 23,83 37,98 52,13 66,28 80,43 94,58Peso
0,00
12,34
24,68
37,01
49,35
frecu
enci
a ab
solu
ta
Histograma-PesoAjuste: Normal(55,983,518,599)
Como se redonde, se debe hallar el nuevo rango que es:
11 8 88
[88 86 = 2], existe un exceso de 2, entonces se debe distribuir quitando 1 al lmite inferior, y sumando 1 al lmite superior.
2 1 1
88 1 89
Intervalos de clase:
1 8 1 7, este valor se agrega al lmite inferior de cada clase, empezando por el lmite inferior del rango.
1 + 7 = 8 9 + 7 = 16
17 + 7 = 2425 + 7 = 3233 + 7 = 4041 + 7 = 4849 + 7 = 5657 + 7 = 6465 + 7 = 7273 + 7 = 8081 + 7 = 88
Ahora se deben calcular los lmites reales de cada intervalo de clase:
( 0 + 1 ) / 2 = 0.5 ( 8 + 9 ) / 2 = 8.5
( 16 + 17 ) / 2 = 16.5( 24 + 25 ) / 2 = 24.5( 32 + 33 ) /2 = 32.5 ( 40 + 41 ) / 2 = 40.5( 48 + 49 ) / 2 = 48.5( 56 + 57 ) / 2 = 56.5( 64 + 65 ) / 2 = 64.5( 72 + 73 ) / 2 = 72.5( 80 + 81 ) /2 = 80.5 ( 88 + 89 ) /2 = 88.5
La tabla de distribucin de las frecuencias agrupadas de la variable peso es:
Distribucin de frecuencia de la variable peso Intervalo de clase
Frecuenciaabsoluta
Frecuenciaabsoluta acumulada
Frecuencia relativa
Frecuencia relativa acumulada
0.5 8.5 6 6 0,050 0,050 8.6 16.5 9 15 0,075 0,125
16.6 24.5 6 21 0,050 0,175 24.6 32.5 1 22 0,008 0,183 32.6 40.5 0 22 0,000 0,183 40.6 48.5 5 27 0,042 0,225 48.6 56.5 11 38 0,092 0,317 56.6 64.5 33 71 0,275 0,592 64.6 72.5 24 95 0,200 0,792 72.6 80.5 16 111 0,133 0,925 80.6 88.5 9 120 0,075 1,000
Total 120 1,000
Intervalo de clase
Marca de claseX
FrecuenciaAbsoluta f
f*x
0.5 8.5 4,5 6 27,008.6 16.5 12,55 9 112,95
16.6 24.5 20,55 6 123,3024.6 32.5 28,55 1 28,5532.6 40.5 36,55 0 0,0040.6 48.5 44,55 5 222,7548.6 56.5 52,55 11 578,0556.6 64.5 60,55 33 1998,1564.6 72.5 68,55 24 1645,2072.6 80.5 76,55 16 1224,8080.6 88.5 84,55 9 760,95
Total 120 6721,7 La media aritmtica es:
. 56.01
Para el clculo de la mediana, se sigue el siguiente procedimiento: Se sabe que es el dato que divide la distribucin en 2 partes iguales.
60 que es el nmero de la frecuencia acumulada. En este ejercicio, corresponde a la clase 56.6 64.5, por que el nmero de frecuencia acumulado esta dentro de ella.
60 38 22 Este valor se interpola
Frecuencia absoluta
Ancho de clase
33 7.9 22 x
22 7.9
33 5.27
La mediana es 5.27 unidad mayor que el lmite interior de la clase donde se encuentra, esto es:
5.27 56.6 61.87. La mediana 61.87. En los literatura existente de estadstica, utilizan una formula, para calcular la moda, pero es ms intuitivo el procedimiento que se a aplicado expuesto en (Ortegon M. & Cabrera F., 2010). La moda es el dato que ms se repite o el ms frecuente dentro de una serie. Para datos agrupados, se acostumbra utilizar la siguiente formula:
: Frecuencia absoluta de la clase anterior a la que se encuentra la
moda. : Frecuencia absoluta de la clase siguiente a la que se encuentra la
moda. : es la amplitud de la clase donde se encuentra la moda. : es el lmite inferior de la clase donde est la moda.
La moda para esta serie de datos es 67,2, ya que se repite 4 veces. Esto quiere decir que se encuentra dentro de la clase 64.6 72.5.
7.4 64.6 69.6
(Ortegon M. & Cabrera F., 2010). Para calcular los cuartiles se utiliza el mismo procedimiento.se divide la distribucin en 4 partes iguales, que es el lo que hacen los 3 cuartiles. Para el primer cuartil, se hace 30, es el dato ubicado en la posicin 30 de la serie en orden ascendente. En este ejercicio, corresponde a la clase 48.6 56.5, por que el nmero de frecuencia acumulado esta dentro de ella.
30 27 3 Este valor se interpola
Frecuencia absoluta
Ancho de clase
11 7.9 3 x
3 7.9
11 2.15
El primer cuartil es 2.15 unidad mayor que el lmite interior de la clase donde se encuentra, esto es:
2.15 48.6 50.75
= 50.75 Para el segundo cuartil, que es igual al 50% de la serie de datos, se hace
60, Este valor se calcul, cuando se calculo la media, ya que el es igual a la media porque divide la serie en 2 partes iguales. En este
caso es: = 61.87
Para el tercer cuartil, que es igual al 75% de la seria, se hace 90, que corresponde a 70 comprobando en la serie ordenada antes de agrupar los datos. En este ejercicio, corresponde a la clase 64.6 72.5, porque el nmero de frecuencia acumulado esta dentro de ella.
90 71 19 Este valor se interpola
Frecuencia absoluta
Ancho de clase
24 7.9 19 x
19 7.9
33 6.25
El tercer cuartil es 4.55 unidad mayor que el lmite interior de la clase donde se encuentra, esto es:
6.25 64.6 70.85
= 70.85
Estos clculos se realizaron de acuerdo con la explicacin expuesta en (Ortegon M. & Cabrera F., 2010). Clculo de decil 3. El total de la muestra son 120 datos, el 30% de la muestra es:
120 0.3 36 Este valor est dentro de la marca de clase 48.6 56.5,
36 27 9 interpolando este valor se tiene:
Frecuencia absoluta
Ancho de clase
11 7.9 9 x
Tabla N 16
9 7.9
11 6.46
El decil 3 es 4.55 unidad mayor que el lmite interior de la clase donde se encuentra, esto es:
6.46 48.6 55.06
= 55.06 Clculo de decil 7. El total de la muestra son 120 datos, el 7% de la muestra es:
120 0.7 84 Este valor est dentro de la marca de clase 64.6 72.5,
84 71 13 interpolando este valor se tiene:
Frecuencia absoluta
Ancho de clase
24 7.9 13 x
Tabla N 17
13 7.9
24 4.28
El decil 7 es 4.28 unidad mayor que el lmite interior de la clase donde se encuentra, esto es:
4.28 64.6 68.88
= 68.88 El clculo del percentil 25, es igual al valor del cuartil 1
, esto quiere decir que 50.75 esto es cierto, ya que es el punto mayor al 25% de la serie de datos en orden ascendente, y es el punto mayor que el 25% de la serie de datos. Estos dos puntos, marcan el primer cuarto de la serie de datos. El clculo del percentil 75, es igual al valor del cuartil 3
, porque este punto divide la serie de datos en el 75% de los dados, y en ese ejercicio 70.85.
ANEXLabo
1.
PechEspaMariLibre
XOS ratorio de
El entrenateniendo continuac
ho Maripalda Libreposa Libree Espa
Parfrec
VarPecMaEspLibrTot
Ela
i
diagramas
ador del eqen cuenta
cin se pres
posa Espae Libree Maripalda Pech
ra poder recuencia.
riable Frecho 8 riposa 6 palda 8 re 10 tal 32
aborar el dia
0
2
4
6
8
10
12
Frecue
ncia
s estadstic
uipo de nata el estilo sentan los r
alda Peche Espaposa Maripho Pech
esolver est
ecuencia
agrama de
Pecho
EST
cos
tacin ha den el cual
resultados o
o Pecholda Espal
posa Maripo Libre
e ejercicio,
barras corr
Mariposa
TILOSDEN
decidido clal su rendimobtenidos:
o Mariplda Libre
posa EspalPecho
, es necesa
respondien
Espald
Estilos
NATACIN
asificar a sumiento en
osa Libre Libre
da Pechoo Espald
ario realiza
te:
da
us deportistmuy alto.
PechoEspalda
o Libre da Libre
ar la tabla d
Libre
as A
a
de
2.
Co
Escribir do
A partir destilo queserie de practicanttiene el 2mariposa
Observanbarras, epermite ael valor deel porcentpara un in
Para verifse selecccentmetrproducto. Los result
nstruir un d
os conclusi
del diagrame ms se prdatos, esotes en el qu5% y el quque tiene e
ndo los doss ideal cupreciar cone estas portaje de partnforme que
ficar el efecciono una os despus
tados son lo
diagrama ci
iones a par
ma de barraractica es eo quiere deuipo, le sigue practica el 19% de la
s diagramauando se gn claridad, r estilo. En ticipantes drequiera so
cto de un nmuestra d
s de 3 mes
os siguiente
25%
31%
Est
rcular que
rtir del grfic
as, se pueel estilo librecir que esue el estiloel menor n
a poblacin
as, se puegrafican losque estilo tcambio en
de cada unolamente c
nuevo pestide 42 matses de habe
es:
25%
tilosde
represente
co:
ede apreciare, ya que rs el estilo o pecho y mnmero de n del equipo
ede conclus estilos vtiene mayo
n el diagramo de los es
consolidado
cida aplicatas y se ler sido plan
%
19%
natacin
la variable
ar con facirepresenta con mayo
mariposa, qdeportista
o.
ir que el dvs frecuencor frecuencima circular,stilos, siendos.
do a un cues midi sntadas y re
n
e:
lidad, que el 31% de r nmero d
que cada uns es el est
diagrama dcias, ya quia, y cual , permite ledo de utilida
ltivo de cafsu altura egadas con
Pecho
Mariposa
Espalda
Libre
el la
de no tilo
de ue es
eer ad
f, en el
25,4
18,6
25,8
37,7
16,8
37,2
Con baseclases, pa
Realizar u
Escribir do
25,2
34,7
32,6
42,8
21,3
38,3
e en esta seara poder a
un histogram
os concusio
0
2
4
6
8
10
12
14
16
Frecue
ncias
42,3
28
34,3
29,4
35,4
24,3
erie de datoagrupar los
Clase(cm)
16 2121 2727 3333 3939 45Totales
ma de frecu
ones a part
6 21 21
M
Histog
38,7
29,1
27,9
36,2
28
39
os suministdatos y rea
Frecuen
1 4 7 8 3 129 135 5 s 42
uencias pa
tir del grfic
27 27
Marcasdeclase
gramadefr
24
19,4
31,6
28,5
32,9
23,6
trada en el alizar una t
ncia
ra la variab
co
33 33
evariablealtu
recuencia
35,5
30,6
32,8
38,6
39,7
26,5
ejercicio, stabla de fre
ble: altura.
39 39 4
ra
42,3
37,5
36
40,5
20
31,4
se construyeecuencia.
45
en
El tener organizadas las alturas, en clases, permite saber dentro de que intervalos se encuentran clasificadas las plantas de acuerdo a su altura. Con base en este grfico se puede concluir que el mayor nmero de plantas esta dentro del rango de alturas 33 39, estando las alturas en centmetros, que corresponde a la mayor cantidad de plantas. El menor nmero de plantas esta dentro del rango o la clase de 16 a 21 cm. Este ejercicio, permite entender la importancia de agrupar los datos utilizando clases; cuando se tienen series grandes de datos, es necesario agruparlos, para poder realizar los anlisis estadsticos correspondientes.
3. Una empresa de desechables va a producir un nuevo tipo de envase, para lquidos. Por tal razn midi El volumen de 60 recipientes que se usaron en una nueva prueba de aceptacin
Volumen ( Frecuencia0 5 4
5 10 8 10 - 15 10 15 20 11 20 25 12 25 30 15
Total 60
Construir un polgono de frecuencia para la variable Volumen.
Escribir dos conclusiones a partir del grfico.
02468
10121416
0 5 5 10 10 15 15 20 20 25 25 30
Freciencias
Marcasdeclasevariablevolumen
Polgonodefrecuencias
El volumen que tuvo la mayor frecuencia es el que est dentro de la clase o rango de 25 a 30 . El que tuvo la menor frecuencia o que menos apareci dentro de los 60 recipientes fue el volumen de 0 a 5 . Trabajar con datos agrupados, permite llegar a conclusiones con mayor facilidad porque permite que se miren los datos en conjunto, al graficarlos, es ms fcil sacar conclusiones del total de la serie de datos.
CONCLUSIONES
Este trabajo ha permitido llegar a conclusiones importantes relacionadas con la estadstica descriptiva. Es importante organizar los datos, para poder conocer los extremos
de la serie, el punto medio, y los diferentes sectores o tramos de esta serie, o el dato que ms se repite.
A estos extremos, se les llama lmite inferior y lmite superior de la
serie de datos. Al punto medio de la serie, se aprendi gracias a ese trabajo que se
le llama la media, y como se debe calcular cuando la serie es par o impar.
A los diferentes sectores o tramos, se aprendi que se les llama
cuartiles, por dividir la serie de datos en cuatro partes iguales A los que la dividen en 10 sectores iguales, se les llama deciles. A los que la dividen en 100 partes, se les llama percentiles. El conocer cualquiera de estos puntos, lo que indica es que el resto
de la serie de datos, est a la derecha si se representan en una recta
real o es menor que el punto tratado o encontrado, puede se cuartil, decil, percentil, media.
Cuando se trabaja con series de datos grandes, es mucho mejor
agruparlos para poderlos analizar y entender el comportamiento de estos.
Las graficas de los datos, ayudan a tener un conocimiento fcil y
rpido del comportamiento del fenmeno o experimento que se est estudiando, pero es importante realizar la grfica adecuada para poder tener una apreciacin acertada del experimento que se est estudiando.
Es importante mencionar la facilidad de utilizar software
especializado para estadstica, como es el caso del Infostat/E, ya que permite obtener las tablas con los clculos estadsticos, y realizar las grficas apropiadas para este tipo de datos.
REFERENCIAS BIBLIOGRFICAS. Devore J. L. (2008). Probabilidad y estadstica para ingeniera y ciencias 7 ed. Mxico: Cengage Learning. Levine. D.M., K. T. (2012). Estadstica para Administracin 4 Ed. Mxico: Person Educacin. Martinez C. B. (2011). Estadstica bsica aplicada 4 ed. Bogot D.C.: Ecoe Ediciones. Navidi, W. (2006). Estadstica para ingenieros. Mxico: McGrawHill. Ortegn M. & Cabrera F. (2010). 100105 Estadstica descriptiva 2 ed. Ibagu: Universidad Nacional Abierta y a Distancia. Triola. M.F. (2009). Estadstica, 10 Ed. Mxico: Pearson Educacin.