MEDIDAS DE TENDENCIA CENTRAL
Nos indica en torno a que valor se distribuyen los datos
Sirve como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.
Algunas de las medidas de tendencia central son
Media
Aritmética Geométrica
Es el promedio de la recolección de datos
El cálculo se hace de dos formas diferentes
Datos No Agrupados
Se calcula sumando todos los datos y dividiendo por el número total de ellos.
X=∑i=1
n
X i
n
Datos Agrupados
Son los datos organizados en una distribución de frecuencias, que por lo general corresponden a datos de tipo continuo, y en una cantidad que exceden a 20 datos.
Marcas de Clases
Es el punto medio de cada intervalo de clase, la denotaremos como Xi
Propiedades1. La media es única
2. El cálculo de la media
3. Cuando existen datos extremos suficientemente distantes de la mayoría de los datos la media no es una medida muy confiable.
Es útil para calcular medias de porcentajes, tanto por uno, puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los valores extremos.
El cálculo se hace de dos formas
Datos AgrupadosDatos No Agrupados
Mg = n√X
1f 1∗X
2f2¿ X
3f3¿ .. .∗X
nfn
Mg =
Interés simple
Aplicaciones delas progresiones geométricas
Mediana
Formula
Se cobra únicamente sobre el capital dado en préstamos y no sobre los intereses producidos por el mismo
Interés compuesto Consiste en sumar periódicamente los intereses más el capital.
Determina la posición central que ocupa un dato en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.
Datos No Agrupados Datos Agrupados
Si los datos son impar, entonces la mediana es el dato central, entonces la distribución organizada en forma ascendente o descendente es la mediana.
Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.
Se encuentra mediantela fórmula
Me= Li +
( n2−Faf )∗C
Cuantiles
Son medidas derivadas de la mediana, e intentan medir en valores de proporción más pequeña que la mediana misma a una muestra.
Cuartiles
Son medidas de tendencia central que dividen la distribución de datos en cuatro partes iguales. Q1 =
Li+( n4−Fafo )∗c
Deciles
Muestra la importancia de la décima parte de la muestra analizada. CJK =
Li+( k∗n10−Fa
fo )∗c
Percentiles
Muestra la importancia de la centésima parte de la muestra analizada. PJK =
Li+( k∗n100−Fa
fo )∗c
Quintil
Muestra la importancia de la centésima parte de la muestra analizada.
Propiedades de la media
1. Es una medida descriptiva
2. Es de cálculo rápido y de interpretación sencilla.
3. variable discreta es siempre un valor de la variable
4. Es función de los intervalos escogidos.
Moda
La moda es el valor que ocurre con mayor frecuencia en una distribución de datos
Datos No Agrupados
Simplemente será contar el número de datos y observar su frecuencia
Datos Agrupados
Se encuentra mediantela fórmula
Mo = Li + ( Δ1Δ1+Δ2 )*C
Propiedades de la moda
1. Es muy fácil de calcular.
2. Puede no ser única.
3. Es función de los intervalos elegidos a través de su amplitud, número y límites de los mismos.
4. Aunque el primero o el último de losintervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.
5. Esta dada solo en términos de las frecuencias absolutas
MEDIDAS DE TENDENCIA CENTRAL
En dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos.
Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores.
Rango o recorrido
Solo considera los dos valores extremos de una colección de datos.
Fórmula
R = Xmax – Xmin
Desviación media
Mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información
El objetivo es determinar cuánto se alejan o se acercan los datos de la media.
No Agrupados
Dm=∑i=1
n
|Xi−X|
n
No Agrupados
Dm=∑i=1
n
|Xi−X|∗f
n
VarianzaCoeficiencia de variabilidad
Podemos decir que como mínimo un 75% de los datos se encuentran localizados en un intervalo de 2 desviaciones estándares contados hacia arriba y hacia abajo, a partir de la media
No Agrupados
S2=∑i=1
n
(Xi−X )2
n
Agrupados
S2=∑i=1
n
(Xi−X )2∗f
n
El coeficiente de variación es una medida absoluta, adimensional. No depende de las unidades en las que se esté midiendo.
Fórmula
CV =
1. La siguiente tabla muestra las diferentes actividades realizados por diferentes personas en una institución educativa de la ciudad y su correspondiente asignación salarial.
a. Encontrar el salario promediob. Si se conviene reconocerles $70 diarios de aumento, cual es el nuevo salario promedio?
Trabajadores No Salarios
RectorSecretariasCoordinadoresDocentesCeladoresAseadoras
1424534
2’000.000750.0001’500.0001’200.000600.000450.000
A.)Salarios= 2000000∗1+750000∗4+1500000∗2+1200000∗45+600000∗3+450000∗4
59=¿
6560000059
=¿1’111.864
B.)Trabajadores No Salarios
RectorSecretariasCoordinadoresDocentesCeladoresAseadoras
1424534
2’002.100752.1001’502.1001’202.100602.100452.100
Salarios= 2002100∗1+752100∗4+1502100∗2+1202100∗45+602100∗3+452100∗4
59=65723900
59=¿
1’113.964
2. Cuatro grupos de estudiantes consistentes en 15, 20, 10 y 18, individuos, dieron pesos medios de 162, 148, 153, y 140 lb, respectivamente. Hallar el peso medio de todos los estudiantes.
Estudiantes Cantidad Peso
Ejercicios
compendio 5 y 6
1234
15201018
162148153140
Peso=162∗15+148∗20+153∗10+140∗18
63=944063
=¿149,8
3. Los siguientes datos representan las notas definitivas de 45 estudiantes en un curso de estadística aplicada.
4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.03.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.43.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.63.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.12.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4
A. Encuentre la nota promedio del grupo.B. El resultado de la media puede asegurar con certeza el rendimiento académico del
grupo?C. Si las dos primeras filas de los datos representan las notas de estudiantes de sexo
femenino, calcule las medias de los hombres y de las mujeres.D. Con la media de los hombres y de las mujeres calcule la media total.E. Compare el resultado anterior con el resultado encontrado en el primer punto.
A.) FORMULAS EN R:R= 5-1=4m=1+3.3*log(45)=6
c=46=0,666= 0,7
rango=0,7*6=4.2diferencia = 4.2-4=0.2xmin= 1-0.1=0.9xmax=5+0.1=5.1
MEDIA= 147.9545
=3.28
B.) en realidad no, puesto que la media pone al grupo en un término promedio de 3.28 excluyendo a 20 estudiantes que están por encima de la media.
C.) mujeres: 4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.03.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.4Hombres:3.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.63.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.12.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4
Mujeres=4.5+2,3+1+5∗2+3,2∗2+2,8+3.5+4,2∗2+1,8∗2+2,9∗2+3,1+3,3+4,4
18=¿
3.28
Hombres=3.3∗5+1.7∗2+1+2.2+3.8∗2+4,2+3.1+4.6+1.5+2.6+4.1∗2+4.8+4.4∗3+4.5+4+3.5+2.1+2.7
27=¿
3.3
Intervalos
Notas
f xi f* xi
0.9-1.6
1.6-2.3
2.3-3
3-3.7
3.7-4.4
4.4-5.1
3
7
5
12
12
6
1.25
1.95
2.65
3.35
4.05
4.75
3.75
13.65
13.25
40.20
48.60
28.50
45 147.95
D.) MEDIA TOTAL: 3.28∗18+3.32∗27
45=3.304
4. Al consejo directivo de un colegio le han llegado las quejas de que los precios de las comidas y artículos que se venden en la cafetería están elevados. Para averiguar si el rumor es cierto se tomaron como muestra algunos artículos encontrándose los siguientes precios.
70 86 75 72 66 90 85 70
72 81 70 75 84 62 66 74
82 75 68 83 81 65 75 70
73 65 82 80 66 73 95
85 84 75 68 80 75 68 72
78 73 72 68 84 75 72 80
Para ayudar al consejo directivo y determinar si el rumor es cierto o falso realice las siguientes actividades.
a. Agrupar en intervalos de clase apropiadosb. Determinar el precio promedio de los artículosc. Determinar la mediana de los artículosd. Calcule, Q1, Q3, D3, D5, D7, P80, V2, V3, P70.e. Realice un gráfico de bigotes y su respectivo análisis con las medidas visualizadasf. Realice un gráfico de barrasg. Realice un gráfico de ojivas de la distribución.h. Respecto a las gráficas y las medidas de tendencia central, elabore una conclusión.
A.) FORMULAS EN R Rango= 95-62=33m=1+3.3*log(47)=7
c=337
=4.714=5
rango=7*5=35diferencia =35-33=2xmin= 62-1=61xmax=95+1=96
B.) media precio promedio= 3509.547
=74.67
C.)
intervalos f h F H marca X(61,66] 6 0.1276596 6 0.1276596 63.5 381.0(66,71] 8 0.1702128 14 0.2978723 68.5 548.0(71,76] 16 0.3404255 30 0.6382979 73.5 1176.0(76,81] 6 0.1276596 36 0.7659574 78.5 471.0(81,86] 9 0.1914894 45 0.9574468 83.5 751.5(86,91] 1 0.0212766 46 0.9787234 88.5 88.5(91,96] 1 0.0212766 47 10.000.00
093.5 93.5
Mediana= Me= Li + ( n2−Faf )∗C
ME=71+( 472 −14
16 )∗5=73.96875
Intervalos
Precios
F xi f* xi
61-66
66-71
71-76
76-81
81-86
86-91
91-96
6
8
16
6
9
1
1
63.5
68.5
73.5
78.5
83.5
88.5
93.5
381
548
1176
471
751.5
88.5
93.5
47 3509.5
D.) Q1=66+( 474 −6
8 )∗5=69,59375Q3=76+( 3∗474 −30
6 )∗5=80.375D3=71+( 3∗4710 −14
16 )∗5=71.03125D5=71+( 5∗4710 −14
16 )∗5=73.96875D7=76+( 7∗4710 −30
6 )∗5=78.41667P80=81+( 80∗47100
−36
9 )∗5=81.8889P70=76+( 80∗47100
−30
6 )∗5=78.41667V2=71+( 2∗475 −14
16 )∗5=72.5V3=71+( 3∗475 −14
16 )∗5=75.4375
5) En un colegio con modalidad en agropecuaria, el peso en kilogramos presentado por el
departamento de porcicultura en la experimental ABC viene dado por la tabla.
Pesos Frecuencias
118 _ 126127 _ 135136 _ 144145 _ 153154 _ 162163 _ 171172 _ 180
368
10742
Calcule el valor de la media y la mediana, y realice interpretaciones de las dos medidas
obtenidas.
Media, pesos promedio= 588840
=147.2
Mediana =Me=145+( 402 −17
10 )∗8=147.46.)Un estudio en las diferentes escuelas y colegio de un país, consistió en anotar el
número de palabras leídas en 15 segundos por un grupo de 120 sujetos disléxicos y 120
individuos normales. Teniendo en cuenta los resultados de la tabla
No de palabras leídas Disléxicos Normales
26 24 9
27 16 21
28 12 29
29 10 28
30 2 32
Calcule:
a.) Las medias aritméticas de ambos grupos.
Pesos f F xi f* xi
118-126
127-135
136-144
145-153
154-162
163-171
172-180
3
6
8
10
7
4
2
3
9
17
27
34
38
40
122
131
140
149
158
167
176
366
786
1120
1490
1106
668
352
40 5888
b.) Las medianas de ambos grupos.
c.) El porcentaje de sujetos disléxicos que superaron la mediana de los normales
d.) Q1, Q3, D5, D7, P70, P35
e.) Las modas de ambos grupos.
f.) Que implica que la moda del segundo grupo sea mayor que la del primer grupo.
Realizar los anteriores cálculos en R-Estadístico, dibujar las respectivas cajas de bigotes.
No de palabras leídas Disléxicos
26 24
27 16
28 12
29 10
30 2
a.) disléxicosCODIGOS EN R
> datos=read.table("dis.txt")> attach(datos)> datos> f=table(datos)> f
datos26 27 28 29 3024 16 12 10 2
> x=c(26,27,28,29,30)X
[1] 26 27 28 29 30
> cbind(x,f) x f26 26 2427 27 1628 28 1229 29 1030 30 2
> xf=x*f> xf
datos 26 27 28 29 30624 432 336 290 60
> cbind(x,f,xf) x f xf26 26 24 62427 27 16 43228 28 12 336
No de palabras leídas Normales
26 9
27 21
28 29
29 28
30 32
29 29 10 29030 30 2 60
> n=sum(f)> n
[1] 64
> media=sum(xf)/n> media
[1] 27.21875
Normales
> datos=read.table("normales.txt")> attach(datos)> datos> f=table(datos)> f
datos26 27 28 29 30 9 21 29 28 32
> x=c(26,27,28,29,30)X
[1] 26 27 28 29 30
> cbind(x,f) x f26 26 927 27 2128 28 2929 29 2830 30 32
> xf=x*f> xf
datos 26 27 28 29 30234 567 812 812 960
> cbind(x,f,xf) x f xf26 26 9 23427 27 21 56728 28 29 81229 29 28 81230 30 32 960
> n=sum(f)> n
[1] 119
> media=sum(xf)/n> media
[1] 28.44538
b.) mediana disléxicos=me= 2 10 12 16 24
Mediana disléxicos= 27
Mediana normales=me= 9 21 28 29 32
Mediana normales=me= 29
c.) el porcentaje de disléxicos que supero la mediana de los normales es %96,875
d.)dislexicos
CODIGO EN R
Q1quantile(datos, prob = c(0.25))
25% 26
Q3quantile(datos, prob = c(0.75))
75% 28
D5quantile(datos, prob = c(0.50))
50% 27
D7quantile(datos, prob = c(0.70))
70% 28
P35quantile(datos, prob = c(0.35))
35% 26
P70quantile(datos, prob = c(0.70))
70% 28
Normales:
Q1quantile(datos, prob = c(0.25))
25%27.5
Q3quantile(datos, prob = c(0.75))
75% 30
D5quantile(datos, prob = c(0.50))
50% 29
D7quantile(datos, prob = c(0.70))
70% 29
P35quantile(datos, prob = c(0.35))
35% 28
P70quantile(datos, prob = c(0.70))
70% 29
e.)
No de palabras leídas Disléxicos
26 24
27 16
28 12
29 10
30 2
No de palabras leídas Normales
26 9
27 21
28 29
29 28
30 32
f.) pues el hecho de que fueron más las personas normales las que lograron leer más palabras que las personas disléxicas.
7.) Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico
(medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos
de cociente intelectual inferior a 95 y otro formado por los demás; De cada sujeto se
anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la
tabla:
Nivel socioeconómico Sujetos con CI < 95Sujetos con
Intervalos Frecuencia Frecuencia
6 – 10 75 19
10 – 16 35 26
16 – 22 20 25
22 – 28 30 30
28 – 34 25 54
34 – 40 15 46
a. Dibuje un gráfico que permita comparar ambos grupos.
b. Calcule las medidas de tendencia central para aquellos sujetos con CI < 95
c. Calcule las medidas de tendencia central para aquellos sujetos con CI > 95
d. interprete los diferentes resultados obtenidos teniendo en cuenta los gráficos
obtenidos.
Realices las anteriores operaciones en R-estadístico
Solución
A)
B) medidas de tendencia central para aquellos sujetos con CI < 95
Nivel socioeconómico Sujetos con CI < 95
Intervalos Frecuencia
6 – 10 75
10 – 16 35
16 – 22 20
22 – 28 30
28 – 34 25
34 – 40 15
CODIGO EN R
> f=c(75,35,20,30,25,15) cbind (f) f[1,] 75[2,] 35[3,] 20[4,] 30[5,] 25[6,] 15
> liminf=c(6,10,16,22,28,34)> limsup=c(10,16,22,28,34,40)> marca=(limsup+liminf)/2> marca
[1] 8 13 19 25 31 37
> X=f*marca> X
[1] 600 455 380 750 775 555
> F=cumsum(f)> F
[1] 75 110 130 160 185 200
> cbind(f,F,marca,X) f F marca X[1,] 75 75 8 600[2,] 35 110 13 455[3,] 20 130 19 380[4,] 30 160 25 750[5,] 25 185 31 775[6,] 15 200 37 555
> n=200> n
[1] 200
> media=sum(X)/n> media
[1] 17.575
> n/2 [1] 100> li=10> Fa=75> fo=35> c=4> me=li+((n/2-Fa)/fo)*c> me
[1] 12.85714
> fo=75 [1] 75
> fa=0> fs=35> li=6> delta1=fo-fa> delta1> delta2=fo-fs> delta2
[1] 40
> mo=li+(delta1/(delta1+delta2))*c> mo
[1] 8.608696
> cbind(media,me,mo) media me mo[1,] 17.575 12.85714 8.608696
medidas de tendencia central para aquellos sujetos con CI > 95
Nivel socioeconómicoSujetos con
Intervalos Frecuencia
6 – 10 19
10 – 16 26
16 – 22 25
22 – 28 30
28 – 34 54
34 – 40 46
CODIGOS EN R
> f=c(75,35,20,30,25,15)>cbind(f)
f[1,] 19[2,] 26[3,] 25[4,] 30[5,] 54[6,] 46
> liminf=c(6,10,16,22,28,34)> limsup=c(10,16,22,28,34,40)> marca=(limsup+liminf)/2> marca
[1] 8 13 19 25 31 37
> X=f*marca> X
[1] 152 338 475 750 1674 1702
> F=cumsum(f)> F
[1] 75 110 130 160 185 200
> cbind(f,F,marca,X) f F marca X[1,] 19 19 8 152[2,] 26 45 13 338[3,] 25 70 19 475[4,] 30 100 25 750[5,] 54 154 31 1674[6,] 46 200 37 1702
> n=200> n
[1] 200
> media=sum(X)/n> media
[1] 25.455
> n/2 [1] 100> li=22> Fa=70> fo=30> c=4> me=li+((n/2-Fa)/fo)*c> me
[1] 26
> fo=54> fa=30> fs=46> li=28> delta1=fo-fa> delta1
[1] 24
> delta2=fo-fs> delta2
[1] 8
> mo=li+(delta1/(delta1+delta2))*c> mo
[1] 31
> cbind(media,me,mo) media me mo[1,] 25.455 26 31
8). Considere las siguientes medidas: media, mediana, moda, (max + min)/2, primer
cuartil, tercer cuartil. Dos de las propiedades de abajo pertenecen a las medidas
anteriores.
1. Su valor siempre tiene que ser igual a uno de los datos observados.
2. Divide al conjunto de datos en dos conjuntos de igual tamaño.
3. Es el centro de los datos en un intervalo de clase.
4. Siempre existe.
9).Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas
partes divide a una distribución los quintiles, y cuál es el quintil cuyo
valor corresponde a la mediana?
1. 5 partes
2. El 3 quintil
3. 50 partes
4. El segundo Quintil
10).Si se dan los siguientes Cuantíles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50; P90; en cual de
los siguientes alternativas los Cuantíles mostrados son equivalentes
A. Q3; D8; P50
B. Q2; D5; P50
C. Q3; D8; P90
D. Q2; D5; P25
E. Q1; D2; P50
11). Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9
empleados o menos de 7. La mayoría tiene 8 empleados, pero el 25% tiene 9 empleados y
una de cada 10 sucursales tiene 7 empleados. ¿Cuál es el promedio de empleados por
sucursal?.
A. 10.15
B. 8.15
C. 9.15
D. 15.15
E. 11.15
12).Un estudiante descubre que su calificación en un reciente examen de estadística,
corresponde al percentil 70. Si 80 estudiantes presentan el examen, aproximadamente,
significa que el número de estudiantes que sacaron calificación superior a él fueron:
A. 56
B. 24
C. 30
D. 20
E. 10
13.) Los salarios pagados a los empleados de una compañía se muestran en la siguiente
tabla.
El valor de la media y el Q2
1. 250.000
2. 360.000
3. 229052
Cargos Numero Salario
Directores 2 930.000
Supervisore
s
4 510.000
Economistas 6 370.000
Contadores 4 350.000
Auxiliares 26 246.000
Obreros 110 190.000
4 370.000
14).En una muestra de las compras de 15 estudiantes en la tienda de una escuela
primaria, se observan las siguientes cantidades de ventas, dispuestas en orden de
magnitud ascendente: $100, $100, $250, $250, $250, $350, $400, $530, $900, $1250,
$1350, $2450, $2710, $3090, $4100.
El valor de la media, mediana y moda de estas cantidades de ventas son respectivamente:
A. $1200, $530, $205
B. $1210, $205, $530
C. $1210, $3090, $900
D. $250, $530, $900
E. $1210, $530, $250
15). Los siguientes datos representan las edades de los pacientes admitidos al hospital
departamental de Villavicencio durante el mes de agosto de este año:
37 62 47 54 54 8 63 7
81 1 16 3 64 2 24 10
11 39 16 4 34 22 24 6
80 4 35 58 71 84 8 10
Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al hospital de
la comunidad era de 8 años. ¿Hay suficiente evidencia para concluir que la edad media de
los pacientes admitidos durante el mes de agosto de este año es mayor que la edad
mediana de los admitidos en el 2002?
I. se debe calcular la media y realizar una diferencia para establecer la evidencia de la
afirmación
II. Se debe calcular la varianza para establecer la veracidad de la afirmación
CODIGOS EN R
>datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,24,1
0,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)
> datos
[1] 37 62 47 54 54 8 63 7 81 1
16 3 64 2 24 10 11 39 16 4 34
22 24 6 80 4 35 58 71 84 8 10
> mean(datos) [1] 32.46875
> Varianza<-function(x=NA)
+ {
+ n=length(x)
+ media=sum(x)/n
+ v<-sum((x-media) ^2)/n
+ return(v)
+ }
> Varianza(datos)
[1] 707.374
16). Una compañía recoge información sobre los precios de libros de texto de
matemáticas. En el 2000, el precio promedio para todos los textos de matemáticas era de
$45.400, con una desviación típica de $100. Los precios de 32 libros de matemáticas
seleccionados al azar durante este año son:
50 40 41 48 48 42 49 50
48 45 56 41 57 42 45 46
45 66 45 45 55 66 42 50
46 46 55 48 45 58 47 35
El precio promedio de los libros para este año es mayor que el precio de los libros en el
año 2000 POR QUE, el coeficiente de variación es también mayor.
Rta: tuvo un incremento en su promedio el cual aumento en $2.787 dando un promedio
de $48.187 con un coeficiente de variación de 14.25%
17). Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0, 5, se obtiene la
serie Y: 12, 8, 0, 20, Para comprobar que las series tienen el mismo coeficiente de
variación se debe
I. Calcular las medias de ambas series II. Calcular la Varianza de ambas series.
X=3,2,0,5
Media=2.5
Varianza=3.25
Y=12,8,0,20
Media =10
Varianza=52
Coeficiente variación X
CODIGOS EN R
> Cv<-function(x=NA)
+ {
+ n=length(x)
+ media=sum(x)/n
+v<-(sqrt(sum((x-media) ^2)/n))/media
+ return(v)
+ }
> datos=c(12,8,0,20)
> Cv(datos)
[1] 0.7211103
> Cv<-function(x=NA)
+ {
+ n=length(x)
+ media=sum(x)/n
+v<-(sqrt(sum((x-media) ^2)/n))/media
[1] 0.7211103
+ return(v)
+ }
> datos=c(3,2,0,5)
> Cv(datos)
18.) En una universidad de la capital, se ha Encontrado que los promedios en los 4
primeros semestres de las notas de Matemáticas corresponden a: 3.2, 3.4, 3.0, 3.8, si la
cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente, y sabiendo que
existe un 4 de Varianza, entonces el coeficiente de variación del promedio total de las
notas de los cuatro semestres corresponde a:
A. 60.6 % B. 70.6% C. 75.6% D. 65.6% E.
55.6%
19).En una distribución de datos correspondientes a salarios de 50 educadores de un
colegio, Se encontró que el salario promedio es de $600.000, con una varianza de $625, se
puede concluir que:
1. La varianza en el ejemplo representa una buena medida para establecer la veracidad
del dato promedio.
2. $600.000 de acuerdo a la desviación Standard no es una medida suficiente
representativa.
3. La media de $600.000 es suficientemente representativa ya que la desviación estándar
es pequeña.
4. La media no esta acorde con la realidad lo dice el enorme tamaño de la Varianza.
20).7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se
diseño un modelo para cualificar el desempeño académico de los estudiantes de la U.C.C
en el programa de Sistemas. Donde D = deficiente, R = Regular, B=bueno,
S=Sobresaliente, E=Excelente, O=Optimo. Si en total existen 180 estudiantes con un
promedio total de 3,4 y un coeficiente de variación del 2.5%, entonces cuantos
estudiantes sobresalientes tiene la facultad?
A. 100
B. 96
C. 45
D. 99
E. 9
21). La Varianza de todo el grupo corresponde a:
A. 0.085
B. 0.025
C. 7.2
D. 0.085
E. 0.0072
22). Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la desviación
estándar. Ésta mide la dispersión de los resultados del proyecto azaroso. Es decir, si hay
dos proyectos: A y B. Y si la desviación estándar del rendimiento del proyecto A es mayor
que la del B. El proyecto A es más arriesgado, el B es más Estable. Si ambos tienen valor
esperado parecido el A tiene posibilidades de rendir mucho más que el B pero, también el
A tiene posibilidad de generar mayores pérdidas que el B.
La Afirmación anterior es verdadera porque:
A. La desviación Standard mide la variabilidad de dos grupos A y B cualquiera.
B. La desviación Standard permite comparar a dos grupos y decidir la estabilidad del uno
con respecto al otro.
C. La desviación Standard mide el margen de error de un grupo con respecto a otro.
D. La desviación Standard mide la distancia entre los datos y la media aritmética
F. La desviación Standard mide el margen de error cometido al usar la media en una
distribución
23). La resistencia de 100 baldosas de la fabrica “De las casas “se referencia en la siguiente
tabla.
SI el promedio de salario en la fábrica de “Las casas” es de $541.000 y la desviación
Standard es $1.791
Concluimos que:
A. Es mucho más dispersa la información correspondiente a la resistencia de las baldosas.
B. Es mucho más dispersa la información correspondiente al salario de los empleados.
Generalmente interesa establecer comparaciones de la dispersión,
entre diferentes muestras que posean distintas magnitudes o
unidades de medida.
El coeficiente de variabilidad tiene en cuenta el valor de la media
aritmética, para establecer un número relativo, que hace
comparable el grado de dispersión entre dos o mas variables.
Kg./Cm2 F
100_ 200
200_ 300
300_ 400
400_ 500
500_ 600
600_ 700
700_ 800
4
10
21
33
18
9
5
C. Ambas informaciones presentan la misma dispersión y por tanto no se puede tomar
una decisión.
D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso hace que el
análisis entre las dos informaciones sea indiferente
24.)Se consulto en 30 almacenes de la capital el precio de monitores para computador y
se obtuvo los siguientes resultados en miles de pesos.
100 101 120 115 130 150 112 145 138 121
126 115 140 137 143 118 147 149 150 115
100 127 135 149 146 137 122 118 135 129
Elabore una distribución de frecuencias, para datos agrupados, indicando los valores de
los límites reales. Y calcule: Cuartil 2, Coeficiente de variación, Interpretación con respecto
al Cv.
CODIGO EN R
>datos=c(100,101,120,115,130,150,
112,145,138,121,126,115,140,137,1
43,118,147,149,150,115,100,127,13
5,149,146,137,122,118,135,129)
> datos
[1] 100 101 120 115 130 150 112 145 138 121
126 115 140 137 143 118 147 149 150 115 100
127 135 149 146 137 122 118 135
[30] 129
> rang=max(datos)-min(datos)
> rang
[1] 50
> m=round(1+3.3*log10(30))
> m
[1] 6
> c=rang/m
> c
[1] 8.333333
Aproximamos=9
> nuevo=c*m
> nuevo
[1] 54
> inicio=min(datos)-2 inicio final
> final=max(datos)+2
> cbind(inicio,final) [1,] 98 152
>intervalos=cut(datos,breaks=c(98,1
07,116,125,134,143,152))
> intervalos
[1] (98,107] (98,107] (116,125] (107,116]
(125,134] (143,152] (107,116] (143,152]
[9] (134,143] (116,125] (125,134] (107,116]
(134,143] (134,143] (134,143] (116,125]
[17] (143,152] (143,152] (143,152] (107,116]
(98,107] (125,134] (134,143] (143,152]
[25] (143,152] (134,143] (116,125] (116,125]
(134,143] (125,134]
Levels: (98,107] (107,116] (116,125] (125,134]
(134,143] (143,152]
> f=table(intervalos)
> f
intervalos (98,107] (107,116] (116,125] (125,134] (134,143] (143,152]
3 4 5 4 7 7
> n=sum(f)
> n
[1] 30
> F=cumsum(f)
> F
(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]
3 7 12 16 23 30
> liminf=c(98,107,116,125,134,143)
> limsup=c(107,116,125,134,143,152)
> marca=(limsup+liminf)/2
> marca
[1] 102.5 111.5 120.5 129.5 138.5 147.5
> x=f*marca
> x
intervalos
(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]
307.5 446.0 602.5 518.0 969.5 1032.5
cbind(f,F,marca,x) f F marca x
(98,107] 3 3 102.5 307.5
(107,116] 4 7 111.5 446.0
(116,125] 5 12 120.5 602.5
(125,134] 4 16 129.5 518.0
(134,143] 7 23 138.5 969.5
(143,152] 7 30 147.5 1032.5
> media=sum(x)/n
> media
[1] 129.2
> n/2 [1] 15
> Fa=12
> fo=4
> li=125
> Q2=li+((2*n/4-Fa)/fo)*c
> Q2
[1] 131.75
> d2=(marca-media)^2*f
> d2
intervalos(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]
2138.67 1253.16 378.45 0.36 605.43 2344.23
cbind(f,F,marca,d2) f F marca d2
(98,107] 3 3 102.5 2138.67
(107,116] 4 7 111.5 1253.16
(116,125] 5 12 120.5 378.45
(125,134] 4 16 129.5 0.36
(134,143] 7 23 138.5 605.43
(143,152] 7 30 147.5 2344.23
> varianza=sum(d2)/n
> varianza
[1] 224.01
> ds=sqrt(varianza)
> ds
[1] 14.96696
> cv=ds/media
> cv
[1] 0.1158434
25).En los siguientes enunciados uno es verdadero
A. La media en una muestra de datos agrupados la divide en dos partes iguales.
B. Una distribución de datos permite calcular todas las medidas de tendencia central
C. La moda es un dato que permite analizar un resultado esperado.
D. Una medida de dispersión esta libre del cálculo de la media
26.) Cuando la media aritmética de un determinado número de datos es $270.50 y la
desviación típica es de $33.99, el coeficiente de variación (CV) es igual a:
A. 6.2%
B. 795.82%
C. 2.6%
D. 5.4%
E. 1.8%