Download docx - COMPENDIO 5 Y 6

MEDIDAS DE TENDENCIA CENTRAL

Nos indica en torno a que valor se distribuyen los datos

Sirve como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.

Algunas de las medidas de tendencia central son

Media

Aritmética Geométrica

Es el promedio de la recolección de datos

El cálculo se hace de dos formas diferentes

Datos No Agrupados

Se calcula sumando todos los datos y dividiendo por el número total de ellos.

X=∑i=1

n

X i

n

Datos Agrupados

Son los datos organizados en una distribución de frecuencias, que por lo general corresponden a datos de tipo continuo, y en una cantidad que exceden a 20 datos.

Marcas de Clases

Es el punto medio de cada intervalo de clase, la denotaremos como Xi

Propiedades1. La media es única

2. El cálculo de la media

3. Cuando existen datos extremos suficientemente distantes de la mayoría de los datos la media no es una medida muy confiable.

Es útil para calcular medias de porcentajes, tanto por uno, puntuaciones o índices. Tiene la ventaja de que no es tan sensible como la media a los valores extremos.

El cálculo se hace de dos formas

Datos AgrupadosDatos No Agrupados

Mg = n√X

1f 1∗X

2f2¿ X

3f3¿ .. .∗X

nfn

Mg =

Interés simple

Aplicaciones delas progresiones geométricas

Mediana

Formula

Se cobra únicamente sobre el capital dado en préstamos y no sobre los intereses producidos por el mismo

Interés compuesto Consiste en sumar periódicamente los intereses más el capital.

Determina la posición central que ocupa un dato en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.

Datos No Agrupados Datos Agrupados

Si los datos son impar, entonces la mediana es el dato central, entonces la distribución organizada en forma ascendente o descendente es la mediana.

Si el número de datos es par, el promedio de los datos centrales corresponde al valor de la mediana.

Se encuentra mediantela fórmula

Me= Li +

( n2−Faf )∗C

Cuantiles

Son medidas derivadas de la mediana, e intentan medir en valores de proporción más pequeña que la mediana misma a una muestra.

Cuartiles

Son medidas de tendencia central que dividen la distribución de datos en cuatro partes iguales. Q1 =

Li+( n4−Fafo )∗c

Deciles

Muestra la importancia de la décima parte de la muestra analizada. CJK =

Li+( k∗n10−Fa

fo )∗c

Percentiles

Muestra la importancia de la centésima parte de la muestra analizada. PJK =

Li+( k∗n100−Fa

fo )∗c

Quintil

Muestra la importancia de la centésima parte de la muestra analizada.

Propiedades de la media

1. Es una medida descriptiva

2. Es de cálculo rápido y de interpretación sencilla.

3. variable discreta es siempre un valor de la variable

4. Es función de los intervalos escogidos.

Moda

La moda es el valor que ocurre con mayor frecuencia en una distribución de datos

Datos No Agrupados

Simplemente será contar el número de datos y observar su frecuencia

Datos Agrupados

Se encuentra mediantela fórmula

Mo = Li + ( Δ1Δ1+Δ2 )*C

Propiedades de la moda

1. Es muy fácil de calcular.

2. Puede no ser única.

3. Es función de los intervalos elegidos a través de su amplitud, número y límites de los mismos.

4. Aunque el primero o el último de losintervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.

5. Esta dada solo en términos de las frecuencias absolutas

MEDIDAS DE TENDENCIA CENTRAL

En dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos.

Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores.

Rango o recorrido

Solo considera los dos valores extremos de una colección de datos.

Fórmula

R = Xmax – Xmin

Desviación media

Mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información

El objetivo es determinar cuánto se alejan o se acercan los datos de la media.

No Agrupados

Dm=∑i=1

n

|Xi−X|

n

No Agrupados

Dm=∑i=1

n

|Xi−X|∗f

n

VarianzaCoeficiencia de variabilidad

Podemos decir que como mínimo un 75% de los datos se encuentran localizados en un intervalo de 2 desviaciones estándares contados hacia arriba y hacia abajo, a partir de la media

No Agrupados

S2=∑i=1

n

(Xi−X )2

n

Agrupados

S2=∑i=1

n

(Xi−X )2∗f

n

El coeficiente de variación es una medida absoluta, adimensional. No depende de las unidades en las que se esté midiendo.

Fórmula

CV =

1. La siguiente tabla muestra las diferentes actividades realizados por diferentes personas en una institución educativa de la ciudad y su correspondiente asignación salarial.

a. Encontrar el salario promediob. Si se conviene reconocerles $70 diarios de aumento, cual es el nuevo salario promedio?

Trabajadores No Salarios

RectorSecretariasCoordinadoresDocentesCeladoresAseadoras

1424534

2’000.000750.0001’500.0001’200.000600.000450.000

A.)Salarios= 2000000∗1+750000∗4+1500000∗2+1200000∗45+600000∗3+450000∗4

59=¿

6560000059

=¿1’111.864

B.)Trabajadores No Salarios

RectorSecretariasCoordinadoresDocentesCeladoresAseadoras

1424534

2’002.100752.1001’502.1001’202.100602.100452.100

Salarios= 2002100∗1+752100∗4+1502100∗2+1202100∗45+602100∗3+452100∗4

59=65723900

59=¿

1’113.964

2. Cuatro grupos de estudiantes consistentes en 15, 20, 10 y 18, individuos, dieron pesos medios de 162, 148, 153, y 140 lb, respectivamente. Hallar el peso medio de todos los estudiantes.

Estudiantes Cantidad Peso

Ejercicios

compendio 5 y 6

1234

15201018

162148153140

Peso=162∗15+148∗20+153∗10+140∗18

63=944063

=¿149,8

3. Los siguientes datos representan las notas definitivas de 45 estudiantes en un curso de estadística aplicada.

4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.03.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.43.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.63.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.12.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4

A. Encuentre la nota promedio del grupo.B. El resultado de la media puede asegurar con certeza el rendimiento académico del

grupo?C. Si las dos primeras filas de los datos representan las notas de estudiantes de sexo

femenino, calcule las medias de los hombres y de las mujeres.D. Con la media de los hombres y de las mujeres calcule la media total.E. Compare el resultado anterior con el resultado encontrado en el primer punto.

A.) FORMULAS EN R:R= 5-1=4m=1+3.3*log(45)=6

c=46=0,666= 0,7

rango=0,7*6=4.2diferencia = 4.2-4=0.2xmin= 1-0.1=0.9xmax=5+0.1=5.1

MEDIA= 147.9545

=3.28

B.) en realidad no, puesto que la media pone al grupo en un término promedio de 3.28 excluyendo a 20 estudiantes que están por encima de la media.

C.) mujeres: 4.5 2.3 1.0 5.0 3.2 2.8 3.5 4.2 5.03.2 1.8 2.9 3.1 4.2 3.3 1.8 2.9 4.4Hombres:3.3 1.7 1.0 3.8 4.2 3.1 1.7 1.5 2.63.3 3.8 4.1 4.4 4.5 4.0 3.5 3.3 2.12.7 3.3 2.2 4.6 4.1 4.4 3.3 4.8 4.4

Mujeres=4.5+2,3+1+5∗2+3,2∗2+2,8+3.5+4,2∗2+1,8∗2+2,9∗2+3,1+3,3+4,4

18=¿

3.28

Hombres=3.3∗5+1.7∗2+1+2.2+3.8∗2+4,2+3.1+4.6+1.5+2.6+4.1∗2+4.8+4.4∗3+4.5+4+3.5+2.1+2.7

27=¿

3.3

Intervalos

Notas

f xi f* xi

0.9-1.6

1.6-2.3

2.3-3

3-3.7

3.7-4.4

4.4-5.1

3

7

5

12

12

6

1.25

1.95

2.65

3.35

4.05

4.75

3.75

13.65

13.25

40.20

48.60

28.50

45 147.95

D.) MEDIA TOTAL: 3.28∗18+3.32∗27

45=3.304

4. Al consejo directivo de un colegio le han llegado las quejas de que los precios de las comidas y artículos que se venden en la cafetería están elevados. Para averiguar si el rumor es cierto se tomaron como muestra algunos artículos encontrándose los siguientes precios.

70 86 75 72 66 90 85 70

72 81 70 75 84 62 66 74

82 75 68 83 81 65 75 70

73 65 82 80 66 73 95

85 84 75 68 80 75 68 72

78 73 72 68 84 75 72 80

Para ayudar al consejo directivo y determinar si el rumor es cierto o falso realice las siguientes actividades.

a. Agrupar en intervalos de clase apropiadosb. Determinar el precio promedio de los artículosc. Determinar la mediana de los artículosd. Calcule, Q1, Q3, D3, D5, D7, P80, V2, V3, P70.e. Realice un gráfico de bigotes y su respectivo análisis con las medidas visualizadasf. Realice un gráfico de barrasg. Realice un gráfico de ojivas de la distribución.h. Respecto a las gráficas y las medidas de tendencia central, elabore una conclusión.

A.) FORMULAS EN R Rango= 95-62=33m=1+3.3*log(47)=7

c=337

=4.714=5

rango=7*5=35diferencia =35-33=2xmin= 62-1=61xmax=95+1=96

B.) media precio promedio= 3509.547

=74.67

C.)

intervalos f h F H marca X(61,66] 6 0.1276596 6 0.1276596 63.5 381.0(66,71] 8 0.1702128 14 0.2978723 68.5 548.0(71,76] 16 0.3404255 30 0.6382979 73.5 1176.0(76,81] 6 0.1276596 36 0.7659574 78.5 471.0(81,86] 9 0.1914894 45 0.9574468 83.5 751.5(86,91] 1 0.0212766 46 0.9787234 88.5 88.5(91,96] 1 0.0212766 47 10.000.00

093.5 93.5

Mediana= Me= Li + ( n2−Faf )∗C

ME=71+( 472 −14

16 )∗5=73.96875

Intervalos

Precios

F xi f* xi

61-66

66-71

71-76

76-81

81-86

86-91

91-96

6

8

16

6

9

1

1

63.5

68.5

73.5

78.5

83.5

88.5

93.5

381

548

1176

471

751.5

88.5

93.5

47 3509.5

D.) Q1=66+( 474 −6

8 )∗5=69,59375Q3=76+( 3∗474 −30

6 )∗5=80.375D3=71+( 3∗4710 −14

16 )∗5=71.03125D5=71+( 5∗4710 −14

16 )∗5=73.96875D7=76+( 7∗4710 −30

6 )∗5=78.41667P80=81+( 80∗47100

−36

9 )∗5=81.8889P70=76+( 80∗47100

−30

6 )∗5=78.41667V2=71+( 2∗475 −14

16 )∗5=72.5V3=71+( 3∗475 −14

16 )∗5=75.4375

5) En un colegio con modalidad en agropecuaria, el peso en kilogramos presentado por el

departamento de porcicultura en la experimental ABC viene dado por la tabla.

Pesos Frecuencias

118 _ 126127 _ 135136 _ 144145 _ 153154 _ 162163 _ 171172 _ 180

368

10742

Calcule el valor de la media y la mediana, y realice interpretaciones de las dos medidas

obtenidas.

Media, pesos promedio= 588840

=147.2

Mediana =Me=145+( 402 −17

10 )∗8=147.46.)Un estudio en las diferentes escuelas y colegio de un país, consistió en anotar el

número de palabras leídas en 15 segundos por un grupo de 120 sujetos disléxicos y 120

individuos normales. Teniendo en cuenta los resultados de la tabla

No de palabras leídas Disléxicos Normales

26 24 9

27 16 21

28 12 29

29 10 28

30 2 32

Calcule:

a.) Las medias aritméticas de ambos grupos.

Pesos f F xi f* xi

118-126

127-135

136-144

145-153

154-162

163-171

172-180

3

6

8

10

7

4

2

3

9

17

27

34

38

40

122

131

140

149

158

167

176

366

786

1120

1490

1106

668

352

40 5888

b.) Las medianas de ambos grupos.

c.) El porcentaje de sujetos disléxicos que superaron la mediana de los normales

d.) Q1, Q3, D5, D7, P70, P35

e.) Las modas de ambos grupos.

f.) Que implica que la moda del segundo grupo sea mayor que la del primer grupo.

Realizar los anteriores cálculos en R-Estadístico, dibujar las respectivas cajas de bigotes.

No de palabras leídas Disléxicos

26 24

27 16

28 12

29 10

30 2

a.) disléxicosCODIGOS EN R

> datos=read.table("dis.txt")> attach(datos)> datos> f=table(datos)> f

datos26 27 28 29 3024 16 12 10 2

> x=c(26,27,28,29,30)X

[1] 26 27 28 29 30

> cbind(x,f) x f26 26 2427 27 1628 28 1229 29 1030 30 2

> xf=x*f> xf

datos 26 27 28 29 30624 432 336 290 60

> cbind(x,f,xf) x f xf26 26 24 62427 27 16 43228 28 12 336

No de palabras leídas Normales

26 9

27 21

28 29

29 28

30 32

29 29 10 29030 30 2 60

> n=sum(f)> n

[1] 64

> media=sum(xf)/n> media

[1] 27.21875

Normales

> datos=read.table("normales.txt")> attach(datos)> datos> f=table(datos)> f

datos26 27 28 29 30 9 21 29 28 32

> x=c(26,27,28,29,30)X

[1] 26 27 28 29 30

> cbind(x,f) x f26 26 927 27 2128 28 2929 29 2830 30 32

> xf=x*f> xf

datos 26 27 28 29 30234 567 812 812 960

> cbind(x,f,xf) x f xf26 26 9 23427 27 21 56728 28 29 81229 29 28 81230 30 32 960

> n=sum(f)> n

[1] 119

> media=sum(xf)/n> media

[1] 28.44538

b.) mediana disléxicos=me= 2 10 12 16 24

Mediana disléxicos= 27

Mediana normales=me= 9 21 28 29 32

Mediana normales=me= 29

c.) el porcentaje de disléxicos que supero la mediana de los normales es %96,875

d.)dislexicos

CODIGO EN R

Q1quantile(datos, prob = c(0.25))

25% 26


75% 28

D5quantile(datos, prob = c(0.50))

50% 27


70% 28

P35quantile(datos, prob = c(0.35))

35% 26


70% 28

Normales:


25%27.5


75% 30


50% 29


70% 29


35% 28


70% 29

e.)

No de palabras leídas Disléxicos

26 24

27 16

28 12

29 10

30 2

No de palabras leídas Normales

26 9

27 21

28 29

29 28

30 32

f.) pues el hecho de que fueron más las personas normales las que lograron leer más palabras que las personas disléxicas.

7.) Con el fin de observar la relación entre la inteligencia y el nivel socioeconómico

(medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos

de cociente intelectual inferior a 95 y otro formado por los demás; De cada sujeto se

anotó el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la

tabla:

Nivel socioeconómico Sujetos con CI < 95Sujetos con

Intervalos Frecuencia Frecuencia

6 – 10 75 19

10 – 16 35 26

16 – 22 20 25

22 – 28 30 30

28 – 34 25 54

34 – 40 15 46

a. Dibuje un gráfico que permita comparar ambos grupos.

b. Calcule las medidas de tendencia central para aquellos sujetos con CI < 95

c. Calcule las medidas de tendencia central para aquellos sujetos con CI > 95

d. interprete los diferentes resultados obtenidos teniendo en cuenta los gráficos

obtenidos.

Realices las anteriores operaciones en R-estadístico

Solución

A)

B) medidas de tendencia central para aquellos sujetos con CI < 95

Nivel socioeconómico Sujetos con CI < 95

Intervalos Frecuencia

6 – 10 75

10 – 16 35

16 – 22 20

22 – 28 30

28 – 34 25

34 – 40 15

CODIGO EN R

> f=c(75,35,20,30,25,15) cbind (f) f[1,] 75[2,] 35[3,] 20[4,] 30[5,] 25[6,] 15

> liminf=c(6,10,16,22,28,34)> limsup=c(10,16,22,28,34,40)> marca=(limsup+liminf)/2> marca

[1] 8 13 19 25 31 37

> X=f*marca> X

[1] 600 455 380 750 775 555

> F=cumsum(f)> F

[1] 75 110 130 160 185 200

> cbind(f,F,marca,X) f F marca X[1,] 75 75 8 600[2,] 35 110 13 455[3,] 20 130 19 380[4,] 30 160 25 750[5,] 25 185 31 775[6,] 15 200 37 555

> n=200> n

[1] 200

> media=sum(X)/n> media

[1] 17.575

> n/2 [1] 100> li=10> Fa=75> fo=35> c=4> me=li+((n/2-Fa)/fo)*c> me

[1] 12.85714

> fo=75 [1] 75

> fa=0> fs=35> li=6> delta1=fo-fa> delta1> delta2=fo-fs> delta2

[1] 40

> mo=li+(delta1/(delta1+delta2))*c> mo

[1] 8.608696

> cbind(media,me,mo) media me mo[1,] 17.575 12.85714 8.608696

medidas de tendencia central para aquellos sujetos con CI > 95

Nivel socioeconómicoSujetos con

Intervalos Frecuencia

6 – 10 19

10 – 16 26

16 – 22 25

22 – 28 30

28 – 34 54

34 – 40 46

CODIGOS EN R

> f=c(75,35,20,30,25,15)>cbind(f)

f[1,] 19[2,] 26[3,] 25[4,] 30[5,] 54[6,] 46

> liminf=c(6,10,16,22,28,34)> limsup=c(10,16,22,28,34,40)> marca=(limsup+liminf)/2> marca

[1] 8 13 19 25 31 37

> X=f*marca> X

[1] 152 338 475 750 1674 1702

> F=cumsum(f)> F

[1] 75 110 130 160 185 200

> cbind(f,F,marca,X) f F marca X[1,] 19 19 8 152[2,] 26 45 13 338[3,] 25 70 19 475[4,] 30 100 25 750[5,] 54 154 31 1674[6,] 46 200 37 1702

> n=200> n

[1] 200

> media=sum(X)/n> media

[1] 25.455

> n/2 [1] 100> li=22> Fa=70> fo=30> c=4> me=li+((n/2-Fa)/fo)*c> me

[1] 26

> fo=54> fa=30> fs=46> li=28> delta1=fo-fa> delta1

[1] 24

> delta2=fo-fs> delta2

[1] 8

> mo=li+(delta1/(delta1+delta2))*c> mo

[1] 31

> cbind(media,me,mo) media me mo[1,] 25.455 26 31

8). Considere las siguientes medidas: media, mediana, moda, (max + min)/2, primer

cuartil, tercer cuartil. Dos de las propiedades de abajo pertenecen a las medidas

anteriores.

1. Su valor siempre tiene que ser igual a uno de los datos observados.

2. Divide al conjunto de datos en dos conjuntos de igual tamaño.

3. Es el centro de los datos en un intervalo de clase.

4. Siempre existe.

9).Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas

partes divide a una distribución los quintiles, y cuál es el quintil cuyo

valor corresponde a la mediana?

1. 5 partes

2. El 3 quintil

3. 50 partes

4. El segundo Quintil

10).Si se dan los siguientes Cuantíles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50; P90; en cual de

los siguientes alternativas los Cuantíles mostrados son equivalentes

A. Q3; D8; P50

B. Q2; D5; P50

C. Q3; D8; P90

D. Q2; D5; P25

E. Q1; D2; P50

11). Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9

empleados o menos de 7. La mayoría tiene 8 empleados, pero el 25% tiene 9 empleados y

una de cada 10 sucursales tiene 7 empleados. ¿Cuál es el promedio de empleados por

sucursal?.

A. 10.15

B. 8.15

C. 9.15

D. 15.15

E. 11.15

12).Un estudiante descubre que su calificación en un reciente examen de estadística,

corresponde al percentil 70. Si 80 estudiantes presentan el examen, aproximadamente,

significa que el número de estudiantes que sacaron calificación superior a él fueron:

A. 56

B. 24

C. 30

D. 20

E. 10

13.) Los salarios pagados a los empleados de una compañía se muestran en la siguiente

tabla.

El valor de la media y el Q2

1. 250.000

2. 360.000

3. 229052

Cargos Numero Salario

Directores 2 930.000

Supervisore

s

4 510.000

Economistas 6 370.000

Contadores 4 350.000

Auxiliares 26 246.000

Obreros 110 190.000

4 370.000

14).En una muestra de las compras de 15 estudiantes en la tienda de una escuela

primaria, se observan las siguientes cantidades de ventas, dispuestas en orden de

magnitud ascendente: $100, $100, $250, $250, $250, $350, $400, $530, $900, $1250,

$1350, $2450, $2710, $3090, $4100.

El valor de la media, mediana y moda de estas cantidades de ventas son respectivamente:

A. $1200, $530, $205

B. $1210, $205, $530

C. $1210, $3090, $900

D. $250, $530, $900

E. $1210, $530, $250

15). Los siguientes datos representan las edades de los pacientes admitidos al hospital

departamental de Villavicencio durante el mes de agosto de este año:

37 62 47 54 54 8 63 7

81 1 16 3 64 2 24 10

11 39 16 4 34 22 24 6

80 4 35 58 71 84 8 10

Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al hospital de

la comunidad era de 8 años. ¿Hay suficiente evidencia para concluir que la edad media de

los pacientes admitidos durante el mes de agosto de este año es mayor que la edad

mediana de los admitidos en el 2002?

I. se debe calcular la media y realizar una diferencia para establecer la evidencia de la

afirmación

II. Se debe calcular la varianza para establecer la veracidad de la afirmación

CODIGOS EN R

>datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,24,1

0,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)

> datos

[1] 37 62 47 54 54 8 63 7 81 1

16 3 64 2 24 10 11 39 16 4 34

22 24 6 80 4 35 58 71 84 8 10

> mean(datos) [1] 32.46875

> Varianza<-function(x=NA)

+ {

+ n=length(x)

+ media=sum(x)/n

+ v<-sum((x-media) ^2)/n

+ return(v)

+ }

> Varianza(datos)

[1] 707.374

16). Una compañía recoge información sobre los precios de libros de texto de

matemáticas. En el 2000, el precio promedio para todos los textos de matemáticas era de

$45.400, con una desviación típica de $100. Los precios de 32 libros de matemáticas

seleccionados al azar durante este año son:

50 40 41 48 48 42 49 50

48 45 56 41 57 42 45 46

45 66 45 45 55 66 42 50

46 46 55 48 45 58 47 35

El precio promedio de los libros para este año es mayor que el precio de los libros en el

año 2000 POR QUE, el coeficiente de variación es también mayor.

Rta: tuvo un incremento en su promedio el cual aumento en $2.787 dando un promedio

de $48.187 con un coeficiente de variación de 14.25%

17). Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0, 5, se obtiene la

serie Y: 12, 8, 0, 20, Para comprobar que las series tienen el mismo coeficiente de

variación se debe

I. Calcular las medias de ambas series II. Calcular la Varianza de ambas series.

X=3,2,0,5

Media=2.5

Varianza=3.25

Y=12,8,0,20

Media =10

Varianza=52

Coeficiente variación X

CODIGOS EN R

> Cv<-function(x=NA)

+ {

+ n=length(x)

+ media=sum(x)/n

+v<-(sqrt(sum((x-media) ^2)/n))/media

+ return(v)

+ }

> datos=c(12,8,0,20)

> Cv(datos)

[1] 0.7211103

> Cv<-function(x=NA)

+ {

+ n=length(x)

+ media=sum(x)/n

+v<-(sqrt(sum((x-media) ^2)/n))/media

[1] 0.7211103

+ return(v)

+ }

> datos=c(3,2,0,5)

> Cv(datos)

18.) En una universidad de la capital, se ha Encontrado que los promedios en los 4

primeros semestres de las notas de Matemáticas corresponden a: 3.2, 3.4, 3.0, 3.8, si la

cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente, y sabiendo que

existe un 4 de Varianza, entonces el coeficiente de variación del promedio total de las

notas de los cuatro semestres corresponde a:

A. 60.6 % B. 70.6% C. 75.6% D. 65.6% E.

55.6%

19).En una distribución de datos correspondientes a salarios de 50 educadores de un

colegio, Se encontró que el salario promedio es de $600.000, con una varianza de $625, se

puede concluir que:

1. La varianza en el ejemplo representa una buena medida para establecer la veracidad

del dato promedio.

2. $600.000 de acuerdo a la desviación Standard no es una medida suficiente

representativa.

3. La media de $600.000 es suficientemente representativa ya que la desviación estándar

es pequeña.

4. La media no esta acorde con la realidad lo dice el enorme tamaño de la Varianza.

20).7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se

diseño un modelo para cualificar el desempeño académico de los estudiantes de la U.C.C

en el programa de Sistemas. Donde D = deficiente, R = Regular, B=bueno,

S=Sobresaliente, E=Excelente, O=Optimo. Si en total existen 180 estudiantes con un

promedio total de 3,4 y un coeficiente de variación del 2.5%, entonces cuantos

estudiantes sobresalientes tiene la facultad?

A. 100

B. 96

C. 45

D. 99

E. 9

21). La Varianza de todo el grupo corresponde a:

A. 0.085

B. 0.025

C. 7.2

D. 0.085

E. 0.0072

22). Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la desviación

estándar. Ésta mide la dispersión de los resultados del proyecto azaroso. Es decir, si hay

dos proyectos: A y B. Y si la desviación estándar del rendimiento del proyecto A es mayor

que la del B. El proyecto A es más arriesgado, el B es más Estable. Si ambos tienen valor

esperado parecido el A tiene posibilidades de rendir mucho más que el B pero, también el

A tiene posibilidad de generar mayores pérdidas que el B.

La Afirmación anterior es verdadera porque:

A. La desviación Standard mide la variabilidad de dos grupos A y B cualquiera.

B. La desviación Standard permite comparar a dos grupos y decidir la estabilidad del uno

con respecto al otro.

C. La desviación Standard mide el margen de error de un grupo con respecto a otro.

D. La desviación Standard mide la distancia entre los datos y la media aritmética

F. La desviación Standard mide el margen de error cometido al usar la media en una

distribución

23). La resistencia de 100 baldosas de la fabrica “De las casas “se referencia en la siguiente

tabla.

SI el promedio de salario en la fábrica de “Las casas” es de $541.000 y la desviación

Standard es $1.791

Concluimos que:

A. Es mucho más dispersa la información correspondiente a la resistencia de las baldosas.

B. Es mucho más dispersa la información correspondiente al salario de los empleados.

Generalmente interesa establecer comparaciones de la dispersión,

entre diferentes muestras que posean distintas magnitudes o

unidades de medida.

El coeficiente de variabilidad tiene en cuenta el valor de la media

aritmética, para establecer un número relativo, que hace

comparable el grado de dispersión entre dos o mas variables.

Kg./Cm2 F

100_ 200

200_ 300

300_ 400

400_ 500

500_ 600

600_ 700

700_ 800

4

10

21

33

18

9

5

C. Ambas informaciones presentan la misma dispersión y por tanto no se puede tomar

una decisión.

D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso hace que el

análisis entre las dos informaciones sea indiferente

24.)Se consulto en 30 almacenes de la capital el precio de monitores para computador y

se obtuvo los siguientes resultados en miles de pesos.

100 101 120 115 130 150 112 145 138 121

126 115 140 137 143 118 147 149 150 115

100 127 135 149 146 137 122 118 135 129

Elabore una distribución de frecuencias, para datos agrupados, indicando los valores de

los límites reales. Y calcule: Cuartil 2, Coeficiente de variación, Interpretación con respecto

al Cv.

CODIGO EN R

>datos=c(100,101,120,115,130,150,

112,145,138,121,126,115,140,137,1

43,118,147,149,150,115,100,127,13

5,149,146,137,122,118,135,129)

> datos

[1] 100 101 120 115 130 150 112 145 138 121

126 115 140 137 143 118 147 149 150 115 100

127 135 149 146 137 122 118 135

[30] 129

> rang=max(datos)-min(datos)

> rang

[1] 50

> m=round(1+3.3*log10(30))

> m

[1] 6

> c=rang/m

> c

[1] 8.333333

Aproximamos=9

> nuevo=c*m

> nuevo

[1] 54

> inicio=min(datos)-2 inicio final

> final=max(datos)+2

> cbind(inicio,final) [1,] 98 152

>intervalos=cut(datos,breaks=c(98,1

07,116,125,134,143,152))

> intervalos

[1] (98,107] (98,107] (116,125] (107,116]

(125,134] (143,152] (107,116] (143,152]

[9] (134,143] (116,125] (125,134] (107,116]

(134,143] (134,143] (134,143] (116,125]

[17] (143,152] (143,152] (143,152] (107,116]

(98,107] (125,134] (134,143] (143,152]

[25] (143,152] (134,143] (116,125] (116,125]

(134,143] (125,134]

Levels: (98,107] (107,116] (116,125] (125,134]

(134,143] (143,152]

> f=table(intervalos)

> f

intervalos (98,107] (107,116] (116,125] (125,134] (134,143] (143,152]

3 4 5 4 7 7

> n=sum(f)

> n

[1] 30

> F=cumsum(f)

> F

(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]

3 7 12 16 23 30

> liminf=c(98,107,116,125,134,143)

> limsup=c(107,116,125,134,143,152)

> marca=(limsup+liminf)/2

> marca

[1] 102.5 111.5 120.5 129.5 138.5 147.5

> x=f*marca

> x

intervalos

(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]

307.5 446.0 602.5 518.0 969.5 1032.5

cbind(f,F,marca,x) f F marca x

(98,107] 3 3 102.5 307.5

(107,116] 4 7 111.5 446.0

(116,125] 5 12 120.5 602.5

(125,134] 4 16 129.5 518.0

(134,143] 7 23 138.5 969.5

(143,152] 7 30 147.5 1032.5

> media=sum(x)/n

> media

[1] 129.2

> n/2 [1] 15

> Fa=12

> fo=4

> li=125

> Q2=li+((2*n/4-Fa)/fo)*c

> Q2

[1] 131.75

> d2=(marca-media)^2*f

> d2

intervalos(98,107] (107,116] (116,125] (125,134] (134,143] (143,152]

2138.67 1253.16 378.45 0.36 605.43 2344.23

cbind(f,F,marca,d2) f F marca d2

(98,107] 3 3 102.5 2138.67

(107,116] 4 7 111.5 1253.16

(116,125] 5 12 120.5 378.45

(125,134] 4 16 129.5 0.36

(134,143] 7 23 138.5 605.43

(143,152] 7 30 147.5 2344.23

> varianza=sum(d2)/n

> varianza

[1] 224.01

> ds=sqrt(varianza)

> ds

[1] 14.96696

> cv=ds/media

> cv

[1] 0.1158434

25).En los siguientes enunciados uno es verdadero

A. La media en una muestra de datos agrupados la divide en dos partes iguales.

B. Una distribución de datos permite calcular todas las medidas de tendencia central

C. La moda es un dato que permite analizar un resultado esperado.

D. Una medida de dispersión esta libre del cálculo de la media

26.) Cuando la media aritmética de un determinado número de datos es $270.50 y la

desviación típica es de $33.99, el coeficiente de variación (CV) es igual a:

A. 6.2%

B. 795.82%

C. 2.6%

D. 5.4%

E. 1.8%