Upload
danielfmunoz
View
214
Download
0
Embed Size (px)
Citation preview
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 1/38
MATEMATICA
CUARTO MEDIO - 2015 Profesor: Luis Arancibia
Primera GuıaCUARTO MEDIO
Estadıstica
Estamos en el supuesto que ya conoces algunos terminos y conceptos de estadıstica descriptiva, lo fudamentamos
en que en Septimo ya hubo una aproximacion bastante concienzuda para ese perıodo lectivo.
Por esta razon, los objetivos son los siguientes:
•Recordar los elementos basicos de la estadıstica
descriptiva: Poblacion, muestra, frecuencias,
histograma, etc.
•Definir los conceptos fundamentales en el tratamiento
de datos: media, mediana, moda, varianza, desviaciontıpica, etc.
• Repasar las tecnicas para confeccionar tablas y
graficos estadısticos.
• Profundizar en los conceptos de centralizacion y
dispersion de un conjunto de datos.
La mayorıa de los conceptos en este tipo de estadıstica, la que se considera elemental son muy faciles de manejar
y no requieren de calculos difıciles, en general. No obstante, la interpretacon de su significado, o la utilizacion de los
valores que se obtienen de un trabajo estadıstico concreto con el fin de sacar o proyectar desiciones, exige muchas
veces de bastante cuidado. Ocurre con mas frecuencia que la deseable, que un estudio correctamente desarrollado, es
decir, con el trabajo numerico correcto, con parametros y coeficientes bien definidos, nos lleven a hacer interpreta-
ciones que falsean su contenido.
La esencia del metodo estadıstico no es ajeno al peligro de la mala interpretacion. El escritor Pio Baroja comentaba
con ironıa, con respecto a esto ultimo: Recelo de la Estadıstica; un buen amigo mıo murio ahogado por inmersion en
un rıo cuya profundidad media era de 40 centımetros”.
En uno de los capıtulos de El Chavo del Ocho, Kiko le dice a su madre que como cada 20 minutos un nino es atropel-
lado, va a espera que atropellen a uno y saldra a jugar a la calle algo menos de 20 minutos.
Terminos y conceptos de la estadıstica descriptiva
Poblacion es el conjunto de todos los elementos que son objeto de un estudio estadıstico.
Una muestra es un subconjunto de la poblacion total, en ella se realiza un estudio parcial y se pide que sea represen-
tativa.
El numero de individuos de la muestra se llama tama ˜ no de la misma.
Previo a las elecciones, los organismos de opinion hacen encuestas hablan de muestreos, una puede dar por posi-
ble ganador a un candidato y otra puede dar a otro. sin embargo, en las elecciones, al votar todos los que tienen
derecho, podrıa ocurrir que quien gane sea un tercero, es decir otro candidato que los anteriores no consideraron. En
Chile se dice que el voto femenino determino la victoria de Michelle Bachelet para su primer mandato, las que en las
muestras estaban en un porcentaje menor y dejaban en duda que pudiese ganar con la ventaja que obtuvo.
Ejemplo 1
Supongamos que queremos saber sobre la participacion de nuestros companerosdel Instituto Nacional en los diferentes talleres y academias. Entonces cada
alumno es un individuo y todos ellos determinan la poblacion.
Si entrevistar a los mas de 4.000 estudiantes no es viable, entonces debemos
considerar una muestra y para ello deberemos fijar un criterio.
Si este trabajo se hace en Marzo, al inicio del ano escolar, la muestra no puede
considerar a los alumnos de Septimo ano, quiene vienen recien ingresando al colegio.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 2/38
CUARTO MEDIO INSTITUTO NACIONAL
De la poblacion o muestra, se pueden estudiar diferentes caracteres, y estos pueden ser cuantitativos o cualita-
tivos.
Un caracter es una propiedad o cualidad de cada individuo: por ejemplo, el individuo puede ser un automovil y sus
propiedades o cualidades la marca, el color, el consumo. De ellas, algunas son cuantitativas y otras cualitativas e
incluso podemos hacer cuantitativa una propiedad cualitativa, como el color, asignado al color un numero, como por
ejemplo su longitud de onda.
A cada caracter cuantitativo se le asocia una variable estadıstica, cuyos valores son los que toma dicho caracter yeste valor puede ser considerado discreto o bien continuo.
Cuando el trabajo es con variables continuas, puede resultar conveniente trabajar con datos agrupados en intervalos
o (clases). Por lo general al valor que representa una clase se le llama marca de clase y suele ser el punto medio del
intervalo que representa, aun cuando hay otros criterios para ello.
Ejemplo 2
Los estudiantes del Instituto Nacional pueden ser estudiados respecto al color de pelo,
a la comuna de procedencia, la edad y su NEM entre otros
Las variables color de pelo y comuna de procedencia son variables discretas, especıficamente
las comunas, ya que ellas son un numero no muy grande.
La edad es una variable continua, pero si solo interesa ano cumplido, es entonces discreta.
El NEM es en esencia una variable discreta, sin embargo, dada la gran cantidad de alumnos,
se considera continua.
Una vez obtenidos los datos,es necesario determinar la frecuencia absoluta o bien la frecuencia relativa de cada
valor o bien de los valores que caen en un cierto rango, cuando los datos son agrupados. La frecuencia absoluta es el
numero de veces que se repite dicho valor o dato; la frecuencia relativa es un cociente entre el numero de veces que
se repite dicho dato y el numero total de datos.
Hay en algunos casos que resulta conveniente utilizar las frecuencias acumuladas, absolutas o relativas y estas ulti-
mas incluso por porcentajes.
El conjunto de valores distribuidos en clases, indicando el numero de individuos que pertenece a cada clase (frecuen-cia de clase) se llama distribucion de frecuencias.
Ejercicio
Se midio la estatura en centımetros de 75 estudiantes de Cuarto Medio, y los datos se registraron ası:
175 155 173 195 161 185 187 162 179 163 165 170 164 167 168
174 172 158 165 151 166 167 196 182 170 169 167 171 162 174
171 174 172 155 170 171 170 153 170 153 173 173 174 167 166
172 172 158 159 163 163 163 186 174 175 150 154 175 174 160
178 177 179 186 192 165 180 166 184 175 173 147 195 175 190
Aplique los conceptos recientemente presentados agrupando los datos y construyendo la tabla de frecuencias,
considere dos agrupaciones distintas.
Una vez que se tiene desarrollado lo anterior, podemos proceder a presentar los datos de modo grafico, a modo
de facilitar la lectura de los datos recogidos. Estos datos se pueden presentar como un diagrama de barras, un pic-
tograma, un histograma, un grafico circular o de torta e incluso cualquier idea que represente un comparacion de
cantidades. Podemos considerar ademas una poligonal, la que se obtiene a partir de un histograma o un grafico de
barras.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 3/38
CUARTO MEDIO INSTITUTO NACIONAL
En un vuelo internacional se entrevisto a los 120
pasajeros sobre su nacionalidad
20 alemanes(A)
30 britanicos(B)6 daneses(D)
40 franceses(F)
8 holandeses(H)
10 italianos(I)
6 portugueses(P)
|A
|B
|D
|F
|H
|I
|P
10
20
30
40
En este tipo de grafico y con este tipo de informacion, es conveniente que la base de las barras sean iguales, pero
si queremos dar mas importancia a una de las nacionalidades, entonces podemos considerar para ella una base mas
ancha, dando ası la idea que allı hay mas personas; con este proceder no hay error matematico, sin embargo hay mala
intencion y los datos son falseados. El problema es del orden de la etica y los valores.
De este mismo grafico podemos construir uno poligonal como el que se muestra a continuacion
|A
|B
|D
|F
|H
|I
|P
10
20
30
40
Si queremos marcar mas aun las diferencias, podemos
cambiar la escala del grafico, por ejemplo ası:
|
A
|
B
|
D
|
F
|
H
|
I
|
P
10
20
30
40
En ambos graficos tenemos representada la misma situacion y en apariencia se ven distintas, todavıa podemoshacer creer que hay menos diferencia graduando de otro modo la escala de frecuencias.
Un criterio para tener en cuenta es el que indica que un grafico es agradable a la vista, si sus proporciones son las de
un rectangulo aurico.
A modo de ejercicio, puede confeccionar el grafico de barras y la poligonal del ejercio propuesto sobre las estaturas
de los 75 alumnos ya planteado. Considere las frecuencias acumuladas tambien.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 4/38
CUARTO MEDIO INSTITUTO NACIONAL
El caso de los 120 pasajeros se puede representar en un grafico circular, el cual, al ser bien proporcionado, resul-
tara mejor que los anteriores.
A
B
D
FH
I
P
Pese a todo esta informacion no es tan adecuada para sacar algunas conclusiones, sobre todo si lo aplicamos a las
estaturas de los estudiantes. Para tener entonces otro tipo de informacion es necesario desarrollar algunos calculos o
comparaciones, ellos son la media o Promedio aritmetico, la mediana y la moda.
Por lo general se emplea con mayor frecuencia el calculo de la media, ya que allı se tendrıa un representante de la
muestra o poblacion.
Si los datos no son agrupados, la media corresponde al cociente entre la suma de todos los valores y el total de
individuos o elementos que componen la muestra. Si los datos estan agrupados se considera el cociente entre la suma
de todos los productos entre el representante de la clase y su frecuencia y el total de elementos de la muestra.
La notacion para este proceso es x =
ni=1
xi
n =
x1 + x2 + · · · + xn
n para datos no agrupados.
Y cuando los datos estan agupados es x =
ni=1
ci · F i
n
i=1
F i
= c1F 1 + c2F 2 + · · · + cnF n
F 1 + F 2 + · · · + F n
Semejante al calculo de la media con datos agrupados se trabaja la media ponderada, por ejemplo cuando se cal-
cula el promedio de notas y entre cinco notas hay una que tienen coeficiente dos; tambien cuando se calcula el puntaje
promedio para ingresar a la universidad entre NEM, Ranking y PSU(Leng), PSU(Mate), PSU(Cien) o PSU(Hist) para
cada una de las distintas carreras.
La siguiente situacion merece ser estudiada, hay tres conjuntos de datos:
A = { 8 8 9 9 9 9 9 10 10}B = {1 3 6 9 9 11 13 14 15 }C = {1 8 8 9 9 9 11 11 15}
En cada conjunto, la media y la moda son 9, sin embargo no son comparables, en la primera el rango es 3 y en
las otra dos el rango es 15
Decir que 9 representa los tres conjunto es bastante ingenuo, por lo tanto deberemos incrementar el proceso de infor-
macion.
Para obtener la mediana, debemos ordenar los datos o agrupaciones de menor a mayor o de mayor a menor y de-
terminar aquel valor que los separa en 50 % antes que el y 50 % despues de el. Para este fin nos conviene tener las
frecuencias acumuladas.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 5/38
CUARTO MEDIO INSTITUTO NACIONAL
La moda esta determinada por el valor que mas se presenta o bien por el representate de la clase con mayor fre-
cuencia. Tambien es una moda aquel valor que tiene mayor frecuencia que el anterior y que el posterior, criterio para
los casos agrupados o no agrupados.
Los estadigrafos media, mediana y moda se denominan de tendencia central, aun cuando puede haber mas de unamoda y podrıa tambien no estar al centro de la muestra una vez ordenada.
Necesitamos entonces los estadigrafos de dispersion o medidas de dispersion. La diferencia entre el menor valor
y el mayor valor de la variable se llama rango y se llamara recorrido al tramo entre el menor y el mayor valor entre
los datos; los que constituyen la primera dispersion.
Se pueden fijar varios tipos de desviacion o dispersion a un valor central, sin embargo los mas empleados son la
varianza, la desviacion tıpica o desviacion estandar y el coeficiente de variacion.
La varianza σ2 se define como la media aritmetica de los cuadrados de las diferencias de cada dato respecto de la
media del conjunto.
Es decir: σ2 =
ni=1
(xi − x)2
n para el caso en que los datos no esten agrupados. Otra formula equivalente es
σ2 =
ni=1
x2i
n − x2
Tambien es posible que los datos se encuentren agrupados y en este caso, la formula debera considerar las fre-
cuencias de cada grupo o intervalo y resulta ası:
σ2 =
ni=1
F i(xi − x)2
ni=1
F i
Hay tambien otras formas de obtener la varianza.La desviacion estandar o desviacion tıpica es la raız cuadrada de la varianza y esta es facilmente interpretable y
ademas esta en la misma unidad que los datos en cuestion o estudio.
Con los datos, teniendo calculada la media y la desviacion estandar, es posible validar el instrumento usado con al-
gunos criterios adicionales, por ejemplo formando el cociente entre ella y la media, la cual se denomina coeficiente
de variacion. Cv = σ
x
El hecho que dos muestras tengan una desviacion estandar diferente, no significa que sean heterogeneas, pero si, si el
coeficiente de variacion es para una de ellas muy grande.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 6/38
CUARTO MEDIO INSTITUTO NACIONAL
Ejercicios y Problemas
1. La heroına decomisada en Espana desde el ano 1982 al 1991, segun la guadia civil, viene dada por la siguiente
tabla:
Ano 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
Kilos 42,2 34,4 50,7 50,1 130,0 350,6 334,4 258,9 379,0 229,1
Fuente: Secretarıa de Estado para la seguridad
Represente esta informacion en dos tipos de graficos, uno de frecuencias, absolutas o relativas y otro de fre-
cuencias acumuladas.
2. El histograma adjunto corresponde al que se desarrollo respecto al salario de los operarios de una empresa en
miles de pesos. A partir de el, obten:
a) La tabla de frecuencias asociada.
b) El diagrama circular correspondiente
1
2
3
4
5
6
-
-
-
-
-
-
| | | | | |100 110 120 130 145 170
0,61
4,2
5,6
1,2
0,4
3. Las puntuaciones de la aplicacion de un test de inteligencia a 75 estudiantes arrojo los siguientes resultados, los
cuales estan agrupados y se presentan en la tabla adjunta:
Intervalo 80-88 89-97 98-106 107-115 116-124 125-133 134-142
Frecuencia 4 10 21 23 9 5 3
Determina la media, la mediana, la moda y la desviacion estandar. Entrega la informacion de modo que lo en-tienda una persona que no sabe estadıstica descriptiva.
6
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 7/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 8/38
CUARTO MEDIO INSTITUTO NACIONAL
8. En una prueba sobre la velocidad lectora, en palabras por minuto, aplicada a 42 estudiantes, los resultados
fueron los siguientes:
70 80 43 105 112 71 96 8158 57 80 81 73 99 57 74
87 48 90 47 109 90 69 79
75 52 72 81 91 56 67 66
79 90 106 100 87 104 75 110
53 98
a) Represente esta informacion con datos agrupados en intervalos de clase.
b) Calcule la media, la mediana, la moda y la desviacion estandar.
c) Haga los mismos calculos con datos individuales, sin agrupar.
9. En cuatro cursos de Cuarto Medio de 30, 35, 42 y 45 alumnos se obtuvieron los siguientes promedios en la sig-
natura de ingles 6,0; 5,3; 4,5 y 6,1. Determina el promedio de todo el nivel en dicha asignatura y la desviacion
estandar.
10. Para los siguientes datos 1, 3, 5, 7 y 9
a) Calcule la media, la varianza y la desviacion estandar
b) Sume 20 a cada uno de los datos y haga los mismos calculos que en el caso anterior.¿Que efecto se produjo
respecto a los parametros anteriores?
c) Formula alguna hipotesis general respecto al cambio de los parametros al sumar alguna cantidad fija a
cada uno de los datos.
d ) ¿Que ocurre si los datos se multiplican por 20 cada uno con respecto a los parametros
11. En una empresa, el sueldo promedio de sus empleados es de $250.000 por mes, la desvaicion estandar es de
$50.000. Para el proximo perıodo de negociacion, la empresa esta proponiendo un aumento de $25.000 para
cada trabajador, por su parte, el sindicato solicita un aumento del 10 % a cada uno de ellos. ¿Cual sera el nuevo
sueldo en ambos casos?; ¿habra un caso mas justo que otro, es decir, genera menos desigualdad?
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 9/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 10/38
CUARTO MEDIO INSTITUTO NACIONAL
Distribuciones bidimensionales
Este tema tiene escaso tratamiento en ensenanza media, sin embargo es muy importante que sea trabajado, sobre
todo cuando queremos saber que relacion existe entre dos tipos de variables o eventos, por ejemplo entre NEM y PSU
o entre PSU de Lenguaje y PSU de Matematica; en ninos o ninas de hasta 14 anos, es posible hacer una estimacion
entre edad y estatura, la que a menor edad es mas exacta o precisa.
Nos interesa descubrir alguna relacion funcional entre variables, aun cuando no siempre es posible.
Para poder hacer este tipo de trabajo estadıstico, es necesario tener bastantes recursos matematicos disponibles, por
ejemplo la ecuacion de una recta o de una parabola, u otra curva cualquiera. Metodos para obtener el menor error para
ajustarse a un modelo y tantas otras cosas, incluso el ingenio y el dibujar de modo correcto.
En este tipo de distribuciones hay dos variables, las que representadas en un sistema coordenado generaran una nube
de puntos. Dichos puntos adquieren en algunos casos una configuracion parecida a alguna curva o se aproximan a ella.
Veremos algunos ejemplos:
Ejemplo 1 Se pregunto a un grupo de estudiantes sobre su nota y las horas de estudio previas para una prueba de
logica; los resultados se presentan en la siguiente tabla
Horas de estudio 0 1 2 3 4 5 6 7 8 9
Nota 1,0 1,5 3,0 5,0 4,0 4,5 6,5 7,0 5,8 7,0 ¿es posible conjeturar que a mayor ho-
ras de estudio mejor nota? Justifique su respuesta.
La situacion en cuestion la podemos mostrar en el siguiente grafico:
••
•
••
•
••
•
•
N o t a s
Horas de estudio0 1 2 3 4 5 6 7 8 9
| | | | | | | | |1
2
3
4
5
6
7
−−−−−−−
Con la sola representacion, podemos asegurar que a mayor horas de estudio, mejor calificacion. Los puntos se
distribuyen muy cercanos a una recta.
Nuestro problema es obtener matematicamente, es decir, por algun proceso de analisis determinar la ecuacion de dicha
recta.Observacion, la mejor recta es aquella a la cual la suma de distancias de todos los puntos hacia ella es la menor posi-
ble. Por intuicion se tiende a suponer que es la que contiene mas puntos, pronto veremos que no siempre es ası.
La ecuacion de una recta tiene la forma y = mx + n y si un punto (a, b) satisface la ecuacion, entonces
b = ma + n, lo que indica claramente que nuestro problema es determinar m y n
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 11/38
CUARTO MEDIO INSTITUTO NACIONAL
La recta satisface una ecuacion de la forma Ar ≈ B, donde A, B y r son matrices. A es matriz de n × 2, B es
matriz de n × 1 y r es una matriz de 2 × 1.
Para este caso en particular es:
Un algoritmo empleado para este fin utiliza el produto de una matriz con su transpuesta, del siguiente modo:
1 01 11 21 31 41 51 61 7
1 81 9
·
r0r1
=
1, 01, 53, 05, 04, 04, 56, 57, 0
5, 87, 0
Una ecuacion de este tipo se resuelve del modo siguiente:
(AT · A)−1 · AT · B = r y la solucion r =
r0r1
indica que y = r1x + r0
(AT · A) se calcula del siguiente modo:
1 1 1 1 1 1 1 1 1 10 1 2 3 4 5 6 7 8 9
·
1 01 11 21 31 41 51 61 71 81 9
=
10 4545 285
Esta matriz admite inversa y se procede a su calculo; primero el determinante de 10 45
45 285 = 825, con esto, se
tiene que
(AT · A)−1 = 1
825
285 −45−45 10
Por lo tanto, lo pedido es:
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 12/38
CUARTO MEDIO INSTITUTO NACIONAL
1
825
285 −45−45 10
·
1 1 1 1 1 1 1 1 1 10 1 2 3 4 5 6 7 8 9
·
1, 01, 53, 05, 04, 04, 56, 5
7, 05, 87, 0
=
r0r1
La multiplicacion de matrices es asociativa, ası que podemos multiplicar las matrices de 2 × 10 y la de 10 × 1para obtener una matriz de 2 × 1, la que sera multiplicada por una de 2 × 2
1
825
285 −45−45 10
·
45, 3258, 4
=
1
825
1282, 5
545, 5
=
1, 55450, 6612
=
r0r1
La recta que correlaciona ambos eventos es y = 0, 6612 · x + 1, 5545 y se representa con rojo en la grafica corre-
spondiente:
••
•
••
•
••
•
•
N o t a s
Horas de estudio0 1 2 3 4 5 6 7 8 9
| | | | | | | | |1
2
3
4
5
6
7
−−−−−
−−
Cuando una persona imagina la recta de ajuste o correlacion, considera aquella que contiene mas puntos de la
nube, sin embargo puede ocurrir que ni siquiera contenga un punto, como parece ser en este caso.
La intuicion es buena pero no tanto.
La forma en que se obtiene esta recta considera la proyeccion ortogonal de un vector sobre otro y allı se mide la
distancia entre el extremo libre del vector y el punto en su proyeccion. La aplicacion es de algebra lineal. Se solicita
tener confianza en que lo que se propone es lo correcto.
Para verificar (no para demostrar) consideremos el siguiente ejemplo:
Determine la ecuacion de la recta que pasa por los puntos P (3, 5) y Q(4, 7).
La matriz A esta dada por A =
1 31 4
y la matriz B por B =
57
.
La ecuacion es A · r ≈ B .
Su resolucion tiene la forma (AT · A)−1 · AT · B = r
(AT · A)−1 = 1 ·
25 −7−7 2
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 13/38
CUARTO MEDIO INSTITUTO NACIONAL
Con este resultado, tendremos 25 −7−7 2
1 13 4
57
=
r0r1
Entonces nos resulta:
25 −7−7 2
1243
= −1
2
La recta en cuestion es
y = 2x − 1
Si en lugar de este procedimiento hubiesemos considerado el tradicional, es decir, y = 7 − 5
4 − 3(x−3)+5, llegamos
a la misma recta
Ejercicios
1. En un curso pequeno, los estudiantes rinden 4 pruebas en dos asignaturas a saber Lenguaje y Matematica y sus
notas son dadas en la siguiente tabla:
Lenguaje, x : 6 7 3 2 6 7
Matematica, y : 5 7 4 2 6 6
Obtenga la recta que mejor representa esta situacion
2. Previo a la aplicacion de una prueba, los estudiantes desarrollaron algunos ejercicios x y obtuvieron y respues-
tas correctas en la prueba correspondiente, segun se muestra en la tabla adjunta:
Desarrollados antes; x 2 3 1 7 4 7Desarrollos en prueba; y 3 6 7 5 8 10
Obtenga la ecuacion de la recta que mejor representa esta situacion
3. Se seleccionaron a azar ocho alumnos de cuarto medio y se registro su peso en kilogramos y su estatura en
centımetros, segun se consigna en la siguiente tabla
Peso en kilogramos; x 49 55 43 47 51 60 63 58Estatura en centımetros ; y 158 165 155 161 154 167 162 171
¿Que puede concluir con esta informacion respecto a la relacion peso - estatura en este grupo de personas?
4. en una clase de estadıstica se pregunto a seis alumnos elegidos al azar, respecto a las horas semanales que ocu-
pan en whatsapp y en estudiar. Los resultados son los siguientes:
Whatsapp:x 12 10 15 20 28 8
Estudio:y 7 8 5 2 3 10
Dibuje la nube de puntos y determine la recta de ajuste para esa situacion.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 14/38
CUARTO MEDIO INSTITUTO NACIONAL
Estadıgrafos Marginales
Como en el caso unidimensional, lo tratado con anterioridad, existen:
Medias aritmeticas
ax =
N
i=1
xini
ni=1
ni
ay =
N i=1
yini
ni=1
ni
Medias cuadraticas
a2x =
N i=1
x2i ni
ni=1
ni
a2y =
N i=1
x2i ni
ni=1 ni
axy =
N i=1
xiyini
ni=1
ni
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 15/38
CUARTO MEDIO INSTITUTO NACIONAL
Varianzas
S 2x =
N i=1
(xi − ax)2ni
ni=1
ni
S 2y =
N i=1
(yi − ay)2ni
ni=1
ni
Momentos Centrales
m11 = S xy =
N i=1
(xi − ax)(yi − ay)ni
n
i=1
ni
mrs =
N i=1
(xi − ax)r(yi − ay)sni
ni=1
ni
Entre estos valores se dan las siguientes relaciones:
S 2x = a2 − a2x
m11 = a11 − axay
Cuando hay dos variables, se puede obtener un coeficiente que indicara el grado de correlacion que existe entre
ambas, aun cuando parezca no haber relacion alguna.
El valor de este coeficiente viene dado por la expresion:
r2 = m2
11
S 2yS 2x
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 16/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 17/38
CUARTO MEDIO INSTITUTO NACIONAL
Y con estos valores
a = sxy
s2x=
3, 17
2, 082 = 0, 73 b = y − ax = 4 − 0, 73 · 5 = 0, 3
Luego la recta pedida es: y = 0, 73x + 0, 35
•
••
• •
•
Obtener la recta que mejor se ajuste a los puntos, segun el criterio de los mınimos cuadrados.
x 1 3 4 5 5 6
y 2 3 5 5 7 8
Para tener en cuenta
1. La recta de regresion permite estimar el valor de una variable a partir del valor de la otra.
Para estimar el valor de la variable y a partir de la variable x, utilizamos la recta de regresion de y sobre x, cuya
ecuacion tiene la forma
y − y = sxy
s2x(x − x)
La recta de regresion de x sobre y tiene ecuacion
x − x = sxy
s2y(y − y)
las que obviamente son distintas
2. La pendiente de la recta de regresion tiene el mismo signo que el coeficiente de variacion a = sxy
s2x. Si la cor-
relacion es directa, a > 0 y si es inversa a < 0
3. La recta de regresion pasa por el punto (x, y), centro de gravedad de la distribucion
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 18/38
CUARTO MEDIO INSTITUTO NACIONAL
4. Si la recta se ajusta bien a la nube de puntos, la correlacion es fuerte; y viceversa
El criterio mas sencillo para averiguar la bondad del ajuste por la recta de regresion lo da el coeficiente de
correlacion r:
Si r es proximo a ±1,el ajuste es bueno.
Si r es casi 0, el ajuste es malo.
Ademas, la estimacion es mas fiable para valores de x cercanos a x.
O, alternativamente, para valores de y cercanos a y.
Ejercicios
1. La siguente tabla da los rendimientos de siete parcelas de caracterısticas similares, que han sido tratadas con la
cantidad de fertilizante que se indica:
Fertilizante(Kg); x 60 80 100 120 140 160 180
Rendimiento(Kg); y 2.500 2.400 2.900 2.700 3.000 3.300 3.200
Obtenga la recta de correlacion e indique que produccion se espera con 45 Kg de fertilizante
2. Calcular e interpretar el coeficiente de correlacion en la siguiente tabla de datos.
x 1 2 5 4 1 6
y 3 1 5 6 2 7
3. El SENAMA ha encargado un estudio para calcular la esperanza de vida y respecto al porcentaje de poblacion
urbana x en ocho de las regiones del paıs. Los datos fueron recogidos en la siguiente tabla:
Urbanizacion : x 94 24 65 25 73 53 57 27Esperanza de
vida en anos : y 78 59 74 55 81 67 61 45
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 19/38
CUARTO MEDIO INSTITUTO NACIONAL
Combinatoria
Para el trabajo en esta area es necesario considerar algunas tecnicas basicas de conteo, es decir, contar bien.
Para esto hay dos principios basicos, el uno es el aditivo y el otro es el multiplicativo, estos se enuncian a continuacion:
El principio aditivo Si hay que escoger un elemento entre r tipos distintos y hay para uno de ellos
t1 opciones, para el segundo t2 opciones y ası sucesivamente hasta tr para el tipo r − esimo. Entonces dicho
elemento de puede escoger de t1 + t2 + t3 + · · · + tr formas distintas
El principio multiplicativo Si una tarea hay que realizarla en n etapas y estas etapas se pueden desarrollar, para
la primera de t1 opciones, para el segundo t2 opciones y ası sucesivamente hasta tn para el tipo n − esimo.
Entonces dichas tareas se pueden escoger de t1 · t2 · t3 · · · · tr formas distintas
Estos principios se emplean del siguiente modo: Hay que escoger, desde un estante, un libro de alguna de tres
areas del conocimiento entre matematica, f ısica o biologıa y en el estante hay 12 libros de matematica, 9 libros de
fısica y 5 libros de biologıa, entonces se pueden dar 12+9+5=26 casos. En cambio se tiene en un ropero 4 pantalones,
5 camisas y 3 chalecos, una persona se puede vestir de 4 × 5 × 3 = 60 formas diferentes.
Otros ejemplos son:
1. Solo con los dıgitos 5 y 7, ¿cuantos numeros de 7 cifras se pueden escribir?
Cambiemos el enfoque del problema y supongamos que hay 7 casillas en las cuales se puede colocar o un 5 o
un 7, por lo tanto en cada casilla hay dos opciones, ası entonces habra 27 = 128 numeros diferentes. Desde el
55555 al 77777 y mas aun, se podrıa solicitar la suma de todos ellos.
2. ¿Cuantos numeros significativos de 5 cifras se pueden escribir sin utilizar los dıgitos 3, 5 y 7?
Para que sea significativo, la cifra de la decena de mil no puede ser cero y los dıgitos son 10 y restando el 0,
el 3, el 5 y el 7, nos quedan 6 opciones para esa posicion. Para la otras 4 posiciones o casillas como en el caso
anterior, hay 7 opciones para cada una; entonces la cantidad de numeros posibles es 6 × 7
4
= 2401 numeros
posibles.
3. ¿Cuantos numeros significativos de 5 cifras, todas ellas pares a excepcion de 4 y 8 o bien todas ellas inmpares
a exepcion de 5 y 9 se pueden escribir?
Los pares son 5 y el 0 no puede ser la cifra de la decena de mil, por lo tanto para la primera posicion hay 2
opciones y para cada una de las otras 3 opciones, los de cifras pares son 2×34 = 162 y los de las cifras impares
son 35 = 243. Por lo tanto son 162 + 243 = 405 numeros de cinco cifras todas pares a excepcion de 4 y 8 o
todas impares a excepcion de 5 y 9.
4. ¿Cuantos numeros significativos con 6 cifras se pueden escribir si en ellos no hay dıgitos repetidos?
La centena de mil no puede ser cero, por lo tanto en esa posicion hay 9 opciones, lo mismo que para la decena
de mil, para las siguientes van quedando 8, 7, 6 y 5 opciones para cada posicion. La cantidad de numeros es
92 × 8 × 7 × 6 × 5 = 136080
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 20/38
CUARTO MEDIO INSTITUTO NACIONAL
Permutaciones y arreglos
Una permutacion, al igual que un arreglo es un orden, la primera con todos los elementos y la segunda con algunos
de ellos. La idea puede ser considerar n elementos distintos para colocar de uno en uno en n casillas. Si llenamos las
casillas de izquierda a derecha, vamos a tener lo siguiente:
n
−0 = n n
−1 n
−2
· · · n
−(k
−1) n
−k
· · · n
−(n
−2) = 2 n
−(n
−1) = 1
Estos valores se van multiplicando entre si; si fuesen 5 elementos para 5 casillas, el numero de permutaciones
serıa 5! = 5 × 4 × 3 × 2 × 1 = 120. Si para los mismos 5 elementos, vamos a ubicarlos en 3 casillas, esto se llama
arreglo y van a ser 5 × 5 × 3
Viendo la representacion grafica se explica ası:
5 − 0 5 − 1 5 − 2 5 − 3 5 − 4
Algunos ejercicios y problemas
1. Sean A, B y C tres conjuntos finitos, #(A) denota el cardinal (numero de elementos) de A.
Demuestre que:
#(A ∪ B ∪ C ) = #(A) + #(B) + #(C ) − #(A ∩ B) − #(A ∩ C ) − #(B ∩ C ) + #(A ∩ B ∩ C )
2. ¿Cuantos numeros naturales menores que 1.000 son divisibles por 5 pero no por 7?
3. ¿Cuantos numeros naturales menores o iguales que 1.260 son primos relativos con 1260?
4. x ∈N ∧ 1 ≤ x ≤ 10.000, ¿para cuantos valores de x se tiene que 2x − x2 no es divisible por 7?
5. Determine el mayor numero de partes en que se puede dividir un plano con n lineas rectas.
6. Evalue las siguientes sumas:
a)
n0
−
n1
+
n2
− · · · + (−1)n
nn
b)
n1
+ 2
n2
+ 3
n3
+ · · · + n
nn
(n ≥ 1)
c) 2n
n + 2 2n − 1
n + 4 2n − 2
n +
· · ·+ 2n n
n
d )
n0
2
−
n1
2
+
n2
2
− · · · + (−1)n
nn
2
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 21/38
CUARTO MEDIO INSTITUTO NACIONAL
Probabilidad
Se llama probabilidad al cociente entre el numero de ocurrencias de un evento particular sobre el total de eventos,
o dicho de otro modo, el cociente entre casos favorables y el total de casos.Sin embargo esto no es tan facil de comprobar empiricamente, por ejemplo se dice que al lanzar una moneda, la
ocurrencia que salga cara es 1
2. Un matematico comprobo esto con el lanzamiento de una moneda 1000 veces y no
obtuvo 500 y 500, pero si algo aproximado. A esta probabilidad se le justifica con la ley de los grandes numeros. La
probabilidad es un calculo teorico, solo justificado por la teorıa. Es practicamente imposible que en pocos experimen-
tos verifiquemos la probabilidad de un evento en particular. De la situacion anterior, las aproximaciones son bastante
aceptables, lo que indicarıa que ambos dados no estan trucados, es decir, forzados a marcar una puntuacion con mayor
frecuencia que las otras.
En el calcuo de probabilidades, muchas veces la dificultad estriba en el conteo de los casos, tanto totales, como los
casos favorables. Para ello es relevante la teorıa combinatoria y ademas el algebra de conjuntos.
Veamos un ejemplo: En una cl´ ınica se registraron durante tres meses los siguientes nacimientos:
Enero: 145 varones y 135 hembras
Febrero: 142 varones y 136 hembras
Marzo: 152 varones y 140 hembras
¿Que probabilidad hay para que un recien nacido sea varon?, asumiendo que hay alguna tendencia regular.
Como los numeros no difieren en demasıa, podemos calcular las proporciones de nacimientos masculinos:
en enero 145
280 ≈ 0, 518 = 51, 8 %
en febrero 142
278 ≈ 0, 511 = 51, 1 %
en Marzo 152
292 ≈ 0, 520 = 52, 0 %
La media aritmetica de estas proporciones en los tres meses, es aproximadamente 0, 516 = 51, 6 %.
Un calculo teorico simple indica que la probabilidad es 1
2 que nazca varon; sin embargo, la practica da una leve
diferencia a favor de ser varon, sobre ser hembra.
ejemplo 2:- A principios del siglo XIX Brown, un bot anico ingles, descubri´ o un curioso comportamiento respecto a
part ıculas en suspensi´ on en un ambiente l ıquido, estas part ıculas se mueven de modo err atico, incesante y arbitrario,
el movimiento browniano.
Por mucho tiempo no se supo a que causa atribuir este fen ´ omeno, sin embargo lo aclar o la teor ıa cin´ etica de los
gases, con una explicaci ´ on sencilla y completa.
Swedeborg, un f ısico, desarroll´ o 518 observaciones a suspensiones de part ıculas de oro en el agua y registr o sus
observaciones como sigue:
0 partıculas: 112
518 ≈ 0, 216
1 partıcula: 168518
≈ 0, 325
2 partıculas: 130
518 ≈ 0, 251
3 partıculas: 69
518 ≈ 0, 133
4 partıculas: 32518
≈ 0, 062
5 partıculas: 5
518 ≈ 0, 010
6 partıculas: 1
518 ≈ 0, 002
7 partıculas: 1518
≈ 0, 002
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 22/38
CUARTO MEDIO INSTITUTO NACIONAL
Resuelva las siguientes situaciones planteadas.
1. ¿De cuantas maneras se puede escoger un nino y una nina de un grupo de seis ninos y nueve ninas?
2. ¿De cuantas formas distintas se pueden sentar siete ninos en una banca (fila)?
3. Ocho ninos deben formarse en una fila, ¿de cuantas maneras se puede hacer, si dos de ellos deben ubicarse en
los extremos?
4. ¿Cuantos numeros pares se pueden formar con tres de entre los dıgitos 3, 4, 5, 6 y 7, sin repetir dıgitos en
cada uno de ellos?
5. ¿Cuantos numeros impares se pueden formar con tres de entre los dıgitos 3, 4, 5, 6 y 7, si se pueden repetir
dıgitos en cada uno de ellos?
6. ¿Cuantos numeros mayores de siete mil se puede formar con los dıgitos 3, 5, 7, 8 y 9, sin repetir dıgitos encada numero?
7. ¿Cuantos numeros mayores que 500 se pueden escribir con los dıgitos 4, 5, 6 y 7, sin y con repeticion?
8. ¿Cuantos numeros pares de cuatro cifras se pueden formar con las cifras 1, 2, 3, 4 y 6, sin y con repeticion?
9. Hay cinco personas y ocho sillas dispuestas en fila, ¿de cuantas formas pueden sentarse, una persona por silla?
10. ¿Cuantos anagramas se pueden formar con las letras de la palabra MADRE?, ¿cuantas de ellas comienzan con
M?, ¿cuantas con MA?
11. Un hombre posee diez ternos, una docena de camisas y cinco pares de zapatos, todos los artıculos son distintos,
¿de cuantas formas distintas se puede vestir entonces?
12. En un test hay doce preguntas de verdadero o falso, ¿cuantas formas distintas podemos obtener como respues-
tas, si los alumnos responden, todos, al azar?
13. En relacion con la palabra TEORIA:
a) ¿cuantos anagramas se pueden obtener, sin considerar el acento?
b) ¿cuantos anagramas se pueden obtener, considerando el acento en cualquier vocal?
c) ¿cuantos anagramas se pueden obtener, sin considerar el acento y comienzan con T?
d ) ¿cuantos anagramas se pueden obtener, sin considerar el acento y comienzan en una vocal?
e) ¿cuantos anagramas se pueden obtener, sin considerar el acento y con todas las vocales juntas?
14. En relacion con la palabra PALABRERIA:
a) ¿cuantos anagramas se pueden obtener, sin considerar el acento?
b) ¿cuantos anagramas se pueden obtener, considerando el acento en cualquier vocal?
c) ¿cuantos anagramas se pueden obtener, sin considerar el acento y comienzan con P?
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 23/38
CUARTO MEDIO INSTITUTO NACIONAL
d ) ¿cuantos anagramas se pueden obtener, sin considerar el acento y comienzan en una vocal?
e) ¿cuantos anagramas se pueden obtener, sin considerar el acento y con todas las vocales juntas?
15. Determine el valor numerico de m en cada caso:
a) Am3
Am2
= 4 b) Am3 = 30m c) (m + 2)! = 72 · m!
16. Anotar como un solo producto (multiplicacion) n! − (n − 1)!
17. Obtenga p si
8
p + 2
8 p + 1
= 2
18. Calcule el valor numerico de p si Am p =
m p
19. Calcular Am3 ; si
m
3
= 84
20. ¿De cuantas maneras se puede elegir un comite de tres mujeres y cuatro hombres, si hay ocho mujeres y siete
hombres para seleccionar?
21. Si de ocho mujeres una se rehusa a participar en cualquier comite y de los siete hombres, uno debe formar parte
en cualquiera de ellos, Cuantos comites se pueden formar con tres mujeres y cuatro hombres?
22. ¿Cual es el mayor numero de puntos de interseccion entre:
a) 12 rectas?
b) 9 circunferencias?
c) 6 rectas y 5 circunferencias?
23. En un grupo de dieciseis ninos, siete de ellos son scouts. ¿De cuantas maneras podemos seleccionar a once e
ellos, de modo que haya exactamente cinco scouts entre ellos?
24. En un grupo de dieciseis ninos, siete de ellos son scouts. ¿De cuantas maneras podemos seleccionar a once e
ellos, de modo que haya a lo menos cinco scouts entre ellos?
25. Determine m si:
a)
m
3
=
m
5
m
2
= 55
26. Simplificar
4n3n
·
3n2n
·
2nn
27. Se tienen dos rectas distinas AB y AC , se toman m puntos en la recta AB y n puntos en la recta AC , ¿cuantos
triangulos se pueden formar usando esos puntos, excluyendo al punto A e incluyendo a punto A por separado?
28. ¿De cuantas maneras pueden ubicarse cuatro ninos y tres ninas en una fila, si las ninas no pueden quedar sepa-
radas?
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 24/38
CUARTO MEDIO INSTITUTO NACIONAL
29. ¿Cuantos numeros pares entre 100 y 1.000 se pueden formar con los dıgitos 4, 5, 6, 7 y 8 sin repetir dıgitos en
cada numero?, ¿Cuantos si los dıgitos se pueden repetir?
ProbabilidadesEjercicios yProblemas
1. Determine la probabilidad de obtener once puntos al lanzar dos dados sobre una mesa.
2. ¿Cual es la probabilidad que al levantar una ficha de domino, esta sea un chancho (doble)?
3. Se lanzan cinco dados, ¿cual es la probabilidad de obtener la misma puntuacion en todos los dados?
4. Se lanzan cinco dados, ¿cual es la probabilidad de obtener tres de ellos con la misma puntuacion y otros dos
tambien con misma puntuacion, pero diferente a la anterior?
5. Se tira una Loterıa de quinientos numeros, con 25 premios, ¿que probabilidad tiene de ganar, a lo menos un
premio, un jugador que compro diez numeros?
6. ¿Cual es la probabilidad de encontrar un numero divisible por tres entre los numeros de tres cifras distintas que
se pueden escribir con los guarismos 1, 2, 3, 4 y 5?
7. Con los guarismos 1, 2, 3 y 4 se forman numeros de cuatro cifras, ¿que probabilidad hay de obtener uno que
sea multiplo de once?
8. De una baraja inglesa (52 cartas) se extraen tres cartas, ¿cual es la probabilidad que todas ellas sean Ases?
9. Se lanzan tres dados sobre una mesa, ¿cual es la probabilidad que la suma de puntuaciones sea superior a 12?
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 25/38
CUARTO MEDIO INSTITUTO NACIONAL
10. ¿Cual es la probabilidad de obtener un Full en una mano de Pocker?
11. ¿Cual es la probabilidad de obtener un Full de Ases en un juego de Pocker?
12. En una bolsa hay doce bolas blancas y ocho bolas negras, se extraen dos bolas al azar simultaneamente, ¿cual
es la probabilidad que sean del mismo color?
13. En una bolsa hay doce bolas blancas numeradas del uno al doce y ocho bolas negras numeradas del trece al
veinte, se extraen tres bolas al azar simultaneamente, ¿cual es la probabilidad que sean pares y del mismo color?
14. En la tabla siguiente se considera un experimento y dos sucesos referentes a dicho experimento. Se pide deter-
minar la probabilidad de cada suceso.
Experimento Suceso E Suceso F
(i) Se tira un unico dado Sale un numero mayor
que 2 Sale un numero par
(ii) Se tira un par de dados Por lo menos uno de
los numeros es 4
Se obtiene suma de
puntos 10
(iii) Se extraen dos cartas
de una baraja Espanola
Por lo menos una de
las cartas es un As
Las dos cartas son
Espadas
(iv)
Se sacan dos bolas de
un saco que contiene dosbolas verdes y cuatro bolas
azules
Las dos bolas sonazules Por lo menos una bolaes azul
(v)
Se saca una bola de un
saco que contiene dos
bolas verdes y cuatro
bolas azules, se
devuelve al saco y se
saca nuevamente una bola
Las dos bolas son
azules
Por lo menos una
bola es azul
(vi) Se extraen tres cartas
de una baraja espanola Son todas Ases
Una es el As de Espadas
y las otras son menores
que nueve
(vii)
Se sacan tres fichas de
una urna con nueve fichas
numeradas del uno
al nueve
Todas las fichas
tienen numeros
menores de cinco
Todos los numeros son
impares
(viii)
Dos hombres y dos
mujeres se sientan a
cenar en torno a
una mesa circular
Las mujeres se
sientan juntas
Hombres y mujeres se
sientan alternadamente
(ix) Se lanzan cuatro monedas
al aire
Por lo menos sale
una cara No salen mas de dos caras
(x)
En un cajon hay seis
pares de calcetines rojosocho pares de amarillos
y dos pares de azules,
se extraen dos calcetines
(un par )
Es un par del
mismo color El par es rojo
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 26/38
CUARTO MEDIO INSTITUTO NACIONAL
Distribuciones de probabilidad
Motivacion: Supongamos que deseamos calcular la probabilidad de que, al lanzar al aire simultaneamente 8 mon-
edas, 3 de ellas marquen cara y las 5 restantes sello. Para este efecto podemos, desde luego, calcular esta probabilidad
por medio del cociente entre el numero de sucesos favorables y el total de casos posibles. Para este efecto se tiene que 83
corresponde al numero de casos favorables y 28 es el total de casos. La probabilidad buscada es entonces
P (3) =
83
28
Podemos ademas valernos de otro metodo, que en apariencia puede ser rebuscado, sin embargo nos va a permitir
generalizar este tipo de cuestiones. Que en una moneda honesta salga cara, la probabilidad es 1
2 y como son 8 monedas,
la probabilidad de que las 8 marquen cara es
1
2 · 1
2 · 1
2 · 1
2 · 1
2 · 1
2 · 1
2 · 1
2 =
1
2
8
Pero lo que necesitamos es que 3 de esas monedas salgan o marquen cara y ese numero esta dado por
83
Entonces
la probabilidad pedida es
P (3) =
1
2
8
·
83
Si lo solicitado hubiese sido, calcular la probabilidad de que al lanzar 8 monedas, 5 de ellas marquen sello, su
calculo indicara
P (5) =1
28
· 8
5
y como es obvio, deben dar el mismo valor.
Si se van a lanzar n monedas y se espera que k de ellas salga cara, entonces la probabilidad que esto ocurra es
P (k) =
1
2
n
·
nk
Si consideramos que P (x) es una funcion, entonces podemos representarla graficamente:
Construyamos primeramente la tabla pertinente
x 0 1 2 3 4 6 7 8
P (x)1
256
8
256
28
256
56
256
70
256
56
256
28
256
8
256
1
256Su grafica es:
•
•
•
•
•
•
•
•
•0 1 2 3 4 5 6 7 8
1256
8256
28256
56256
70256
26
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 27/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 28/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 29/38
CUARTO MEDIO INSTITUTO NACIONAL
|2
|3
|4
|5
|6
|7
|8
|9
|10
|11
|12
•
•
•
•
•
•
•
•
•
•
•
136
236
336
436
536
636
Vamos a interpretar la situacion del siguiente modo: A cada punto le corresponde un rect angulo de base 1 y altura
de acuerdo con la probabilidad de ese evento. Diremos entonces que la probabilidad es el area asociada a dicho evento.
Al hacer de la grafica una curva continua, la probabilidad sera el area bajo la curva que entregue la integral definida
de la funcion densidad p(x):
P (X : r ≤ x ≤ s) =
sr
p(x)dx
r y s son dos puntos cualesquiera del intervalo y lo que se entrega es la probabilidad de que x se encuentre compren-dida entre r y s.
Si el universo en estudio esta comprendido entre a y b, naturalmente debemos tener que
P (X : a ≤ x ≤ b) =
ba
p(x)dx = 1
La funcion densidad puede ser de cualquier tipo. Supongamos un suceso continuo entre 0 y 3, es decir en el
intervalo [0, 3], entonces
p(X : 0
≤ x
≤ 3) =
3
0
1
3
dx = 1
3
x
3
0
= 1
3 ·3
− 1
3 ·0 = 1
y tambien satisface lo mismo la siguiente:
p(X : 0 ≤ x ≤ 3) =
30
x2
9 dx =
1
9 · x
3
3
3
0
= 1
9 · 27
3 − 1
9 · 0
3
3 =
27
27 = 1
Si se llegase a pedir p(X : a ≤ x ≤ a) =
aa
p(x)dx, esta debe ser cero. Entonces debajo de un unico punto no
hay area.
Con esto podemos decir, al ser la variable continua, que la probabilidad de ocurrencia de un evento unico es cero y
lo unico que podemos calcular es la ocurrencia de un grupo de eventos en un intervalo, calculando el area bajo la curva.
Para estos casos, la media y la varianza se obtienen respectivamente ası:
x =
ba
xp(x)dx
y
σ2 =
ba
x2 p(x)dx − x2
29
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 30/38
CUARTO MEDIO INSTITUTO NACIONAL
Ejercicios
1. Sea x una variable aleatoria continua definida en (0, π2 ) y la funcion p(x) = sen xMuestre que p(x) puede ser una funcion de densidad. Calcule la media y la varianza de esta distribucion.
2. En el intervalo (1, 10) se define p(x) = 10
9x2. Haga ver que es una funcion de densidad, calcule
p(X : 7 ≥ x ≥ 10), su media y su varianza.
3. En el intervalo (1, e) se define p(x) = 1
x Obtenga p(X : 1 ≥ x ≥ e
2). Tambien calcule la media y la varianza.
Otro enfoque
Consideremos la siguiente situacion, mas ajustada a la variable continua:
Se ha cronometrado el tiempo que demoran en llegar a la meta miles de corredores, en la cual el m as rapidodemoro 60 minutos y el mas lento 120 minutos. Los registros se presentaron en intervalos de 10 minutos.
x( minutos ) f r[60, 70 ) 0, 05[70, 80 ) 0, 35[80, 90 ) 0, 30
[90, 100 ) 0, 15[100, 110 ) 0, 10[110, 120 ) 0, 05
1
|| |60
|70
|80
|90
|100
|110
|120
•0,05 −
•0,35 −
•0,30 −
•0,15 −
•0,10 −
•
El grafico muestra el histograma (linea punteada en rojo), la poligonal (linea azul) y una curva suave continua
(gris) aproximando la densidad.
Serıa muy interesante poder obtener la funcion densidad para este comportamiento, por su semejanza a una
parabola, al menos en su parte mas alta, podrıa intentarse con una de ellas, de modo que el area total sea 1.
30
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 31/38
CUARTO MEDIO INSTITUTO NACIONAL
Para la misma carrera, otro equipo de investigacion cronometro cada 5 minutos, los resultados se presentan en la
siguiente tabla y grafica:
x( minutos ) f r[60, 65 ) 0, 02[65, 70 ) 0, 03
[70, 75 ) 0, 16[75, 80 ) 0, 19[80, 85 ) 0, 20[85, 90 ) 0, 10[90, 95 ) 0, 08
[95, 100 ) 0, 07[100, 105 ) 0, 06[105, 110 ) 0, 04[110, 115 ) 0, 03[115, 120 ) 0, 02
1
|| |60
| |70
| |80
| |90
| |100
| |110
| |120
•
0,05 −
•
•
0,25
−
• •0,20 −
••
0,15 −
• •
0,10 −
• • •
Achicando los intervalos, la situacion ha cambiado bruscamente, la apariencia es de una campana, bastante mal
tratada, pero campana.
Si lo que necesitamos es saber o cacular la probabilidad de que un corredor llegue entre los 73 y 95 minutos, nos
bastara con determinar la medidad del area bajo la curva entre los extremos 73 y 95
p(X : 73 ≤ x ≤ 95) =
9573
f (x)dx
Para determinar esta probabilidad podemos utilizar la tabla de tiempos de 5 en 5 minutos, consideramos 2
5 del
intervalo [70, 75 ) y los cuatro intervalos siguientes, hasta [90, 95 ) y para representar graficamente esta probabilidad,
basta levantar segmentos perpendiculares al eje x en los puntos (0, 73) y (0, 95) y destacar el area encerrada entre el
eje x, los dos segmentos y la curva o histograma.
La funcion de densidad
Una funcion f (x) definida en el intervalo [a, b] se llamara funcion de densidad (de probabilidades) de la variable
aleatoria x si:
1. f (x) ≥
0(∀
x) x ∈
[a, b]
2. S [a, b] = 1, es decir, la superficie encerrada en el intervalo de base ab cuyos lımites son el eje x, las rectas
x = a, x = b y la funcion f (x) tiene area 1.
3. f (x) = 0 si x < a y x > b
4. p(x1 ≤ x ≤ x2) = p(x1 < x < x2) = S [x1, x2]
31
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 32/38
CUARTO MEDIO INSTITUTO NACIONAL
Un ejemplo:
Consideremos la funcion f (x)
x
8 si 0 ≤ x ≤ 4
0 si x < 0 ∨ x > 4, la cual es una funcion densidad.
Podemos asegurar la afirmacion verificando que cumple con las condiciones anteriores
1. f (x)
≥ 0(
∀x)
2. S [0, 4] = 1, se trata del area de un triangulo de base 4 y altura 4
8 =
1
2
3. p(2 ≤ x ≤ 3) = p(2 < x < 3) = S [2, 3] = 5
16, se trata del area de un trapecio de bases f (2) =
2
8 =
1
4 y
f (3) = 3
8 y altura 3 − 2 = 1.
Para alguien que conoce mas de calculo infinitesimal, la probabilidad pedida en el intervalo [2, 3], esta estara dada
por
p(2 ≤ x ≤ 3) = 3
2
x8
dx = x2
16
3
2
= 3216
− 2216
= 916
− 416
= 516
lo que coincide con lo anterior.
Si no sabes calculo, no importa, basta con calcular areas de rectangulos, triangulos y trapecios, lo unico es que
resultara una aproximacion y esta sera mas fina, mientras mas delgada es la franja para cada uno. de ellos.
Funcion de probabilidado
Funcion de distribucion
Llamaremos funcion de probabilidad a aquella que corresponde al area desde a el inicio del tramo en estudio hasta
el valor requerido x. Segun la notacion del calculo p(x) =
xa
f (x)dx = F (x), es decir, es una funcion acumulativa.
F (x) = p(X ≤ x) = S [a, x]
La funcion densidad nada representa en un f (x) cualesquiera, si lo hace la funcion de distribucion F (x) y ocurre
que F ′(x) = f (x), es decir, la funcion derivada de la funcion de distribucion es la funcion densidad.
Una funcion F (x) es admisible como funcion de distribucion si verifica cada una de las siguientes propiedades:
(1) F (x) ≥ 0 , para todo x(2) F (x) = 0 , si x ≤ a ; F (x) = 1 si x ≥ b(3) F (x) es monotona creciente. Si x1 < x2, entonces F (x1) ≤ F (x2)(4) F ′(x) = f (x) , siendo f (x) la funcion densidad
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 33/38
CUARTO MEDIO INSTITUTO NACIONAL
Ejercicios
1. Pruebe que en el intervalo [0, 6] la funcion
F (x) =
0 si x < 0
− x3
108 + x2
12 si 0 ≤ x ≤ 6
1 si x > 6
es una funcion de probabilidad.
2. Pruebe que la funcion densidad correspondiente es
f (x) =
0 si x ≤ 0
1
36
−x2 + 6x
si 0 ≤ x ≤ 6
0 si x > 6
3. Dada
F (x) =
0 si x < 0
x2
16 si 0 ≤ x ≤ 4
1 si x > 4
Obtenga
a) p(X ≤ 2)
b) p(X ≤ 3)
c) p(2 ≤ X ≤ 3)
d ) p(X > 3)
e) p(X > 4)
f ) p(3 ≤ X ≤ 4)
4. Dada la funcion
f (x) =
1
4
x si x
∈ [1, 3]
0 si si x ∈/ [1, 3]
a) Compruebe que f (x) es una funcion de densidad.
b) Calcule p(2 ≤ X ≤ 3)
c) Represente f (x) y corrobore los resultados previos.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 34/38
CUARTO MEDIO INSTITUTO NACIONAL
La distribucion normal
Hasta el momento, la funcion de distribucion continua mas importante es la distribucion normal. Muchos
fenomenos naturales y sociales se ajustan a ella.
La distribuci´ on normal fue descubierta por De Moivre en 1733 como el valor l ımite de la funci ´ on de prob-
abilidad binomial B(n, p) , cuando n tiende a infinito. Medio siglo despu´ es volvi´ o a descubrirse por Laplace yGauss; ambos vieron que la distribuci ´ on normal era la que aparentemente describ ıa mejor el comportamiento de
los errores en las medidas.
La funcion de densidad de la distribucion normal se debe eso si a Gauss y es de tipo exponencial, la que solo
sera enunciada, su demostracion, construccion y cualquier otro fundamento queda muy fuera de nuestro alcance.
f (x) = 1
σ√
2πe−
1
2
x − µ
σ
2
La demostracion de que S [−∞, +∞] = 1, es decir, el area entre el eje x y la funcion fue dada primeramente por
Laplace.
Su grafica es la mentada campana de Gauss
El area bajo la curva es 1, la probabilidad total, es
decir, que ocurra todo
El area destacada es la probalidad de ocurrencia de
los fenomenos en ese segmento, si x1 < x2, entonces esa
area sera F (x2) − F (x1)
De esta funcion y su grafica se tiene lo siguiente µ es la esperanza o media aritmetica, σ es la desviacion estandar.
El valor o punto mas alto se alcanza en x = µ y es ademas simetrica respecto a la recta x = µ
La curva es asintotica con el eje x en las direcciones −∞ y +∞
Mientras menor es σ, mas alta es la curva en la recta x = µ y en consecuencia, mas se concentran los valores en
torno a ese µ
µµ − σ µ + σ
68,26 %
µ − 2σ µ + 2σ
95,44 %
µ − 3σ µ + 3σ
99,74 %
En medicina, considerando la experiencia de anos y sus respectivos registros, se han elaborado tablas para con-
trolar los diferentes examenes que se deben realizar los pacientes, allı se considera la media o esperanza µ y dos
desviaciones estandar σ a ambos lados de dicha media; si el resultado cae entre estos margenes, la persona se consid-
era sana, es decir, el 95,44 % de las personas es considerada libre de alguna patologıa, segun las leyes estadısticas y
sobre todo de la distribucion normal.
34
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 35/38
CUARTO MEDIO INSTITUTO NACIONAL
Para obtener los valores, relativamente, exactos bajo la curva de la funcion de densidad normal, es necesario el
calculo integral, cosa que no nos corresponde estudiar en ensenanza media, ya que se trata de
F (x) =
+∞−∞
f (x)dx =
+∞−∞
1
σ√
2πe−
1
2
x − µ
σ
2
dx
Para obtener la probabilidad de que un valor se encuentre entre x1 y x2 se utiliza
x2x1
f (x)dx =
x2x1
1
σ√
2πe−
1
2
x − µ
σ
2
dx = F (x2) − F (x1)
Para una persona sana y menor de 21 anos el nivel medio de colesterol (en mg por dl) es de 160, y una desviacion
de 10, un nivel menor que 140 o mayor que 180 se considera fuera del rango de normalidad y podrıa tener aparejada
alguna anomalıa, aunque no necesariamente, pues el 4,6 % de las personas sanas estan fuera de los margenes consid-
erados normales.
Ejemplo: Supongamos que la altura promedio del ciudadano chileno mayor de 18 anos es de 165 cm. y que se
distribuye normalmente con una desviacion estandar de 8 cm. Entonces podemos estimar que un 68,26 % de ellos tiene
una estatura de entre 157 y 173 centımetros, es decir, el intervalo [µ − σ, µ + σ], que un 95,44 % estara entre las es-
taturas de 149 y 181 centımetros, [µ−2σ, µ+2σ] y casi el 100 % medira entre 141 y 189 centımetros [µ−3σ, µ+3σ].
En tiempos no muy lejanos, en ausencia de las modernas maquinas de calculo (Calculadoras cientıficas), se recur-
rio a ciertas tablas, las que se denominaron tablas de distribucion normal tipificada , la notacion para la distribucion
normal es N (µ, σ), para dicha tabla se considera N (0, 1), a los valores normalizados, es decir, obtenidos por esa
distribucion se les denomina puntajes Z
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 36/38
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 37/38
CUARTO MEDIO INSTITUTO NACIONAL
Veamos seis ejemplos de como utilizar esta tabla: k es un numero que representa una fraccion de σ
1. Caso 1 k > 0 p(Z ≤ k) ver el valor directamente de la tabla
2. Caso 2 k > 0 p(0 ≤ Z ≤ k) para este tipo de casos al valor de p(Z ≤ k), restar 0,5
3. Caso 3 k > 0 p(Z ≥ k) para este tipo de casos restar a 1 el valor de p(Z ≤ k)
4. Caso 4 k > 0 p(Z
≤ −k) para este caso es necesario considerar su simetrico p(Z
≥ k)
5. Caso 5 k1 > 0 ∧ k1 < k2 p(k1 ≤ Z ≤ k2) aquı hay que considerar p(Z ≤ k2) − p(Z ≤ k1)
6. Caso 6 k > 0 p(−k ≤ Z ≤ k) debido a la simetrıa esto quedara 2 p(Z ≤ k) − 1
7. Caso 7 k1 < 0 ∧ k2 > 0 p(k1 ≤ Z ≤ k2) razone usted como se puede desarrollar este caso.
8/17/2019 Estadistica instituto nacional PSU 2015
http://slidepdf.com/reader/full/estadistica-instituto-nacional-psu-2015 38/38
CUARTO MEDIO INSTITUTO NACIONAL
¿Como proceder cuando la verdad es que casi nunca ocurre N (0, 1)?
Al proceso lo llamremos tipificacion de una variable N (µ, σ) y el puntaje tipificado sera Z = X − µ
σ . Entonces
para cualquiera sea la distribucion normal N (µ, σ) vamos a tener:
p(X ≤ k) = p X − µ
σ ≤ k − µ
σ = p Z ≤ k − µ
σ
N (0, 1)
N (9, 3) ¿Que probabilidad hay
que un valor sea mayor que 9 y menor que 12 para N (9, 3)?
Haciendo Z = X − 9
3 observamos que Z = 1 se corresponde con X = 9 y haciendo la analogıa correspondiente,
tenemos que Z = 0 se corresponde con X = 9
Por lo tanto la probabilidad de que un valor este entre 9 y 12 en N (9, 3) es la misma que la probabilidad este entre
0 y 1 en N (0, 1).
Ejemplo: Del ejemplo en que se considera que la altura promedio del ciudadano chileno mayor de 18 a nos es
de 165 cm. y que se distribuye normalmente con una desviacion estandar de 8 cm. Entonces determine las siguientes
probabilidades
1. De que un ciudadano se encuentre entre los 145 y 157 centımetros de altura
2. De que un ciudadano se encuentre sobre los 178 centımetros de altura.
3. De que un ciudadano mida menos de 142 centımetros de altura.
4. Si los mayores de 18 anos son aproximadamente 12.000.000 ¿Cuantos son los ciudadanos que estan cumplien-do los puntos anteriores?
Problema: Consideremos los puntajes corregidos de la PSU ingreso 2015, entregados anteriormente, si vemos la
equivalencia de x = 500 y σ = 110, en la notacion normal N (500, 110) para el puntaje estandar Z , deberıamos
considerar N (23, 21), la que obviamente debe ser un mostruo horrible. y si se quiere usar para evaluar la reforma
educativa, obviamente esta esta reprobada.
Anteriormente el puntaje corregido se obtenıa de considerar el numero de respuestas correctas y cada cuatro incorrec-
tas se restaba una correcta, con esto deberıa ser N (12, 21) con un total de 70 preguntas y puntajes entre -18 y 75 Haga
usted un analisis de casos. Por ejemplo ¿cual es la probabilidad de que un estudiante responda mas de 35 preguntas
de modo correcto?
¿Cual es la probabilidad de que un estudiante obtenga mas de 700 puntos en la PSU de matematica?
¿Con que numero de respuestas correctas se esta dentro del 10 % de mejor rendimiento en la PSU de matematica?