Upload
cbpresentaciones
View
1.399
Download
4
Tags:
Embed Size (px)
Citation preview
El uso del sofware R en la probabilidad y estadísticaIntroduction to Probability Simulation and Gibbs Sampling with R (Eric
A. Suess Bruce E. Trumbo)
Gabriel Cervantes
Verano 2010
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 1 / 16
Qué es R?
R es un software abierto muy poderoso
Tiene muchas ventajas:
Es gratis
Es fácil
Es intuitivo
La investigación se mueve hacia R
Existen comunidades que comparten códigos en R
Bibliografía abundante en WEB
Se pueden cambiar parámetros con facilidad
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 2 / 16
Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dstripbooks&�eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dstripbooks&�eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dstripbooks&�eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dstripbooks&�eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
Sitios interesantes (La mejor información)
http://cran.r-project.org/
http://learnr.wordpress.com/2009/03/29/
http://www.r-bloggers.com/
http://search.twitter.com/search?q=%23rstats
http://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Dstripbooks&�eld-keywords=use+R+
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 3 / 16
¿Qué es la probabilidad?Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
El grado de certeza (¡?) que tenemos de que un evento ocurra.
La de�nición formal de probabilidad como una función
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
¿Qué es la probabilidad?Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
El grado de certeza (¡?) que tenemos de que un evento ocurra.
La de�nición formal de probabilidad como una función
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
¿Qué es la probabilidad?Se puede argumentar en este sentido
La frecuencia promedio con que ocurre un evento
El grado de certeza (¡?) que tenemos de que un evento ocurra.
La de�nición formal de probabilidad como una función
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 4 / 16
Nacimiento de la ProbabilidadRepetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Bernoulli y Doctrine of Chances (1718)
Thomas Simpson (1755)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
Nacimiento de la ProbabilidadRepetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Bernoulli y Doctrine of Chances (1718)
Thomas Simpson (1755)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
Nacimiento de la ProbabilidadRepetir un experimento para asignar una probabilidad
Pierre de Fermat y Blaise Pascal (1654).
Bernoulli y Doctrine of Chances (1718)
Thomas Simpson (1755)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 5 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
La forma en que empezaron a asignar probabilidades
Una muy buena ayuda para asignar probabilidades es repitiendo enexperimento
Existen muchos tipos de experimentos
Lanzar una moneda
Jugar a la lotería
Observar a la siguiente persona que entre a la biblioteca
Asociado a cada experimento podemos realizar una observación
Observar la quinta vez que obtengamos un "sol"
Dejar de jugar después que ganemos el premio mayor
Observar el número de horas que pasa estudiando
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 6 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
No siempre podremos concluir el experimentoAlgunas restricicones
( Mi abuelo nunca se sacó la lotería )
Nuestro experimentopuede ser muy largo
Puede ser en muchasdimensiones
Puede ser destructivo
Puede ser complicado deobservar
El uso de R permiteobservar lo que sucedería
Asignamos probabilidadessin necesidad de repetir elexperimento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 7 / 16
Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.
2 Un amigo piensa que puede obtener las cinco canicas blancas, si tomacinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos unacanica negra, si toma cinco al azar
4 ¿Quién piensas que tiene la razón?
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.2 Un amigo piensa que puede obtener las cinco canicas blancas, si tomacinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos unacanica negra, si toma cinco al azar
4 ¿Quién piensas que tiene la razón?
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.2 Un amigo piensa que puede obtener las cinco canicas blancas, si tomacinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos unacanica negra, si toma cinco al azar
4 ¿Quién piensas que tiene la razón?
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
Repetiremos un experimento que observó Pascal
1 Se tienen 100 canicas, de las cuales 90 son blancas y 10 son negras.2 Un amigo piensa que puede obtener las cinco canicas blancas, si tomacinco al azar
3 Otro amigo piensa que es más probable que obtenga al menos unacanica negra, si toma cinco al azar
4 ¿Quién piensas que tiene la razón?
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 8 / 16
El comando para obtener una muestra de 5 de 100 canicasLas canicas 91-100 son negras
sample(1:100, 5)Tenemos una muestra de100 objetos. Tomamos 5 al azarrepl=T repl=FEstos dos comandos sirven para tomar muestras con remplazo o sinremplazoPor default se toman sin remplazo
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 9 / 16
Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)
2 (pick <= 90)3 sum(pick <= 90)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)2 (pick <= 90)
3 sum(pick <= 90)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
Describe la función que tienen los siguiente comando en R
1 pick = c(17, 43, 36, 99, 84)2 (pick <= 90)3 sum(pick <= 90)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 10 / 16
Nos interesa calcularP(X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicasblancas
Esto nos dará una probabilidad del evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
Nos interesa calcularP(X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicasblancas
Esto nos dará una probabilidad del evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
Nos interesa calcularP(X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicasblancas
Esto nos dará una probabilidad del evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
Nos interesa calcularP(X = 5)
Usaremos 100, 000 muestras
Contaremos cuántas de esas muestras tienen todas las canicas blancas
Encontraremos la proporción de las muestras con todas las canicasblancas
Esto nos dará una probabilidad del evento
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 11 / 16
set.seed(1237)
numeric(m)good = numeric(m)m = 100000good = numeric(m)for (i in 1:m){pick = sample(1:100, 5) # vector of 5 items from ith boxgood[i] = sum(pick <= 90) # number Good in ith box}mean(good == 5)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 12 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes
�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�
Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
¿Cuántos estudiantes tiene tu clase?¿Crees que alguno de ustedes comparta cumpleaños?
n = 25 estudiantes�252
�Se requieren 367 personas para garantizar que suceda al menos unacoincidencia
Simplicando el problema
Sin años bisiestos
Cualquier periodo es igualemente probable de tener nacimientos
Tenemos una muestra aleatoria
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 13 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)
2 Se tienen 365!(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.5687
6 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:
7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
El espacio muestral
1 Se tienen 36525 puntos en el espacio muestral (Casos Totales)2 Se tienen 365!
(365�25)! casos favorables
3 Probabilidad que no exista ninguna coincidencia es:
4 Pr(NoCoincidencia) =24
∏i=0(1� i
365 ) = 0.4313
5 1� Pr(NoCoincidencia) = 1� 0.4313 = 0.56876 En R:7 prod((365:(365-24))/365)
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 14 / 16
¿Qué crees que sucederá si n aumenta?Dónde alcanza p=1?
¿n = 1:60p = numeric(60)for (i in n){q = prod(1 - (0:(i-1))/365) # P(No match) if i people in roomp[i] = 1 - q}plot(n, p) # plot of p against n
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 15 / 16
El comando Plotp vs n
0 10 20 30 40 50 60
0.0
0.2
0.4
0.6
0.8
1.0
n
p
Gabriel Cervantes () Departamento de Ciencias Básicas Verano 2010 16 / 16