20
Extracción y visualización de open data desde la nube utilizando R Project Deybi Morales León Usuarios R Nicaragua https://www.facebook.com/groups/usuariosrnicaragua/

R project nube (1)

Embed Size (px)

DESCRIPTION

Dado en la Fudcon, la conferencias usuarios y desarrolladores de Fedora. Nicaragua.

Citation preview

Page 1: R project nube (1)

Extracción y visualización de open data desde la nube utilizando R Project

Deybi Morales LeónUsuarios R Nicaraguahttps://www.facebook.com/groups/usuariosrnicaragua/

Page 2: R project nube (1)

¿Qué es R?Es un lenguaje y entorno de programación estadística

www.r-project.org www.rstudio.com

Page 3: R project nube (1)

PaquetesR contiene 5778 paquetes para trabajar todas las áreas de estadísticas y su utilización en la mayoría de las ciencias.--Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc)--Creación de informes con LaTeX y html.--Extracción de bases de datos desde las nubes.--Interacción con otros programas (Excel, matlab, python, eviews, etc)

Page 4: R project nube (1)

Filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control.

Disponibilidad por el internet

Datos económicos-Crecimientos del PIB-Deuda externa-Balanza comercial -etc.

Datos financieros-Tasas de interés-Precios de las acciones-Índices bursátiles, -etc.

Datos ambientales-Emisiones de CO2 -etc.

Datos Sociales-Tasa de natalidad-Tasa de mortalidad-Índices bursátiles, -etc.

Utilización de API para Facebook y Twitter

Page 5: R project nube (1)
Page 6: R project nube (1)

Paquetes disponibles para extracción de la nube

Page 7: R project nube (1)

fImport Rmetrics - Economic and Financial Data ImportrWBclimateA package for accessing World Bank climate dataWDIWorld Development Indicators (World Bank)ggmapA package for spatial visualization with Google Maps and OpenStreetMapgooglePublicDataAn R library to build Google's Public Data Explorer DSPL Metadata filesweatherDataGet Weather Data from the WebemdatrGlobal Disaster Losses from the EMDAT database Using RergmharrisLocal Health Department network data set

fImport Rmetrics - Economic and Financial Data Import

fueleconomy EPA fuel economy data

GCD Global Charcoal Database

geomapdata Data for topographic and Geologic Mapping

govStatJPN functions to get public survey data in Japan

gpk 100 Data Sets for Statistics Education

zipcode U.S. ZIP Code database for geocoding

vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy for analysis

Page 8: R project nube (1)

fExtremes Rmetrics - Extreme Financial Market Data

fImport Rmetrics - Economic and Financial Data Import

fueleconomy EPA fuel economy data

GCD Global Charcoal Database

geomapdata Data for topographic and Geologic Mapping

govStatJPN functions to get public survey data in Japan

gpk 100 Data Sets for Statistics Education

zipcode U.S. ZIP Code database for geocoding

ustyc Fetch US Treasury yield curve data

UScancer Create US cancer datasets from SEER, IARC, and US Census data

Page 9: R project nube (1)

Paquetes gráficos

Page 11: R project nube (1)

Ejemplos

Page 12: R project nube (1)

Abonados a internet por cada 100 personas

Primero instalar el paquete WDI, este es para el Banco Mundialinstall.packages(“WDI”)library(WDI)

Identificar el indicador buscado, con una palabra como en googleindicadores<-WDIsearch(“internet”)View(indicadores)

Page 13: R project nube (1)

usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012, end=2012)

Activar ggplot2library(ggplot2)

qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)

Page 14: R project nube (1)
Page 15: R project nube (1)

¿Dónde mis hijos tendrán mayores probabilidades de vida?

library(WDI)indicadores<-WDIsearch("life")View(indicadores)

library(maps)library(RColorBrewer)library("ggplot2")library("plyr")library("scales")library("rgeos")library("ggmap")library("mapproj")library("maptools")

Page 16: R project nube (1)

data(wrld_simpl)world_ggmap <- fortify(wrld_simpl, region = "ISO2")head(world_ggmap)

indicadores<-WDIsearch(“life”)View(indicadores)

Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012)

ggplot(Años.vida, aes(map_id = iso2c)) + geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") +expand_limits(x = world_ggmap$long, y = world_ggmap$lat) +xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) +scale_fill_gradient(low="white", high="blue",name="Años" ) +ggtitle("Esperanza de vida al nacer (Datos: 2012)")

Page 17: R project nube (1)
Page 18: R project nube (1)

install.packages("quantmod")library("quantmod")getSymbols("TWTR",src="yahoo") barChart(TWTR)View(TWTR)

Precios de acciones: El pajarito azul en problemas

Es necesario identificar el ticket de la acción, en este caso de ejemplo TWTR pertenece a Twitter.

Page 19: R project nube (1)
Page 20: R project nube (1)

Gracias