R project nube (1)

Preview:

DESCRIPTION

Dado en la Fudcon, la conferencias usuarios y desarrolladores de Fedora. Nicaragua.

Citation preview

Extracción y visualización de open data desde la nube utilizando R Project

Deybi Morales LeónUsuarios R Nicaraguahttps://www.facebook.com/groups/usuariosrnicaragua/

¿Qué es R?Es un lenguaje y entorno de programación estadística

www.r-project.org www.rstudio.com

PaquetesR contiene 5778 paquetes para trabajar todas las áreas de estadísticas y su utilización en la mayoría de las ciencias.--Alta calidad gráfica (3D, estáticos, dinámicos, mapas, etc)--Creación de informes con LaTeX y html.--Extracción de bases de datos desde las nubes.--Interacción con otros programas (Excel, matlab, python, eviews, etc)

Filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, de patentes o de otros mecanismos de control.

Disponibilidad por el internet

Datos económicos-Crecimientos del PIB-Deuda externa-Balanza comercial -etc.

Datos financieros-Tasas de interés-Precios de las acciones-Índices bursátiles, -etc.

Datos ambientales-Emisiones de CO2 -etc.

Datos Sociales-Tasa de natalidad-Tasa de mortalidad-Índices bursátiles, -etc.

Utilización de API para Facebook y Twitter

Paquetes disponibles para extracción de la nube

fImport Rmetrics - Economic and Financial Data ImportrWBclimateA package for accessing World Bank climate dataWDIWorld Development Indicators (World Bank)ggmapA package for spatial visualization with Google Maps and OpenStreetMapgooglePublicDataAn R library to build Google's Public Data Explorer DSPL Metadata filesweatherDataGet Weather Data from the WebemdatrGlobal Disaster Losses from the EMDAT database Using RergmharrisLocal Health Department network data set

fImport Rmetrics - Economic and Financial Data Import

fueleconomy EPA fuel economy data

GCD Global Charcoal Database

geomapdata Data for topographic and Geologic Mapping

govStatJPN functions to get public survey data in Japan

gpk 100 Data Sets for Statistics Education

zipcode U.S. ZIP Code database for geocoding

vegdata Functions to access vegetation databases (Turboveg) and prepare vegetation data especially its taxonomy for analysis

fExtremes Rmetrics - Extreme Financial Market Data

fImport Rmetrics - Economic and Financial Data Import

fueleconomy EPA fuel economy data

GCD Global Charcoal Database

geomapdata Data for topographic and Geologic Mapping

govStatJPN functions to get public survey data in Japan

gpk 100 Data Sets for Statistics Education

zipcode U.S. ZIP Code database for geocoding

ustyc Fetch US Treasury yield curve data

UScancer Create US cancer datasets from SEER, IARC, and US Census data

Paquetes gráficos

Ejemplos

Abonados a internet por cada 100 personas

Primero instalar el paquete WDI, este es para el Banco Mundialinstall.packages(“WDI”)library(WDI)

Identificar el indicador buscado, con una palabra como en googleindicadores<-WDIsearch(“internet”)View(indicadores)

usuarios.internet<-WDI(country="all", indicator=indicadores[10,1], start=2012, end=2012)

Activar ggplot2library(ggplot2)

qplot(data=usuarios.internet[100:258,], x=iso2c, y=IT.NET.USER.P2, main="2012 Usuarios de internet", xlab="", ylab="Usuarios por cada 100") + geom_text(aes(label=country), size=4, angle=45, hjust=1, vjust=1, color="black") + geom_point(aes(size=IT.NET.USER.P2), colour="blue", alpha=0.9)

¿Dónde mis hijos tendrán mayores probabilidades de vida?

library(WDI)indicadores<-WDIsearch("life")View(indicadores)

library(maps)library(RColorBrewer)library("ggplot2")library("plyr")library("scales")library("rgeos")library("ggmap")library("mapproj")library("maptools")

data(wrld_simpl)world_ggmap <- fortify(wrld_simpl, region = "ISO2")head(world_ggmap)

indicadores<-WDIsearch(“life”)View(indicadores)

Años.vida<-WDI(country="all", indicator=indicadores[4,1], start=2012, end=2012)

ggplot(Años.vida, aes(map_id = iso2c)) + geom_map(aes(fill=SP.DYN.LE00.IN), map = world_ggmap, color="black") +expand_limits(x = world_ggmap$long, y = world_ggmap$lat) +xlab(NULL) + ylab(NULL) + ylim(c(-60, 80)) +scale_fill_gradient(low="white", high="blue",name="Años" ) +ggtitle("Esperanza de vida al nacer (Datos: 2012)")

install.packages("quantmod")library("quantmod")getSymbols("TWTR",src="yahoo") barChart(TWTR)View(TWTR)

Precios de acciones: El pajarito azul en problemas

Es necesario identificar el ticket de la acción, en este caso de ejemplo TWTR pertenece a Twitter.

Gracias