22
Data2Stats: Lesson 6 Dissemination Anton Örn Karlsson June 4th 2019

Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

  • Upload
    others

  • View
    14

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Data2Stats: Lesson 6 Dissemination

Anton Örn Karlsson

June 4th 2019

Page 2: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Фаза распространения

• Выпуск статистической продукции для пользователей

• Сборочные и готовые продукты– Статика и динамика

• Диаграммы и графики

• Выпуски новостей

– Диапазон каналов• Пример Статистика Исландии (Statistics Iceland)

• Домашняя страница

• Twitter

• Facebook

Page 3: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Подпроцессы

• Обновление систем вывода - Обновление систем, в которых хранятся данные и метаданные

• Создание продуктов распространения

• Управление выпуском продуктов распространения

• Продвижение продуктов распространения

• Управление службой поддержки

Page 4: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Как можно использовать R?

• R можно эффективно использовать в создании продуктов распространения– Создание продуктов распространения– Печатные издания– Пресс-релизы– Интернет-сайты

• Различные виды продукции– Интерактивная графика– Таблицы– Карты– Наборы микроданных общего пользования– Связанные открытые данные– Загружаемые файлы

Page 5: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Простой процесс распространения

• Используйте выходной набор данных

• Создавайте простые веб-таблицы

• Пишите пресс-релиз

– С добавлением рисунка/фигуры

• Создавайте интерактивную диаграмму

• (Можно также создать файл общего пользования с использованием уже описанных методов SDC)

Page 6: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Данные

• Мы будем использовать данные, предоставленные с помощью R из общего социологического анкетирования

data("gss_cat")

str(gss_cat)

## Classes 'tbl_df', 'tbl' and 'data.frame': 21483 obs. of 9 variables:

## $ year : int 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 ...

## $ marital: Factor w/ 6 levels "No answer","Nevermarried",..: 2 4 5 2 4 6 2 4 6 6 ...

## $ age : int 26 48 67 39 25 25 36 44 44 47 ...

## $ race : Factor w/ 4 levels "Other","Black",..: 3 3 3 3 3 3 3 3 3 3 ...

## $ rincome: Factor w/ 16 levels "No answer","Don't know",..: 8 8 16 16 16 5 4 9 4 4 ...

## $ partyid: Factor w/ 10 levels "No answer","Don't know",..: 6 5 7 6 9 10 5 8 9 4 ...

## $ relig : Factor w/ 16 levels "No answer","Don't know",..: 15 15 15 6 12 15 5 15 15 15 ...

## $ denom : Factor w/ 30 levels "No answer","Don't know",..: 25 23 3 30 30 25 30 15 4 25 ...

## $ tvhours: int 12 NA 2 4 1 NA 3 NA 0 3 ...

Page 7: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Размещение данных в таблицах (1)

• Для начала мы используем Tidyverse, чтобы создать две таблицы

tbl1 <- gss_cat %>% filter(marital!="No answer")

%>%

count("Marital Status"=marital)

tbl2 <- gss_cat %>% filter(marital!="No answer")

%>%

group_by("Marital Status"=marital) %>%

summarise("Average hours watching

TV"=mean(tvhours, na.rm=T))

Page 8: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Размещение данных в таблицах (2)

• Таблицы могут быть легко записаны в таблицы Excel с помощью библиотеки xlsx

• Далее их можно редактировать с помощью Excel, а затем опубликовать в Интернете

library(xlsx)

write.xlsx(as.data.frame(tbl1), "tbl1.xlsx",

row.names=F)

write.xlsx(as.data.frame(tbl2), "tbl2.xlsx",

row.names=F)

Page 9: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

R markdown для публикации (1)

• Мы также можем использовать R и Rstudio для создания пресс-релизов, статистических бюллетеней или других публикаций

• Затем мы можем написать текст напрямую, позвонить по соответствующим номерам и вставить графики или таблицы по мере необходимости

• Мы будем работать с нашим примером и напишем краткий пресс-релиз для статистики в формате html– Он может быть легко опубликован в Интернете или

быть изменен на формат PDF или даже Word

Page 10: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Rmarkdown for publication(2)

Page 11: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

R markdown для публикации(3)

• Вы можете добавлять большие объемы кода в блоках

– Не видно для читателя, если не сделано обратное с помощью echo = TRUE

• Цифры в тексте указываются в тексте markdown

Page 12: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Rmarkdown for publication(4): The rmarkdown code

Page 13: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Rmarkdown for publication(5): The html version

Page 14: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Rmarkdown for publication(6): Adding a figure

Page 15: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Rmarkdown for publication(7): The html version with a figure

Page 16: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(1)

• Что такое shiny?

– “Shiny это пакет R, который облегчает создание интерактивных веб-приложений прямо из R. Вы можете размещать автономные приложения на веб-странице или встраивать их в документы R Markdown, создавать информационные панели. Вы также можете расширить свои приложения Shiny темами CSS, виджетами htmlи действиями в JavaScript.»

• https://shiny.rstudio.com/

• Проведем небольшую демонстрацию

Page 17: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(2)

Page 18: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(3)

• Есть возможность работы в двух форматах

– Пользовательский интерфейс

– Сервер

• Последняя версия позволяет работать в одном скрипте R

• Скрипт разделен на две части

Page 19: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(4)

Page 20: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(5)

Page 21: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Shiny(6)

• Наглядная демонстрация

• Запуск скрипта app.R

Page 22: Data2Stats: Lesson 6 Dissemination · графики или таблицы по мере необходимости •Мы будем работать с нашим примером

Ваше задание

• Используя те же данные, которые мы использовали для нашей демонстрации– gss_cat

• Посмотрите на переменные и найдите что-то интересное для себя– Напишите короткий пресс-релиз в формате html,

используя Rmarkdown• Напишите текст с вложенными числами

• Добавьте простую фигуру, используя ggplot

• Также было бы здорово добавить таблицу– Google knitr::kable