91
Sporcarsi le mani Ovvero, perché devo passare ore ad impazzire sui dati prima di poterli visualizzare Michele Mauri DensityDesign Research Lab

Sporcarsi le mani

Embed Size (px)

DESCRIPTION

Ovvero, perché devo passare ore ad impazzire sui dati prima di poterli visualizzare

Citation preview

Page 1: Sporcarsi le mani

Sporcarsi le mani Ovvero, perché devo passare ore ad impazzire sui dati prima di poterli visualizzare

Michele Mauri DensityDesign Research Lab

Page 2: Sporcarsi le mani
Page 3: Sporcarsi le mani

Dati

Visualizzazione

Page 4: Sporcarsi le mani

Pochi dati o

dati semplici

Page 5: Sporcarsi le mani

Country CO2e emissions in megatonnes

Brazil 2854

Canada 810

China 7225

Germany 1005

India 1875

Indonesia 2038

Japan 1390

Russian Federation 2012

United Kingdom 684

United States of America 6933

Page 6: Sporcarsi le mani
Page 7: Sporcarsi le mani

molti dati o

dati complessi

Page 8: Sporcarsi le mani

(schermata excel twitter)

Page 9: Sporcarsi le mani

Dati

Visualizzazione

Esplorazione

conteggi, filtri,

aggregazione

conteggi, filtri,

aggregazione, conversione,

Page 10: Sporcarsi le mani

1987: La visualizzazione dell’informazione diventa scienza

Page 11: Sporcarsi le mani
Page 12: Sporcarsi le mani

Edward Tufte

Page 13: Sporcarsi le mani

Visualizzare dati significa offrire una

prospettiva privilegiata su un fenomeno

Page 14: Sporcarsi le mani
Page 15: Sporcarsi le mani

quali sono i passaggi per creare una

visualizzazione?

Page 16: Sporcarsi le mani

Misurazione Cosa misuro? Con quali strumenti? Con quale precisione?

Analisi Quali dati considero utili? Quali scarto considerandoli errori? Quali

aggrego considerandoli parti dello stesso elemento?

Visualizzazione Quali relazioni metto in evidenza? Quali sono le variabili principali?

Quali sono i vincoli fisici, di supporto, che devo rispettare?

Page 17: Sporcarsi le mani
Page 18: Sporcarsi le mani

There are three kind of lies.

1. Lies

2. Damn lies

3. Statistics

Page 19: Sporcarsi le mani
Page 20: Sporcarsi le mani
Page 21: Sporcarsi le mani
Page 22: Sporcarsi le mani
Page 23: Sporcarsi le mani
Page 24: Sporcarsi le mani
Page 25: Sporcarsi le mani

1.  I dati non sono oggettivi, ma possono essere utilizzati per sostenere la propria posizione

2.  Lo stesso può essere fatto con la visualizzazione

3.  La scelta della visualizzazione dipende da ciò che si vuole raccontare

Page 26: Sporcarsi le mani

Cosa possiamo fare: -convertire (rimappare)

- aggregare -espandere

-unire -classificare

-ordinare

Page 27: Sporcarsi le mani

Non sempre i dati sono nella forma più adatta alla

visualizzazione

Page 28: Sporcarsi le mani
Page 29: Sporcarsi le mani
Page 30: Sporcarsi le mani

“Ciò che è immediatamente presente alla conoscenza, prima di ogni forma

di elaborazione”

∼Vocabolario Treccani

Page 31: Sporcarsi le mani

“Il dato, come concetto astratto, può essere visto come il livello minimo di

astrazione da cui derivano informazione e conoscenza.”

en.wikipedia.org, 2/7/12

Page 32: Sporcarsi le mani

15

Page 33: Sporcarsi le mani

hello

Page 34: Sporcarsi le mani

[255,255,0]

Page 35: Sporcarsi le mani
Page 36: Sporcarsi le mani
Page 37: Sporcarsi le mani

La scala degli “elementi minimi” varia a seconda del fenomeno osservato

Page 38: Sporcarsi le mani

dato

quantitativo

qualitativo

Continuo (peso: 73,857…)

Discreto (numero iscritti: 6)

Nominale (provincia)

Ordinale (buono, mediocre,

pessimo)

Page 39: Sporcarsi le mani

Il dato ha valore se messo in relazione

Page 40: Sporcarsi le mani

confronto = informazione

Page 41: Sporcarsi le mani

Monte Everest 8848 m

Page 42: Sporcarsi le mani

Monte Everest 8848 m

Monte Bianco 4810 m

>

Page 43: Sporcarsi le mani

Le relazioni vengono codificate con le strutture dato

Page 44: Sporcarsi le mani

Dati strutturati vs.

dati non strutturati

Page 45: Sporcarsi le mani

Dati strutturati

Monte Stato Altezza Prima salita

Monte Bianco Italia 4810 1786

Everest Cina 8848 1953

Page 46: Sporcarsi le mani

Dati strutturati:

collezione di dati, tra loro coerenti, codificati in una struttura

che ne esplicita le relazioni

Page 47: Sporcarsi le mani

Dati non strutturati

“La montagna più alta della Cina è l'Everest, con 8848 metri di altezza. La prima ascensione è stata compiuta nel 1858 da Edmund Hillary. In Italia è il Monte Bianco, alto 4810 metri, salito per la prima volta nel 1786.”

Page 48: Sporcarsi le mani

Dati non strutturati:

Forme espressive (testi, immagini) che possono contenere dati, la cui

struttura è mutevole e non coerente.

Page 49: Sporcarsi le mani

Esempio 1. Visualizzare dati strutturati

Page 50: Sporcarsi le mani
Page 51: Sporcarsi le mani
Page 52: Sporcarsi le mani

11. Visualizzare dati non strutturati

Page 53: Sporcarsi le mani
Page 54: Sporcarsi le mani
Page 55: Sporcarsi le mani

111. Strutturare dati non strutturati

(e poi visualizzarli)

Page 56: Sporcarsi le mani
Page 57: Sporcarsi le mani
Page 58: Sporcarsi le mani

Strutture dati: le tabelle

Page 59: Sporcarsi le mani

Monte Stato Altezza Prima salita

Monte Bianco Italia 4810 1786

Everest Cina 8848 1953

Page 60: Sporcarsi le mani

Monte Stato Altezza Prima salita

Monte Bianco Italia 4810 1786

Everest Cina 8848 1953

Page 61: Sporcarsi le mani

Monte Stato Altezza Prima salita

Monte Bianco Italia 4810 1786

Everest Cina 8848 1953

Page 62: Sporcarsi le mani

Tipi di tabelle: matrici

Page 63: Sporcarsi le mani
Page 64: Sporcarsi le mani

lombardia piemonte

Italia dei valori 4162 913

Partito Democratico 45231 7177

Per il Terzo Polo (ApI-FLI) 7667 2702

Popolo della Libertà 55975 8668

Page 65: Sporcarsi le mani

Tipi di tabelle: dataset (liste)

Page 66: Sporcarsi le mani

Partito Regione Politici (comuni)

Italia dei valori lombardia 4162

Partito Democratico lombardia 45231

Per il Terzo Polo (ApI-FLI) lombardia 7667

Popolo della Libertà lombardia 55975

Italia dei valori piemonte 913

Partito Democratico piemonte 7177

Per il Terzo Polo (ApI-FLI) piemonte 2702

Popolo della Libertà piemonte 8668

Page 67: Sporcarsi le mani

Formati dati per tabelle

Page 68: Sporcarsi le mani

Plain Text .CSV (carachter separated values) .TSV (tabulation separated values) .DAT (generic data) Spreadsheet .XLS (Excel) .XLSX (Office Open XML) .numbers (Apple Numbers) .ODF (OpenOffice Spreadsheet)

Page 69: Sporcarsi le mani

Dove trovare dati in formato tabulare

Page 70: Sporcarsi le mani
Page 71: Sporcarsi le mani
Page 72: Sporcarsi le mani
Page 73: Sporcarsi le mani

Altre strutture dati

Page 74: Sporcarsi le mani

XML Extensible Markup Language

Page 75: Sporcarsi le mani
Page 76: Sporcarsi le mani

<tag>contenuto</tag>

Page 77: Sporcarsi le mani

JSON JavaScript Object Notation

Page 78: Sporcarsi le mani
Page 79: Sporcarsi le mani

Oggetti { }

Page 80: Sporcarsi le mani

Proprietà

nomeProprietà : valore

Page 81: Sporcarsi le mani

Liste [ elemento1, elemento2, …]

Page 82: Sporcarsi le mani

Ottenere dati XML/JSON: le API

Application programming interface

Page 83: Sporcarsi le mani
Page 84: Sporcarsi le mani
Page 85: Sporcarsi le mani
Page 86: Sporcarsi le mani

Dati non strutturati: il web

Page 87: Sporcarsi le mani
Page 88: Sporcarsi le mani
Page 89: Sporcarsi le mani
Page 90: Sporcarsi le mani
Page 91: Sporcarsi le mani