Ciro Cattuto - Data Science: dati, modelli, decisioni - Digital for Business

Preview:

Citation preview

DATA SCIENCE:DATI, MODELLI, DECISIONI

Ciro CattutoISI Foundation, Torino

@ciro

Digital Festival, 7 maggio 2013BIG DATA – SCENARIO E TECNOLOGIA ABILITANTE

dealing with dataSciencespecial issue11 feb 2011

il quarto paradigma

“The new model is for the data to be captured by instruments or generated by simulations before being processed by software and for the resulting information or knowledge to be stored in computers. Scientists only get to look at their data fairly late in this pipeline. The techniques and technologies for such data-intensive science are so different that it is worth distinguishing data-intensive science from computational science as a new, fourth paradigm for scientific exploration.”

- Jim Gray, 2007

1. empirico2. teorico3. computazionale

nuovi paradigmi decisionali

“Data-intensive science, if done right, will mean more paradigm shifts of scientific theory, happening faster, because we can rapidly assess our worldview against the ‘objective reality’ we can so powerfully measure.”

- John Wilbanks (Creative Commons), 2007

reti socialiin vivo

sociopatterns.org

dottori

infermieri

ausiliari

pazienti

genitori

GLEaMviz - Global Epidemic and Mobility Model

gleamviz.org

INFLUENZANETsorveglianza Web pan-europea dell’influenza stagionale

influweb.it

INFLUENZANETsorveglianza Web pan-europea dell’influenza stagionale

influweb.it

✓ grande numero di componenti✓ interazioni fra componenti✓ strutture gerarchiche multi-scala✓ interazione fra scale diverse✓ auto-organizzazione (no blueprint)✓ proprietà emergenti✓ “complesso” è più che “complicato”

infrastructural + social

A. Koblin

P. Butler

✓ grande numero di componenti✓ interazioni fra componenti✓ strutture gerarchiche multi-scala✓ interazione fra scale diverse✓ auto-organizzazione (no blueprint)✓ proprietà emergenti✓ “complesso” è più che “complicato”

infrastructural + social

A. Koblin

P. Butler

★ la fine del pensiero lineare★ interdipendenza e rischio sistemico★ il problema dell’inferenza causale

tracce digitali di comportamenti umani

P. Butler

tracce digitali

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

disponibili come effetto collaterale di attività ordinariealto livello di copertura, accesso alle grandi scalepossibilità di elaborazione automatica

tracce digitali

prospettiva storicaorizzonte temporale limitatoriproducibilità limitatacontesto limitatoprivacy e protezione dati

disponibili come effetto collaterale di attività ordinariealto livello di copertura, accesso alle grandi scalepossibilità di elaborazione automatica

natura fondazionaledell’accesso alle tracce digitali di comportamenti umani

il nuovo ruolo dei dati

http://www.weforum.org/issues/rethinking-personal-data

il nuovo ruolo dei dati

http://www.weforum.org/issues/rethinking-personal-data

metodologiatracce digitali di comportamentocome evidenza di primo ordine

per decisioni globali

data-drivenmodeling

machine learningdata mining

natural language processing

scalable computational infrastructures ICT

data-driven decision & policy making

metodologiatracce digitali di comportamentocome evidenza di primo ordine

per decisioni globali

data-drivenmodeling

machine learningdata mining

natural language processing

scalable computational infrastructures ICT

data-driven decision & policy making

valore?

If we are going to really capitalize on big data,we need to get human insight at machine scale.

Recommended