41
1 Common mistakes in data visualization Amedee Van Gasse ArcelorMittal Gent 22 november 2010

Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

Embed Size (px)

DESCRIPTION

This is almost the same presentation as I gave in december 2009 at Barcamp Ghent. I was asked to give this presentation at the customer's site (ArcelorMittal Gent) so it is using the ArcelorMittal template. To be honest, it looks a lot better than my original template, which came from OpenOffice. Part 1 is for 90% the same presentation as my previous presentation. Some of the text has been translated to Dutch. Part 2 are examples from inside ArcelorMittal. For obvious reasons part 2 will not be publicly available on SlideShare.

Citation preview

Page 1: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

1

Common mistakes in data visualizationAmedee Van Gasse

ArcelorMittal Gent

22 november 2010

Page 2: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

2

$ whoami Day job: MS Office/VBA specialist

Desktop & Mail Security (Antivirus, Spam,...)

[email protected] - 5837

Geek stuff: BarCamp, Ubuntu, Android, Drupal

Tik vzw (http://tik.be)

[email protected]://amedee.behttp://be.linkedin.com/in/amedeehttp://www.slideshare.net/amedeevangasse

Page 3: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

3

De kracht van data visualisatie

Chinees gezegde: 1 Beeld Is 10.000 Woorden Waard

Het Fast-Food Informatietijdperk

Pr0n voor de statistiekenjunk Pointy-Haired Boss (Dilbert) Infograph of the day

(Twitter, Facebook,...)

Page 4: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

4

Interessant Functie Vorm

Integriteit

Page 5: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

5

With Great Power...

... Comes Great Responsibility

Wat is de verborgen agenda?

Vertrouw niet zomaar iedere grafiek

Lies, Damned Lies, and Statistics

Page 6: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

6

Let's just face it:

Page 7: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

7

Wie kent deze vriendelijke meneer?

Page 8: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

8

Het echte verhaal dat BP niet vertelde

Page 9: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

9

Waarom liegen we?

Grafieken, infographics: vereenvoudigde weergave van complexe realiteit(vergelijk met kaarten)

Om anderen te overtuigen Omdat het er mooi uitziet Omdat we niet beter weten

Page 10: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

10

De assen van het kwaad Y as start op 500. Waarom 500? Gradients Grijs op grijs Originele grafiek heeft animatie...

Page 11: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

11

Waarom?

December = 1/5 Januari= CRISIS!!!

Fear, Uncertainty & Doubt Medewerkers overtuigen

van bezuinigingen Of... blind vertrouwen in

Excel???

Page 12: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

12

Wat er in werkelijkheid gebeurde

08/200709/2007

10/200711/2007

12/200701/2008

02/200803/2008

04/200805/2008

06/200807/2008

08/200809/2008

10/200811/2008

12/200801/2009

02/200903/2009

04/200905/2009

06/200907/2009

08/200909/2009

10/200911/2009

12/2009

0

200

400

600

800

1000

1200

1400

2008 was tot Q3 een goed jaar Ja, er was een crisis, maar... We gingen naar 1/2, niet naar 1/5 Excel bug: laagste waarde op Y-as is ”magisch”...

Page 13: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

13

Once upon a time in a meeting

versus 2008: - 1,3 %versus OB : + 0,6 %

47.988

47.11547.385

2008 OB 2009

Geen schaal Waarom 40.000? Waarom niet 30.000 of 45.000? 3D voegt geen waarde toe

Page 14: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

14

Tweede poging

YTD 10/2009 (in K€)

0

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

45,000

50,000

2008

OB

2009

Schaal toegevoegd Start op 0 Geen 3D

versus 2008: - 1,3 %versus OB : + 0,6 %

Page 15: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

15

X-stralen noodzakelijk

Ik beken: ik heb deze grafiek gemaakt Wat als uitgevoerd > gepland? -> onzichtbaar! Betere grafiek: staaf (uitgevoerd) + lijn (gepland)

Page 16: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

16

Pie chart hell

Deze heb ik ook gemaakt! 3D Gradients Zelfde data als vorige grafiek

Page 17: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

17

In plaats van de 2 vorige grafieken

35/200737/2007

39/200741/2007

43/200745/2007

47/200749/2007

51/20071/2008

3/20085/2008

7/20089/2008

11/200813/2008

15/200817/2008

19/200821/2008

0

500

1000

1500

2000

2500

3000

3500

4000

Planning migratie Notes -> Exchange

niet gemigreerduitgevoerdal gemigreerdcumul gepland

week

aa

nta

l ma

ilbo

xen

ge

mig

ree

rd

Page 18: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

18

Donut: evil twin of the pie

Psychedelisch Moeilijk om reeksen te

vergelijken

Page 19: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

19

Leave the Donuts for the Cops,and Stick with the Bars

Page 20: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

20

Donut: By value – By area

Page 21: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

21

Donut vs Bar

Page 22: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

22

Can't get enough pie? Erger dan één taartgrafiek:

twéé taarten Weinig informatie Duidelijker met staafgrafiek

Page 23: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

23

”Pies are to scale”

Mooie kleurtjes 3D: zelfde diameter? Perspectief?

Page 24: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

24

The Mother of all Pie Charts

http://www.slideshare.net/netlash/old-media-vs-new-media

Waarom hebben Griekenland en Duitsland dezelfde grootte?

Rood = goed of slecht? Kreeg veel kritiek op

InformationIsBeautiful.net

Page 25: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

25

De originele grafiek

Saai Lelijk Eenvoudig te begrijpen

Page 26: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

26

Heb ik trouwens al verteld dat ik taartgrafieken haat?

Page 27: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

27

De enige goede taartgrafieken

Page 28: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

28

Nog meer vreemde grafieken?

Page 29: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

29

De favoriet van Spiderman!

Radargrafiek Moeilijk af te lezen Veel prutswerk aan Lelijk, zelfs met perfecte data

Page 30: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

30

3D: Manhattan chart

You can always go... downtown ♫

Page 31: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

31

3D: ongestapelde oppervlaktegrafiek

Hier wordt een Röntgenbril bijgeleverd

Wie kan S3 zien (geel)? Gebruik een 2D lijngrafiek!

Page 32: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

32

Enkele praktische tips

Kleuren Assen, legende & titel

Page 33: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

33

Kleuren

Geen gradiënt in achtergrond Achtergrond contrast met objecten Kleur: alleen indien nodig Verschillende kleur = verschillende soort

data Zachte kleuren + licht/donker voor

aandachtspunten

Page 34: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

34

Kleuren

Blijf bij één kleurtint Geen data: net zichtbaar genoeg Vermijd rood + groen (kleurenblindheid) Laat speciale effecten over aan

Hollywood!!!

Page 35: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

35

And the Oscar goes to...

Page 36: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

36

Assen, legende & titel

X as: Categorie of Waarde? Lijngrafiek of XY Spreidingsgrafiek? Beginnen op 0 of niet? Tweede Y as? Goede titel en labels = geen legende nodig Een grafiek die een legende nodig heeft, is een

slechte grafiek

Page 37: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

37

Verkeerd gebruik van assen

X as: tijd + plaats X en Y as niet linear (Slechte) grap van

http://graphjam.com

Page 38: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

38

Algemene tips

Wat is uw boodschap? Wie is uw publiek? Data voorbereiden Geen blind vertrouwen in software!

Page 39: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

39

Links

• http://peltiertech.com/WordPress/category/chart-busters

• http://chandoo.org/wp/category/visualization/

• http://graphjam.com/

• http://www.informationisbeautiful.net/

• http://www.edwardtufte.com/

• http://flowingdata.com/

• http://www.smashingmagazine.com/2009/09/11/25-useful-data-visualization-and-infographics-resources/

• http://www.smashingmagazine.com/2007/08/02/Data-visualization-modern-approaches/

• http://www.delicious.com/Amedee.VanGasse/charts

Page 40: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

40

Voorbeelden van bij ons

Nu is het aan jullie! Wat is er mis? Wat is er goed? Hoe zou je deze grafieken kunnen

verbeteren? Ook enkele tabellen

Page 41: Common mistakes in data visualization - 20101122 ArcelorMittal - part 1

41

Vragen?