32
Svein-Magnus Sørensen Twitter @SveinMagnus Software, 13. februar 2013 Åpne data i praksis

Åpne data i praksis (Software 2013)

Embed Size (px)

DESCRIPTION

Tross all publisiteten har få utviklere erfaring med bruk og publisering av åpne data. Foredraget gir deg praktisk innføring i teori og praksis du trenger for å bruke åpne data på egenhånd. Dette foredraget ble holdt først på Software konferansen den 13.februar 2013.

Citation preview

Page 1: Åpne data i praksis (Software 2013)

Svein-Magnus Sørensen

Twitter @SveinMagnus

Software, 13. februar 2013

Åpne data i praksis

Page 2: Åpne data i praksis (Software 2013)

2 13. februar 2013

CONTENTMATTERS

Page 3: Åpne data i praksis (Software 2013)

3 13. februar 2013

Page 4: Åpne data i praksis (Software 2013)

4 13. februar 2013

Page 5: Åpne data i praksis (Software 2013)

5 13. februar 2013

Page 6: Åpne data i praksis (Software 2013)

6 13. februar 2013

Page 7: Åpne data i praksis (Software 2013)

7 13. februar 2013

Page 8: Åpne data i praksis (Software 2013)

8

Retten til data

13. februar 2013

• Data som er utenfor opphavsrett• Data dekket av offentlighetsloven• Data som er åpent lisensiert

Some rights reserved by nickwheeleroz

Hva er egentlig åpne data?

Page 9: Åpne data i praksis (Software 2013)

Open Knowledge Definition

http://www.opendefinition.org/

Open data/content/information must:

1. Be Available and Accessible at Reproduction Cost “As a Whole”

2. Permit Free Redistribution

3. Permit Reuse Under Same Terms

4. Be Absent of Technological Restrictions

5. Be Attributed as Required

6. Keep Source Integrity

7. Not Discriminate Access From Persons or Groups

8. Not Discriminate Against Fields of Endeavor

9. Be Distributed with only the Original License

10. Must Not Be Licensed Specific to a Package

11. Must Not by License Restrict the Distribution of Other Works9 13. februar 2013 Graphic by ronin691 @ Flickr, CC BY-SA

Page 10: Åpne data i praksis (Software 2013)

10

Tre hovedtyper åpne lisenser

13. februar 2013 Some rights reserved by tinou bao

o Public Domain – sets no requirements on your usages.

o Attribution (“By”) – you must give credit to the originator.

o ShareAlike (“SA”) – if published, the adapted data must be made available in the same way and under the same license.

Page 11: Åpne data i praksis (Software 2013)

Åpne lisenser etter OKD-kriteriene

Public Domain – Kun etter utløpt opphavsrett

Lisenser for åpent innhold Creative Commons Attribution, Share-Alike, CCZero (Link)

GNU Free Documentation License (Link)

Open Government License for PSI (Link)

Norsk Lisens for Offentlige Data (Link)

Lisenser for åpne databaser Public Domain Dedication and License (Link)

Creative Commons CCZero (Link)

Open Data Commons Attribution License (Link)

Open Database License ODbL (Link)

Open Data - a goldmine11 Photo by suttonhoo @ Flickr, CC BY-NC-SA

Page 12: Åpne data i praksis (Software 2013)

Kilde: http://en.wikipedia.org/wiki/Open_format12

Åpne formater

Åpent format:

o Format basert på en underliggende åpen standard

o Standarden må være fullt dokumentert og offentlig tilgjengelig

o Standarden må ikke tillate proprietære utvidelser

o Det skal være kostnadsfritt å lese og bruke standarden

o Utvikling av standarden skal skje i en offentlig tilgjengelig arbeidsprosess gjennom en uavhengig organisasjon

Fritt format:

o Et åpent format fritt for restriksjoner knyttet til opphavsrett, lisenser, patenter, varemerker eller annen juss.

13. februar 2013

Page 13: Åpne data i praksis (Software 2013)

Kilder til åpne data

Datakataloger

Data.norge.no – http://data.norge.no/

Data.gov – http://www.data.gov/

CKAN – Comprehensive Knowledge Archive Networkhttp://www.ckan.net http://no.ckan.net/

Dataaggregatorer

Infochimps - http://www.infochimps.com/

Data Market - http://datamarket.com/

Google Public Data Explorer - http://www.google.com/publicdata/directory

Programmable Web - http://www.programmableweb.com/

The Linked Open Data Cloud

13 13. februar 2013

Page 14: Åpne data i praksis (Software 2013)

Hvilke data finnes- et utvalg fra data.norge.no

o Helsedata

Behandlingsdata (Ventedøgn, epikriseutsending, etc)

Kvalitetsdata (Infeksjoner, tilbakemelding fastlege, etc)

o Trafikkdata

Kollektivtrafikkdata

Flydata fra Avinor

Ruteplantjeneste for bil, Reisetider

Bomstasjoner i Norge

Trafikkmeldinger fra Vegvesenet

o Kulturdata

Norvegiana (kulturarvsinformasjon)

Digitale fortellinger

Museumsfotografier

o Natur & Miljø

Naturvernområder

Rødlistebasen for artsmangfold

Artskart og artsnavnebasen

Radioaktivitetsmåling

o Andre data

Frie læringsressurser ved videregående opplæring

Stortingets Datatjeneste

BIBSYS Bibliotekdatabase

Kraftpriser fra Konkurransetilsynet

Værdata fra Meterologisk institutt

Kartdata fra Statens kartverk og OpenStreetMap

Idrettsanleggregisteret

14 13. februar 2013

Page 15: Åpne data i praksis (Software 2013)

Bruke åpne data i applikasjon

Finn eksisterende åpne datasett eller prøv å få frigitt data med offentlighetsloven.

Gjør deg kjent med dataformatet og innholdet

Flate filer er vanlig, f.eks. CSV eller XML

Sjekk datakvaliteten, og formatstrukturen!

Håndtering av oppdateringer

Webservicer har fordeler og ulemper

Vurder behovet for flere datasett

Felles nøkkel finnes ikke alltid

Håndtering av datakonflikter kan være vanskelig

15 13. februar 2013

Page 16: Åpne data i praksis (Software 2013)

The 5-star model for open data by Tim Berners-Lee

16 13. februar 2013

Publisert

Strukturert

Åpent format

Adresserbar

Lenket RDF

Having an open license is a prerequisite for open data!

Page 17: Åpne data i praksis (Software 2013)

17

Linked Open Data Principles

“The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine

can explore the web of data.”

1. Use URIs as names for things

2. Use HTTP URIs so that people can look up those names.

3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)

4. Include links to other URIs. so that they can discover more things.

13. februar 2013

Page 18: Åpne data i praksis (Software 2013)

18

Resource Description Framework

“RDF is a standard model for data interchange on the Web as well as a general method to decompose any

type of knowledge into small pieces.”

o RDF is a data format, not meant to be displayed for human use!

o Always consists of triples: Subject, Predicate, Object

o Can be written in multiple formats: XML, N3/Turtle

o The meaning of RDF terms can be defined as an ontology using RDF Schema or the Web Ontology Language (OWL)

o For storage use an RDF database, also known as a Triple-store

o Triple-stores kan be queried using SPARQL

13. februar 2013

Page 19: Åpne data i praksis (Software 2013)

19

SPARQL Protocol and RDF Query Language

“SPARQL is the query language of the Semantic Web to be used for querying graph patterns across diverse data sources.”

Connecting to a SPARQL endpoint lets you:

o Pull values from structured and semi-structured data

o Explore data by querying unknown relationships

o Perform complex joins of disparate databases in a single, simple query

o Transform RDF data from one vocabulary to another

This is essentially SQL for RDF Triple-stores, but more powerful!

13. februar 2013

Page 20: Åpne data i praksis (Software 2013)

Linked Open Data Cloud

20 13. februar 2013

Page 21: Åpne data i praksis (Software 2013)

21

Over til publisering av egne data

13. februar 2013 Some rights reserved by The California National Guard

Page 22: Åpne data i praksis (Software 2013)

22

Åpning av egne data

Noen retningslinjer for å gjøre suksess:

o Hold det enkelt

Start der du kan, ikke forsøk å gjøre alt på en gang.Selv et enkelt eller bare deler av et større datasett kan gi verdi!

o Engasjer deg i bruk og gjenbruk

De fleste vil se dine data gjennom tredjepartstjenester.Snakk med utviklerne av disse om hva du kan gjøre bedre!

o Ta tak i spørsmål og misforståelser

Spesielt viktig i store organisasjoner hvor det kan være mye intern bekymring for risikoen med dette nye.

o Finn en lisens som passer organisasjonen

Norsk Lisens for Offentlige data er ofte egnet.

13. februar 2013

Page 23: Åpne data i praksis (Software 2013)

Tilgjengeliggjøring

Hvordan publisere egne data

o Legg ut filer eller tjenester på egne nettsider

o Benytt en eksisterende åpen datakatalog

CKAN – http://no.ckan.net

o Sett opp din egen datakatalog (om du har mye data)

o Benytt et offentlig datahotell

Datahotellet - http://data.norge.no/datahotellet

Computas Linked Data Server - http://data.computas.com/

23 13. februar 2013

Page 24: Åpne data i praksis (Software 2013)

Promotering i datakataloger

“Potensielle brukere må få vite at datasettet ditt eksisterer, samt hva det er for noe og hvordan de kan ta det i bruk.”

Nøkkelinformasjon du bør tilby:

Hvilke data er publisert?

Hvilken lisens gjelder?

Når og hvordan ble/blir dataene samlet inn?

Hvor ofte blir dataene oppdatert, om i det hele tatt?

Hva ble/blir dataene brukt til?

Hvem er kontaktperson?

Hvordan ønskes tilbakemeldinger?

24 13. februar 2013

Page 25: Åpne data i praksis (Software 2013)

25

PDDL Community Norms

13. februar 2013 Some rights reserved by stringer_bel

Give credit where credit is due

Avoid technical protection measures

Use open formats

Let others know!

Inspire users to share their work too!

Page 26: Åpne data i praksis (Software 2013)

26

Veien mot åpne data er altså tung…

13. februar 2013 Some rights reserved by DarrenHunter

… men det er hjelp å få!

Page 27: Åpne data i praksis (Software 2013)

27 13. februar 2013

Page 28: Åpne data i praksis (Software 2013)

28 13. februar 2013

Page 29: Åpne data i praksis (Software 2013)

29 13. februar 2013

Page 30: Åpne data i praksis (Software 2013)

30

Flere miljøer som kan være til hjelp

13. februar 2013

DnD – Faggruppe for Semantisk Web IKT Norge – Forum for Offentlige Data NUUG - Norwegian Unix Users Group Computas Linked Data Lab Friprogsenteret CKAN Norway Origo

Some rights reserved by Community Eye Health

Page 31: Åpne data i praksis (Software 2013)

31

Hva kan og bør du gjøre?

13. februar 2013

Ta i bruk eksisterende datasett på en verdiøkende måte

– Gode eksempler kan bli grunnlag for frigivning av mer data!

Bidra til kvalitetssikring av datasett du kjenner til

– Høyere datakvalitet kan gi flere bruksområder

Ta initiativ til å få frigitt interessante datasett fra din arbeidsgiver eller offentlig virksomhet du kjenner til

Publiser eventuelle datasett du selv har eierskap til

– Du vet aldri hvilke innovasjoner andre kan skape med dine data!

Tenk på datatilgjengelighet i løsninger du utarbeider!

Page 32: Åpne data i praksis (Software 2013)

32

Spørsmål?Photo by danesparza, CC BY-ND

Veien til åpen kunnskap

starter her!

13. februar 2013