Upload
svein-magnus-sorensen
View
732
Download
1
Embed Size (px)
DESCRIPTION
Tross all publisiteten har få utviklere erfaring med bruk og publisering av åpne data. Foredraget gir deg praktisk innføring i teori og praksis du trenger for å bruke åpne data på egenhånd. Dette foredraget ble holdt først på Software konferansen den 13.februar 2013.
Citation preview
Svein-Magnus Sørensen
Twitter @SveinMagnus
Software, 13. februar 2013
Åpne data i praksis
2 13. februar 2013
CONTENTMATTERS
3 13. februar 2013
4 13. februar 2013
5 13. februar 2013
6 13. februar 2013
7 13. februar 2013
8
Retten til data
13. februar 2013
• Data som er utenfor opphavsrett• Data dekket av offentlighetsloven• Data som er åpent lisensiert
Some rights reserved by nickwheeleroz
Hva er egentlig åpne data?
Open Knowledge Definition
http://www.opendefinition.org/
Open data/content/information must:
1. Be Available and Accessible at Reproduction Cost “As a Whole”
2. Permit Free Redistribution
3. Permit Reuse Under Same Terms
4. Be Absent of Technological Restrictions
5. Be Attributed as Required
6. Keep Source Integrity
7. Not Discriminate Access From Persons or Groups
8. Not Discriminate Against Fields of Endeavor
9. Be Distributed with only the Original License
10. Must Not Be Licensed Specific to a Package
11. Must Not by License Restrict the Distribution of Other Works9 13. februar 2013 Graphic by ronin691 @ Flickr, CC BY-SA
10
Tre hovedtyper åpne lisenser
13. februar 2013 Some rights reserved by tinou bao
o Public Domain – sets no requirements on your usages.
o Attribution (“By”) – you must give credit to the originator.
o ShareAlike (“SA”) – if published, the adapted data must be made available in the same way and under the same license.
Åpne lisenser etter OKD-kriteriene
Public Domain – Kun etter utløpt opphavsrett
Lisenser for åpent innhold Creative Commons Attribution, Share-Alike, CCZero (Link)
GNU Free Documentation License (Link)
Open Government License for PSI (Link)
Norsk Lisens for Offentlige Data (Link)
Lisenser for åpne databaser Public Domain Dedication and License (Link)
Creative Commons CCZero (Link)
Open Data Commons Attribution License (Link)
Open Database License ODbL (Link)
Open Data - a goldmine11 Photo by suttonhoo @ Flickr, CC BY-NC-SA
Kilde: http://en.wikipedia.org/wiki/Open_format12
Åpne formater
Åpent format:
o Format basert på en underliggende åpen standard
o Standarden må være fullt dokumentert og offentlig tilgjengelig
o Standarden må ikke tillate proprietære utvidelser
o Det skal være kostnadsfritt å lese og bruke standarden
o Utvikling av standarden skal skje i en offentlig tilgjengelig arbeidsprosess gjennom en uavhengig organisasjon
Fritt format:
o Et åpent format fritt for restriksjoner knyttet til opphavsrett, lisenser, patenter, varemerker eller annen juss.
13. februar 2013
Kilder til åpne data
Datakataloger
Data.norge.no – http://data.norge.no/
Data.gov – http://www.data.gov/
CKAN – Comprehensive Knowledge Archive Networkhttp://www.ckan.net http://no.ckan.net/
Dataaggregatorer
Infochimps - http://www.infochimps.com/
Data Market - http://datamarket.com/
Google Public Data Explorer - http://www.google.com/publicdata/directory
Programmable Web - http://www.programmableweb.com/
The Linked Open Data Cloud
13 13. februar 2013
Hvilke data finnes- et utvalg fra data.norge.no
o Helsedata
Behandlingsdata (Ventedøgn, epikriseutsending, etc)
Kvalitetsdata (Infeksjoner, tilbakemelding fastlege, etc)
o Trafikkdata
Kollektivtrafikkdata
Flydata fra Avinor
Ruteplantjeneste for bil, Reisetider
Bomstasjoner i Norge
Trafikkmeldinger fra Vegvesenet
o Kulturdata
Norvegiana (kulturarvsinformasjon)
Digitale fortellinger
Museumsfotografier
o Natur & Miljø
Naturvernområder
Rødlistebasen for artsmangfold
Artskart og artsnavnebasen
Radioaktivitetsmåling
o Andre data
Frie læringsressurser ved videregående opplæring
Stortingets Datatjeneste
BIBSYS Bibliotekdatabase
Kraftpriser fra Konkurransetilsynet
Værdata fra Meterologisk institutt
Kartdata fra Statens kartverk og OpenStreetMap
Idrettsanleggregisteret
14 13. februar 2013
Bruke åpne data i applikasjon
Finn eksisterende åpne datasett eller prøv å få frigitt data med offentlighetsloven.
Gjør deg kjent med dataformatet og innholdet
Flate filer er vanlig, f.eks. CSV eller XML
Sjekk datakvaliteten, og formatstrukturen!
Håndtering av oppdateringer
Webservicer har fordeler og ulemper
Vurder behovet for flere datasett
Felles nøkkel finnes ikke alltid
Håndtering av datakonflikter kan være vanskelig
15 13. februar 2013
The 5-star model for open data by Tim Berners-Lee
16 13. februar 2013
Publisert
Strukturert
Åpent format
Adresserbar
Lenket RDF
Having an open license is a prerequisite for open data!
17
Linked Open Data Principles
“The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine
can explore the web of data.”
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those names.
3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)
4. Include links to other URIs. so that they can discover more things.
13. februar 2013
18
Resource Description Framework
“RDF is a standard model for data interchange on the Web as well as a general method to decompose any
type of knowledge into small pieces.”
o RDF is a data format, not meant to be displayed for human use!
o Always consists of triples: Subject, Predicate, Object
o Can be written in multiple formats: XML, N3/Turtle
o The meaning of RDF terms can be defined as an ontology using RDF Schema or the Web Ontology Language (OWL)
o For storage use an RDF database, also known as a Triple-store
o Triple-stores kan be queried using SPARQL
13. februar 2013
19
SPARQL Protocol and RDF Query Language
“SPARQL is the query language of the Semantic Web to be used for querying graph patterns across diverse data sources.”
Connecting to a SPARQL endpoint lets you:
o Pull values from structured and semi-structured data
o Explore data by querying unknown relationships
o Perform complex joins of disparate databases in a single, simple query
o Transform RDF data from one vocabulary to another
This is essentially SQL for RDF Triple-stores, but more powerful!
13. februar 2013
Linked Open Data Cloud
20 13. februar 2013
21
Over til publisering av egne data
13. februar 2013 Some rights reserved by The California National Guard
22
Åpning av egne data
Noen retningslinjer for å gjøre suksess:
o Hold det enkelt
Start der du kan, ikke forsøk å gjøre alt på en gang.Selv et enkelt eller bare deler av et større datasett kan gi verdi!
o Engasjer deg i bruk og gjenbruk
De fleste vil se dine data gjennom tredjepartstjenester.Snakk med utviklerne av disse om hva du kan gjøre bedre!
o Ta tak i spørsmål og misforståelser
Spesielt viktig i store organisasjoner hvor det kan være mye intern bekymring for risikoen med dette nye.
o Finn en lisens som passer organisasjonen
Norsk Lisens for Offentlige data er ofte egnet.
13. februar 2013
Tilgjengeliggjøring
Hvordan publisere egne data
o Legg ut filer eller tjenester på egne nettsider
o Benytt en eksisterende åpen datakatalog
CKAN – http://no.ckan.net
o Sett opp din egen datakatalog (om du har mye data)
o Benytt et offentlig datahotell
Datahotellet - http://data.norge.no/datahotellet
Computas Linked Data Server - http://data.computas.com/
23 13. februar 2013
Promotering i datakataloger
“Potensielle brukere må få vite at datasettet ditt eksisterer, samt hva det er for noe og hvordan de kan ta det i bruk.”
Nøkkelinformasjon du bør tilby:
Hvilke data er publisert?
Hvilken lisens gjelder?
Når og hvordan ble/blir dataene samlet inn?
Hvor ofte blir dataene oppdatert, om i det hele tatt?
Hva ble/blir dataene brukt til?
Hvem er kontaktperson?
Hvordan ønskes tilbakemeldinger?
24 13. februar 2013
25
PDDL Community Norms
13. februar 2013 Some rights reserved by stringer_bel
Give credit where credit is due
Avoid technical protection measures
Use open formats
Let others know!
Inspire users to share their work too!
26
Veien mot åpne data er altså tung…
13. februar 2013 Some rights reserved by DarrenHunter
… men det er hjelp å få!
27 13. februar 2013
28 13. februar 2013
29 13. februar 2013
30
Flere miljøer som kan være til hjelp
13. februar 2013
DnD – Faggruppe for Semantisk Web IKT Norge – Forum for Offentlige Data NUUG - Norwegian Unix Users Group Computas Linked Data Lab Friprogsenteret CKAN Norway Origo
Some rights reserved by Community Eye Health
31
Hva kan og bør du gjøre?
13. februar 2013
Ta i bruk eksisterende datasett på en verdiøkende måte
– Gode eksempler kan bli grunnlag for frigivning av mer data!
Bidra til kvalitetssikring av datasett du kjenner til
– Høyere datakvalitet kan gi flere bruksområder
Ta initiativ til å få frigitt interessante datasett fra din arbeidsgiver eller offentlig virksomhet du kjenner til
Publiser eventuelle datasett du selv har eierskap til
– Du vet aldri hvilke innovasjoner andre kan skape med dine data!
Tenk på datatilgjengelighet i løsninger du utarbeider!
32
Spørsmål?Photo by danesparza, CC BY-ND
Veien til åpen kunnskap
starter her!
13. februar 2013