46
Going Horizontal Comparing Open Data Vocabularies Across Domains

Going Horizontal XTech 2006 - marcdegraauw.com Horizontal XTech 2006.pdf · Marc de Graauw - Going Horizontal - XTech 2006 - 4 Intension and extension • Intension (Sinn) is a concept

  • Upload
    ledien

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Going Horizontal

Comparing Open Data Vocabularies

Across Domains

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 2

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 3

Gottlob Frege (1848 – 1925)

• Frege investigated identity statements'The morning star is the evening star.’

• Are the two are equivalent, like a = b?• Then this is the same:

'The morning star is the morning star.’• But: the first statement conveys

knowledge, the second is tautological

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 4

Intension and extension

• Intension (Sinn) is a concept we have, some knowledge about a name

• Extension (Bedeutung) is the thing a name refers to

word → intension → extension• A word determines the intension• An intension determines the extension

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 5

Intension and extension 2

word → intension → extension‘evening star' → very bright star

at sunset → Venus

'The morning star is the evening star.’• Same extension, different intension

'The morning star is the morning star.’• Same extension, same intension

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 6

Ludwig Wittgenstein (1889 – 1951)

• What is the meaning of the word ‘game’?• Is it competition? skill? exercise?• There is no fixed meaning• A ‘family of characteristics’• ‘Meaning is use in language’• ‘Concept with hazy edges’• Wittgenstein: ‘Spiel’ = ‘game’ or ‘play’?

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 7

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 8

‘Meaning’ in the Chain

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 9

Meaning across Chains

• IT in Dutch government: Islands• Investigation

– comparison of methods– comparison of vocabularies– comparison of maintenance / versioning

• Compatibility– unify shared concepts?– avoid Big Brother?

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 10

‘Meaning’ in the Chains ?

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 11

The Chains

• ePV: Criminal Justice Chain– Police, DA, Court

• AORTA: Healthcare Chain– hospitals, apothecaries, GP’s ...

• SUWI: Social Security & (Un)Employment– CWI, UWV, SVB, GSD en BKWI

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 12

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 13

Methods – Criminal Justice

• Stolen sheets ... – Electronic Information Interchange in the

Criminal Justice System in the Netherlands, Pim van der Eijk, XML Europe 2004

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 14

Enumeration of (valid) grounds for suspicion

DescriptionGenerated text

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 15

ISO 11179 / UBL

Definition

Value set

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 16

Generated Element

Value from code list

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 17

Methods - Healthcare

• Stolen sheets ... copied from Tom de Jong• Methodology from HL7• Based on UML

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 18

StoryboardsStoryboardsStoryboards

Spec

Storyboard

Information ModelInformation ModelInformation Model

State Diagram

Class Diagram

Message DesignMessage DesignMessage Design

2-nd Order1 choice of

0-n Drug0-1 Nursing

Interaction Model

Interaction Interaction ModelModel

Interaction Diagram

HL7 Development Framework (HDF)

Write storyboards

Determine scope

Determineparties and processes Restrict domains

Determinestate transitions

Determineclasses, attributes& associations

Determineapplication roles

Determineinteractions

Determineconformance claims

Develop R-MIM

Specificy HMDs

Determinetrigger events

TYPE MPSLOC CONTAINS {id[id].TYPE IIDnm[name].TYPE STad[addr].TYPE XADph[phon].TYPE XTN email_address[emlAdr].TYPE XTN}

TYPE MPSLOC TYPE MPSLOC CONTAINS {CONTAINS {id[id].TYPEid[id].TYPE IIDIIDnm[name].TYPEnm[name].TYPE STSTad[addr].TYPEad[addr].TYPE XADXADph[phon].TYPEph[phon].TYPE XTN XTN email_addressemail_address[[emlAdr].TYPEemlAdr].TYPE XTNXTN}}

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 19

RIM (Reference Information Model)

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 20

0..*

1 0..*

1

RIM (Reference Information Model)Backbone

EntityEntity ParticipationParticipation ActAct

ActActRelationshipRelationship

1 1

0..* 0..*

ReferralTransportationSupplyProcedureCondition NodeConsentObservationMedicationAct complexFinancial act

OrganizationLiving SubjectMaterialPlaceHealth Chart

PatientGuarantorHealthcare

providerInsurerPractitioner

RoleRole1

0..*

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 21

Refinement through ‘Constraints’

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 22

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 23

Methods – Social Security

• First release published 1-1-2002, part of ‘SUWI Law’

• Based on Entity Relationship Diagrams– Entities, Attributes, Relationships– ERD for each major entity (person, address...)

• Derived from this the ‘Suwi Data Registry’• TP’s make messages from Data Registry

– they may change entities and attributes

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 24

Methods – Social Security

• Dedicated set of ERD → XML Transformation Rules

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 25

• Types: AN..6, N16 etc.• Transformation to XML Schema Datatypes

• Versioning: major, minor• Versioning reflected in namespaces

– xmlns:sml = "http://www.suwi.nl/SuwiML/Basis-v0200"

Methods – Social Security

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 26

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 27

Person Criminal Justice

Natuurlijk persoon is een samengesteld gegeven en opgebouwd uit:Datum eerste en laatste verhoor: ...Militair op pleegdatumBeginnend bestuurderVerdachte heeft bekendTaalbeheersingEerder pv terzake van art. 8 WvWDatum eerste verhoorDatum laatste verhoorAntecedenten politieFunctieaanduidingTekenbevoegd

Commentaar:

n.v.t.Toegestane waarden:

SamengesteldLayout:

n.v.t.Formaat:

Analyse- en Ontwerpteam ePVHerkomst definitie:

Een menselijk individu.Definitie:

Natuurlijk persoon

Samengesteld gegeven:

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 28

Person Criminal Justice

Geboortegegevens is een samengesteld gegeven en opgebouwd uit:GeboortedatumGeboortejaarGeboortegemeente (Nederland)Geboortegemeente, in lettersGeboorteplaatsnaam GeboortecoördinatenNadere aanduiding geboorteplaatsGeboortelandGeslacht

Commentaar:

n.v.t.Toegestane waarden:

SamengesteldLayout:

n.v.t.Formaat:

NEN 1888:2002 Herkomst definitie:

Gegevens die betrekking hebben op de geboorte van een persoon.Definitie:

GeboortegegevensSamengesteld gegeven:

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 29

Person Criminal Justice

Identificatie is een samengesteld gegeven en opgebouwd uit:Soort identificatiemiddelAnder identificatiemiddelNummer identificatiemiddelRijbewijs getoond door verdachteOvereenkomst met rijbewijsgegevens

Commentaar:

n.v.t.Toegestane waarden:

SamengesteldLayout:

n.v.t.Formaat:

Analyse- en Ontwerpteam ePVHerkomst definitie:

Het vaststellen van de identiteit van een persoon.Definitie:

Identificatie

Samengesteld gegeven:

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 30

Person Healthcare

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 31

Person HealthcareDe klasse Person heeft de volgende attributen:

OpleidingsniveaueducationLevelCode

Burgerlijke staat maritalStatusCode

Meerlingvolgnummer multipleBirthOrderNumber

Meerlingindicatie multipleBirthInd

Overlijdensdatum (en evt. –tijd)deceasedTime

OverlijdensindicatiedeceasedInd

Geboortedatum (en evt. –tijd)birthTime

GeslachtadministrativeGenderCode

Naamname

Persoonsnummerid

INSTANCEEen specifiek persoon (individu)

determinerCode

PSN (Person)Een persoon (mens)classCode

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 32

Person Healthcare

De klasse Person heeft de volgende associaties:

Zorgverzekering(en)CoveredParty0..*

GeboorteplaatsBirthplace0..1

Relatie met de huisartsPatientOfOtherProvider0..1

Contactpers(o)n(en)ContactParty0..*

BeroepEmployment0..1

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 33

Person Social Security

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 34

Persoon Social Security

Entiteit Persoon

PersoonSuwiML-tagPersoonNaam

DefinitieEen individueel menselijk wezen.Norminstantie: NEN 1888:2002 - PersoonOpmerkingen- Super-entiteitype voor de persoon-entiteiten (zoals CLIENT, Kind en Partner).- Voor een PERSOON zijn drie typen adres gedefinieerd:1. Domicilie adres: het adres van de persoon, zoals geregistreerd in de Gemeentelijke BasisAdministratie (GBA);2. Feitelijk adres: het adres waarop de PERSOON daadwerkelijk verblijft;3. Correspondentie adres: het adres waarop de PERSOON zijn post wenst te ontvangen.

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 35

Persoon Social SecurityAttributen

CdVerificatieGbaCode verificatie GBA

CdVerificatieSofinrCode verificatie sofinummer

CdFictieveGeboortedatCode fictieve geboortedatum

GeboortedatGeboortedatum

GeslachtGeslacht

SignificantDeelAchternaamEchtgSignificant deel van de achternaam echtgeno(o)t(e)/geregistreerd partner

VoorvoegselEchtgenootVoorvoegsel echtgeno(o)t(e)/geregistreerd partner

AanduidingNaamgebruikAanduiding naamgebruik

SignificantDeelVanDeAchternaamSignificant deel van de achternaam

VoorvoegselVoorvoegsel

VoorlettersVoorletters

VoornamenVoornamen

SofiNrSofi-nummer

SuwiML-tagNaam

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 36

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 37

Tags by domain

xxxxxHealthcare

xxxxxCriminal Justice

xxxxxxxxxxxxSocial Security

care

housing

vehicle

benefit

suwi-other

organisation

person

partnership

education

money

contact

employm

ent

address

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 38

Criminal Justice distribution

contact 1%organisation 2%

vehicle 3%

address 8%

person 9%

epv-other 77%

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 39

Healthcare distribution

address; 9%

aorta-other; 80%

employment; 1%contact; 2%

person; 5%

organisation; 2%

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 40

Social Security distribution

address

contact

partnership

person

organisationvehicle

housing

suwi-other

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 41

Domain comparison

• domain-specific concepts: 75%• cross-domain concepts: 25%• cross-domain concepts are mainly:

– person– address– contact– organisation– (finance)

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 42

Orientation vocabularies

NEN

SGR

Netherlands

HL7 XBRL

International

NTP

Healthcare

Criminal Justice

Social Security

ISO

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 43

Issuessyntax

• syntactical issues– serialization to XML, other

• datatypes– Healthcare: own datatypes, translated to XSD– Social Security: AN..12 / N2 / D etc.,

translated to XSD– Criminal Justice: UBL and XML Schema

datatypes

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 44

Agenda

• Issues• Chains• Methods• Vocabularies• Comparison• Future

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 45

The next steps

• Put vocabularies online in browseable database (using Rails or Django of course)

• Align with ‘Core Repositories’(basisregistraties)

• PR• Get funding!• Sharing vocabularies & methods• Promote microformats for shared entities

Marc de Graauw - Going Horizontal - XTech 2006 - www.marcdegraauw.com 46

Marc de Graauw

• www.marcdegraauw.com• [email protected]• feedback welcome