Researching Semantic Web-Overview

Preview:

DESCRIPTION

My talk about researching in semantic web technologies at UPC, Lima, Perú

Citation preview

Researching in Semantic

Web Technologies

1º Congreso Internacional de Ingeniería

de Sistemas y Computación

Lima, Perú

Dr. Jose María Álvarez Rodríguez

GRUPO WESO-Universidad de Oviedo

www.josemalvarez.es

http://www.slideshare.net/josem.alvarez

Alguien podría decir o buscar

rápidamente…

“Escritores peruanos nacidos en

Lima antes de 1900”

Si ya lo tenéis ahora…

“Lugares con su latitud y

longitud a menos de 200Km de

Lima”

Y otra…

“Listado de países con nombre

en inglés, chino, código ISO-3

con su latitud y longitud”

Dónde estamos?

Qué hacemos?

Punto de Partida

Tim Berners-Lee's original World Wide Web browser

Fuente: http://info.cern.ch/NextBrowser.html

“Semantic Web Road map”

(TBL, 1998)

…y en 2001…

RDF

Sujeto Objeto

Predicado

#me “Jose María”

foaf:name

• Modelo de datos común (grafo)

• Uso de URIs

• Serializable en distintos formatos

• Semántica definida

• ….la Web como una base de datos!

Para nosotros…

También para nosotros…

http://dbpedia.org/page/Lima_District

Y para las máquinas…

http://dbpedia.org/page/Lima_District

http://www.renault.co.uk/ownerservices/shop/item/renaulttoys/pedalcar/eco2pedalcar/default.aspx

Y para las máquinas…

The heart of Google's operation

La Web como una

gran base de datos

Web of Data

Ontologías y OWL The subject of ontology is the study of

the categories of things that exist or may

exist in some domain. (Sowa)

Fuente:

http://www.jfsowa.com/ontology/index.htm

Ramón Llul

• Representación del conocimiento

• Formalismo lógico

– DL, PL, FOL, etc.

– Razonamiento, Completitud, etc.

• Lenguaje W3C-OWL

– (1.0, 1.1 y 2.0)

– Sintaxis: RDF, etc.

• ….

Diagnóstico Psicológico

Más ingredientes?

Tim Berners-Lee 2001

Two Towers 2005

Consulta DBPedia Escritores

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?description ?person WHERE {

?person dbo:birthPlace :Lima.

?person <http://purl.org/dc/terms/subject> <http://dbpedia.org/resource/Category:Peruvian_writers> .

?person dbo:birthDate ?birth .

?person foaf:name ?name .

?person rdfs:comment ?description .

FILTER (?birth < "1900-01-01"^^xsd:date).

FILTER (LANG(?description) = 'en') .

}

ORDER BY ?name

http://dbpedia.org/snorql/

Consulta Webindex países

SELECT *

WHERE{

?country rdf:type wi-onto:Country.

?country rdfs:label ?label.

FILTER (lang(?label) = 'en').

?country skos:prefLabel ?countryLabel.

FILTER (lang(?countryLabel) = 'zh').

?country wi-onto:has-iso-alpha3-code ?id.

?country geo:lat ?lat.

?country geo:long ?long.

}

http://data.webfoundation.org/snorql

Evaluación

Artículos, libros,

etc.

Investigación

básica

Proyectos,

iniciativas, etc.

Investigación

aplicada

• Formalización lógica

• Razonadores

• Ontologías

• Vocabularios RDF

• Búsqueda Semántica

• Servicios web

• Interoperabilidad

• Integración

• Herramientas

• Dominios

• Turismo

• Medicina

• Legislación

• …

Base teórica

+

Base Tecnológica

+

Aplicaciones

http://www.w3.org/2001/sw/sweo/public/UseCases/CTIC/

…Por otra parte..

¿Dirección?

Web 2.0

+

Web

Semántica

Linked Data

Principios y Modelo 5*

http://lod-lam.slis.kent.edu/images/linked-data-image.jpg

1. Use URIs as names for Things

2. When someone looks up a URI,

provide useful information, using the

standards (RDF*, SPARQL)

1. Include links to other URIs.

2. Use HTTP URIs.

¿Estrellas?

Ventajas

1. Realización práctica de la Web Semántica.

2. Identicación única, uso de HTTP URIs.

3. Modelo y acceso estándar.

4. Enriquecimiento de recursos, creación de enlaces.

5. Estructuración, modelo estándar RDF.

6. Expresividad, vocabularios y datasets .

7. Reutilización de informacióny datos.

. . .

Publicación ¿Cómo promociono los datos al modelo 5*?

Consumo ¿Cómo exploto los datos?

Gestión ¿Cómo manejo los datos?

Datos e información masiva…

Para ser estructurada y utilizada…

Integración e interoperabilidad

http://www.w3.org/2011/gld/wiki/GLD_Life_cycle

Open Data

(Government)

RISP y los 8 principios

“Public Sector Information (PSI) in free open raw formats and ways that make it accessible to all and allow reuse”

Fuente: Josema Alonso

Data Must Be Complete.

. . . Primary.

. . . Timely.

. . . Accessible.

. . . Machine processable

Access Must Be Non-

Discriminatory

Data Formats Must Be

Non-Proprietary

Data Must Be License-free

Filosófica

Económica

Social

Linked Data

Open Data

e-Government

Government Linked Data

http://www.w3.org/2011/gld/wiki/Main_Page

Ventajas

• Transparencia

• Participación

• Colaboración

• Inclusión

• Reducción de costes

– Interoperabilidad

• Liderazgo

Ventajas

Linked Open Data

http://richard.cyganiak.de/2007/10/lod/

• 203 datasets ( 25 billones de tripletas RDF y 395 millones enlaces (Sept. 2010). • Dominios: Media, Geographic, Government (42,09 %), Publications, Cross-domain, Life sciences, etc. (Ago. 2011). • 393 datasets (Jun. 2012).

DBPedia

GEOLD

UK Gov

ACM PubMED

NATURE

DBLP

MOLDEAS

Y muchos más… (391)

SPARQL endpoints distribuidos para consulta…

Webindex

AEMET

http://labs.mondeca.com/sparqlEndpointsStatus/

“identify the data that one

controls, represent that data in a

way that people can use, and

expose the data to the wider

world.” Jeni Tennison

Estrategia

• Interna y externa

• Metodología

– Identificar

– Representar

– Exponer

– Consumir

• Participación

– Talleres y concursos

Reino Unido

Organizaciones

El Banco Mundial

Euroalert

España

Meteorología España

Turruta Ayto. de Zaragoza

Webindex

Biblioteca del Congreso de Chile

Búsqueda…

Publicación

Y ahora… ¿en qué investigamos?

Objetivo

Objetivos

Necesidades

Investigación

Conocimiento

Tecnología

Aplicación

Innovación

Datos Información

Conocimiento Aplicación

WS+LD

RDF y OWL2 Perfiles y expresividad

Vocabularios

Completitud, corrección, etc.

Reconciliación de entidades

Semántica en streaming

SPARQL 1.1 Consultas federadas

Descubrimiento endpoints

Expresiones y funciones

SPARUL

Reglas

Provenance &

Trust

Calidad

Semantic

Sensors

Multilinguismo

Razonamiento

distribuido

+ desafíos 1. Escalabilidad

2. Interfaz de Usuario

3. Cloud Computing y Semántica

4. Computational Linguistics

5. Computational Social Choice Theory

6. Open Data 1. Misión y Visión

2. Licencia, Seguridad, Integridad, Compatibilidad, etc.

3. Marco legal, Participación ciudadana, etc.

7. Linked Data 1. Algoritmos para crear enlaces

2. Reconciliación de entidades

3. Consultas distribuidas

4. Catalogación

5. Modelos de negocio

6. DataStore

7. Razonamiento, consistencia, etc.

. . .

Domótica Turismo Biomedicina

Bibliotecas

Digitales Cloud

Computing Legislación

Robótica Tráfico Emergencias

E-Health E-Procurement Retailing

eGov Catálogos Smart

Cities

Social

Media Estadística …

LOD2 project

Apache Drill

Apache Stanbol

Tecnología

relacionada

https://ec.europa.eu/digital-agenda/

Anja Jentzsch Jose Labra

Michael Hausenblas

Sören Auer

Christophe Gueret Richard Cyganiak

Frank van Harmelen

Chris Bizer

Óscar Corcho

Aidan Hogan

G. Tummarello

Juan Miguel Gomez

Irene Celino

Wikier

Axel Polleres

Peter Mika

http://ec.europa.eu/research/horizon2020/index_en.cfm

Jenni Tennison

¿Por dónde empiezo?

1. Leer, leer, leer… • Preguntar y participar

2. Buscar un problema… • Motivación intrínseca (prestigio, ego, etc.)

• Y extrínseca (aportación, salario, etc.)

3. Diseñar experimento y prototipos

4. Prueba, prueba, prueba…y mejora

5. Publicar

6. Volver al paso 1

http://tw.rpi.edu/launch/

Preguntar a los

expertos

• Tutoriales

• Participación en proyectos común

• Vocamp, Hackathon, Meet-up…

• After-hours hackathon

• Beer for Science – http://red.linkeddata.es/web/guest/events

– http://beerforscience.wordpress.com/

Colaboración…

DBPedia

Perú?

¿Qué podemos

hacer con los

datos del

gobierno?

Preguntas

Muchas gracias

por la Atención!

Sobre esta presentación…

• Agradecimientos

– José Emilio Labra

– Hernán Sagástegui

• Recursos gráficos

– Universidad de Oviedo, W3C, Proyectos FP, etc.

– Flickr.com (bajo licencia Creative Commons)

• Greeneydmantis, boston_public_library, Tjflex, arduinolabs,

redais, libertasacademica, friarsbalsam, jannem,

mr_t_in_dcIconfinder.com

• Licencia

– http://creativecommons.org/licenses/by-nc-sa/3.0/es/

Researching in Semantic

Web Technologies

1º Congreso Internacional de Ingeniería

de Sistemas y Computación

Lima, Perú

Dr. Jose María Álvarez Rodríguez

GRUPO WESO-Universidad de Oviedo

www.josemalvarez.es

#me

• Nombre: Jose María Álvarez Rodríguez

• Dirección: Departamento de Informática, Despacho 198, 3º Planta Facultad de Ciencias, C/Calvo Sotelo, S/N, 33007 Oviedo, Asturias

• Tlfno: 985 10 41 33 • E-mail: josem.alvarez@weso.es • WWW: www.josemalvarez.es

BIO

Proyectos

Intereses

Algo más sencillo…

“Personas nacidas en Lima

antes de 1900”

Consulta DBPedia Personas

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE {

?person dbo:birthPlace :Lima .

?person dbo:birthDate ?birth .

?person foaf:name ?name .

?person dbo:deathDate ?death .

FILTER (

?birth < "1900-01-01"^^xsd:date) .

}

http://dbpedia.org/snorql/

Consulta DBPedia lugares

PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>

PREFIX onto: <http://dbpedia.org/ontology/>

SELECT * WHERE {

?s a onto:Place .

?s geo:lat ?lat .

?s geo:long ?long .

FILTER(

xsd:double(?lat) - xsd:double(-12.05) <= 2 &&

xsd:double(-12.05) - xsd:double(?lat) <= 2 &&

xsd:double(?long) - xsd:double(-77.05) <= 2 &&

xsd:double(-77.05) - xsd:double(?long) <= 2).

}

LIMIT 100

http://dbpedia.org/snorql/

Unión Europea y otros

Recommended