Compreensão de Linguagem Natural no Insight: Construindo a Ponte entre Texto e Base de Dados...

Preview:

Citation preview

COMPREENSÃO DE LINGUAGEM

NATURAL NO INSIGHT

Construindo a Ponte entre Texto e Base

de Dados Semântica.

Bianca Pereira

Primeiro Encontro em Computação Semântica

Quem sou eu?

• Insight Centre for Data Analytics

• National University of Ireland,

Galway

• Aluna de PhD em “Entity Linking

with Multiple Knowledge Bases”

Quem é o grupo?

• Sobre o que as pessoas estão falando?

• Qual a opinião delas?

• Que tipo de emoção está sendo expressa?

I like apple and banana for breakfast.

Haha! I prefer my Apple and the

newspaper

Bases Semânticas

Adaptado de http://lod-cloud.net/versions/2014-08-30/lod-cloud.png

• Como representar o significado do texto emformato processável por máquina?

• Como fazer uso do conhecimento já disponívelon-line?

Corpus

• Detecção de Tópicos

• Mineração de Opinião

• Análise de Emoções

http://saffron.insight-centre.org

Detecção de Opinião

Desejo, sugestão, conselho, requisição, possibilidade,necessidade ou ação que ainda não ocorreu.

Fonte: http://nlp.insight-centre.org/wp-content/uploads/2014/05/PhDdaySapnaApril2014.pdf

Análise de Emoções

• Em breve..

Corpus

• Extração de Taxonomia

• Detecção de Conceitos Relacionados

http://saffron.insight-centre.org

http://enrg.insight-centre.org/

• Qual o conteúdo da Base de Conhecimento?

• Como lidar com múltiplos idiomas?

Sumarização

Base Descrição Top Entradas

DBpedia EnciclopédiaContém informações sobre ciência, tecnologia, matemática, história..

:history, :structure

outbreakdatabase Provê sumários de eventos de surtos deproblemas relacionados a comida e água

:outbreak, :illness

… … …

Adaptado de http://nlp.insight-centre.org/wp-content/uploads/2014/12/AndrejsPhD-Day-presentation-.pdf

Tradução de Máquina

EN

D

NL

ES

Tradução de Ontologia/Vocabulário

http://server1.nlp.insight-centre.org/tetra/

• Entity Linking

Corpus

Entity Linking

Mention Recognition

I just took a flight from Dublin.

Dublin

Disambiguation

Entity LinkingRanking

Dublin

2nd

https://www.crunchbase.com/location/dubl

in/97c70aa17568ca5375122f181f0484a73rd

http://data.linkedmdb.org/page/film_loca

tion/275

1st http://sws.geonames.org/2964574

Projetos

Mais em: http://nlp.insight-centre.org/projects/current_projects/

Desafios

• Heterogeneidade Semântica nas Bases deConhecimento.

• Múltiplos Idiomas.

• Idiomas com poucos recursos linguísticos.

• Geração e Uso de Recursos Linguísticos emFormato de Dados Ligados.

• Visualização de Informação.

OBRIGADA

Bianca Pereira

bianca.pereira@insight-centre.org