Upload
bianca-pereira
View
88
Download
0
Embed Size (px)
Citation preview
COMPREENSÃO DE LINGUAGEM
NATURAL NO INSIGHT
Construindo a Ponte entre Texto e Base
de Dados Semântica.
Bianca Pereira
Primeiro Encontro em Computação Semântica
Quem sou eu?
• Insight Centre for Data Analytics
• National University of Ireland,
Galway
• Aluna de PhD em “Entity Linking
with Multiple Knowledge Bases”
Quem é o grupo?
• Sobre o que as pessoas estão falando?
• Qual a opinião delas?
• Que tipo de emoção está sendo expressa?
I like apple and banana for breakfast.
Haha! I prefer my Apple and the
newspaper
Bases Semânticas
Adaptado de http://lod-cloud.net/versions/2014-08-30/lod-cloud.png
• Como representar o significado do texto emformato processável por máquina?
• Como fazer uso do conhecimento já disponívelon-line?
Corpus
• Detecção de Tópicos
• Mineração de Opinião
• Análise de Emoções
http://saffron.insight-centre.org
Detecção de Opinião
Desejo, sugestão, conselho, requisição, possibilidade,necessidade ou ação que ainda não ocorreu.
Fonte: http://nlp.insight-centre.org/wp-content/uploads/2014/05/PhDdaySapnaApril2014.pdf
Análise de Emoções
• Em breve..
Corpus
• Extração de Taxonomia
• Detecção de Conceitos Relacionados
http://saffron.insight-centre.org
http://enrg.insight-centre.org/
• Qual o conteúdo da Base de Conhecimento?
• Como lidar com múltiplos idiomas?
Sumarização
Base Descrição Top Entradas
DBpedia EnciclopédiaContém informações sobre ciência, tecnologia, matemática, história..
:history, :structure
outbreakdatabase Provê sumários de eventos de surtos deproblemas relacionados a comida e água
:outbreak, :illness
… … …
Adaptado de http://nlp.insight-centre.org/wp-content/uploads/2014/12/AndrejsPhD-Day-presentation-.pdf
Tradução de Máquina
EN
D
NL
ES
Tradução de Ontologia/Vocabulário
http://server1.nlp.insight-centre.org/tetra/
• Entity Linking
Corpus
Entity Linking
Mention Recognition
I just took a flight from Dublin.
Dublin
Disambiguation
Entity LinkingRanking
Dublin
2nd
https://www.crunchbase.com/location/dubl
in/97c70aa17568ca5375122f181f0484a73rd
http://data.linkedmdb.org/page/film_loca
tion/275
1st http://sws.geonames.org/2964574
Projetos
Mais em: http://nlp.insight-centre.org/projects/current_projects/
Desafios
• Heterogeneidade Semântica nas Bases deConhecimento.
• Múltiplos Idiomas.
• Idiomas com poucos recursos linguísticos.
• Geração e Uso de Recursos Linguísticos emFormato de Dados Ligados.
• Visualização de Informação.