24
PROCESSAMENTO DE LINGUAGEM em Ivo Nascimento PHP Wednesday, October 19, 11

Processamento de Linguagem natural com PHP

Embed Size (px)

DESCRIPTION

Esta palestra aborda o problema de processamento de linguagem natural em php, onde não temos a disposição nenhuma ferramenta para este tipo de trabalho e o lançamento do Texta - Text Analizer

Citation preview

Page 1: Processamento de Linguagem natural com PHP

PROCESSAMENTO DE LINGUAGEM

em

Ivo Nascimento

PHP

Wednesday, October 19, 11

Page 2: Processamento de Linguagem natural com PHP

Ivo Nascimento

Latest ProjectsPEAR

PEAR2Blue Seed

php5minutesianntech.com.br

http://o8o.com.br

[email protected]

Code Repositorygithub.com/iannsp

Wednesday, October 19, 11

Page 3: Processamento de Linguagem natural com PHP

Agenda

1. - Por que?2. - Como?2.1 - TF-IDF2.2 - NLP2.3 ?

Wednesday, October 19, 11

Page 4: Processamento de Linguagem natural com PHP

Por Que?

Wednesday, October 19, 11

Page 5: Processamento de Linguagem natural com PHP

TF-IDFTerm Frequency-Inverse Document Frequency

dado um corpus, analisa o conteúdo

calculando a importância relativa

de um termo.

Wednesday, October 19, 11

Page 6: Processamento de Linguagem natural com PHP

tf * idf

Wednesday, October 19, 11

Page 7: Processamento de Linguagem natural com PHP

Extração de informação

O desafio de um ser humano não eh deixar para tras a condição de estudante mas descobrir o que estudar.

Wednesday, October 19, 11

Page 8: Processamento de Linguagem natural com PHP

Tokenização

$terms =Array(‘O’, ‘desafio’, ‘de’, ‘um’, ‘ser’, ‘humano’, ‘não’, ‘eh’, ‘deixar’, ‘para’, ‘tras’, ‘a’, ‘condição’, ‘de’, ‘estudante’, ‘mas’, ‘descobrir’, ‘o’, ‘que’, ‘estudar’);

Wednesday, October 19, 11

Page 9: Processamento de Linguagem natural com PHP

Normalização

$terms =Array(‘o’, ‘desafio’, ‘de’, ‘um’, ‘ser’, ‘humano’, ‘não’, ‘é’, ‘deixar’, ‘para’, ‘tras’, ‘a’, ‘condição’, ‘de’, ‘estudante’, ‘mas’, ‘descobrir’, ‘o’, ‘que’, ‘estudar’);

Wednesday, October 19, 11

Page 10: Processamento de Linguagem natural com PHP

Stop-words

$terms =Array(‘o’, ‘desafio’, ‘de’, ‘um’, ‘ser’, ‘humano’, ‘não’, ‘é’, ‘deixar’, ‘para’, ‘tras’, ‘a’, ‘condição’, ‘de’, ‘estudante’, ‘mas’, ‘descobrir’, ‘o’, ‘que’, ‘estudar’);

Wednesday, October 19, 11

Page 11: Processamento de Linguagem natural com PHP

Aprendizado

$dictPositive = Array(‘desafio’=>0.2,‘ser’=>0.3,‘humano’ =>0.21,‘deixar’ =>0.21,‘condição’ =>0.33,‘estudante’ =>0.4,‘descobrir’ =>0.133,‘estudar’ =>0.33);

$dictNegative = Array(‘não’ =>0.45,‘tras’ =>0.21);

Wednesday, October 19, 11

Page 12: Processamento de Linguagem natural com PHP

Classi!cação

$terms =Array(‘desafio’, ‘ser’, ‘humano’, ‘não’, ‘deixar’, ‘tras’,‘condição’,‘estudante’, ‘descobrir’,‘estudar’);

Positiva#estudante#desafio

Wednesday, October 19, 11

Page 13: Processamento de Linguagem natural com PHP

n-gram(bigram,trigram,...)

$BIGRAM=Array((null,‘o’),(‘o’,‘desafio’),(‘desafio’,’de’),(‘de’,’um’),(‘um’,‘ser’),(‘ser’,‘humano’),(‘humano’ ,‘não’),(‘não,’’é’),(‘é’,‘deixar’),(‘deixar’,‘para’),(‘para’,‘tras’),(‘tras’,‘condicao’),(‘condicao’,’de’),(‘de’,‘estudante’),(‘estudante’,‘mas’),(‘mas’,‘descobrir’),(‘descobrir’,’o’),(‘o’,‘que’),(‘que’,‘estudar’),(‘estudar’,null));

O desafio de um ser humano não é deixar para tras a condição de estudante mas descobrir o que estudar.

Wednesday, October 19, 11

Page 14: Processamento de Linguagem natural com PHP

Análise

Distância Euclidiana

Coeficiente de Relção de PearsonCoeficiente de Jaccard

Coef. Dice

Qui-quadrado

Filtro Bayesiano

Wednesday, October 19, 11

Page 15: Processamento de Linguagem natural com PHP

Problemas da abordagem tf-idf

Termos

ordem não importa

Homógrafos

Wednesday, October 19, 11

Page 16: Processamento de Linguagem natural com PHP

NLP

dado um corpus, analisa o conteúdo

e busca compreensão do

todo.

Wednesday, October 19, 11

Page 17: Processamento de Linguagem natural com PHP

É uma área da inteligência arti!cial e da linguística que estuda os problemas da geração e compreensão automática

de linguas humanas naturais.(wikipedia)

Wednesday, October 19, 11

Page 18: Processamento de Linguagem natural com PHP

NLTK

Natural Language Tool Kit

http://www.nltk.org/

Wednesday, October 19, 11

Page 19: Processamento de Linguagem natural com PHP

O evento é bom.

O evento vai ser bom.

O evento foi bom.

O evento já foi bom.

O evento seria bom.

Wednesday, October 19, 11

Page 20: Processamento de Linguagem natural com PHP

NLP

O evento é bom.

S

O evento é bom

Wednesday, October 19, 11

Page 21: Processamento de Linguagem natural com PHP

The Biggest Question

Where are the NLP and M.P. tools for use in PHP?http://bit.ly/aCbfR0

Wednesday, October 19, 11

Page 22: Processamento de Linguagem natural com PHP

PIP (python in PHP)

A unica maneira de rodar a NLTKhttp://bit.ly/n69g0

Wednesday, October 19, 11

Page 23: Processamento de Linguagem natural com PHP

Texta - Text Analizer

O Iníciohttp://bit.ly/oZte8b

https://github.com/iannsp/texta

Wednesday, October 19, 11

Page 24: Processamento de Linguagem natural com PHP

Texta - Text Analizer

Wednesday, October 19, 11