23
Workshop sobre taggers do português Instituto de Linguística Teórica e Computacional Lisboa 1997 Analisador Morfossintáctico do ILTEC* Caroline Hagège António Meireles Brígida Trindade Carla Diogo Fernando Leite [email protected] (ILTEC) Resumo No presente artigo descreve-se o modo como foi implementado o Analisador Morfossintáctico do ILTEC. Esta ferramenta foi desenvolvida de raiz pelo instituto, não partindo de qualquer ferramenta existente, quer no que diz respeito à componente informática, quer no que diz respeito à componente linguística. O Analisador Morfossintáctico do ILTEC é dirigido por regras, recorrendo assim a uma base de dados composta por informação lexical. A componente informática foi desenvolvida com o objectivo de funcionar de um modo totalmente independente dos dados linguísticos, não obrigando a qualquer tipo de alteração com a modificação da informação linguística. A fácil portabilidade do código--fonte, em relação ao suporte-máquina, foi também uma das preocupações de base. A plataforma primária de desenvolvimento é de base UNIX (SunOS(r) 4.1.3 em workstations Sun Sparc (r) e Linux em PC Intel(r) ). Para uma maior facilidade de compreensão e manutenção, assim como para uma maior manuseabilidade, o código-fonte foi dividido em vários ficheiros. Ficheiros estes que são agrupados depois numa Makefile que vai permitir a compilação do executável. A bateria de regras e o dicionário desenvolvidos, isto é, a base de dados de informação lexical, permite uma cobertura linguística que contempla a flexão de género, número, tempo/modo e pessoa; advérbios em -mente (a partir de adjectivos); avaliativos e z-avaliativos (de nomes e adjectivos); formas do superlativo absoluto sintético (a partir do lema do adjectivo); contracções; e formas cliticizadas dos verbos. 1. Introdução O analisador é uma ferramenta que tem por objectivo atribuir etiquetas às palavras de um texto. A infraestrutura informática permite efectuar uma análise que, decompondo o texto em diversas sequências gráficas, e baseando-se na informação linguística, atribui as respectivas etiquetas com a informação morfossintáctica. 1

Workshop sobre taggers do português - CELGA - ILTEC · 2013-09-02 · Por exemplo, a preposição de pode contrair, entre outros, com os artigos definidos. Sendo assim, foi ... Foram

  • Upload
    ngotram

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

Workshop sobre taggers doportuguês

Instituto de Linguística Teórica e ComputacionalLisboa 1997

Analisador Morfossintáctico do ILTEC*

Caroline HagègeAntónio Meireles Brígida Trindade

Carla Diogo Fernando [email protected]

(ILTEC)

Resumo

No presente artigo descreve-se o modo como foi implementado o Analisador Morfossintáctico do ILTEC.Esta ferramenta foi desenvolvida de raiz pelo instituto, não partindo de qualquer ferramenta existente,quer no que diz respeito à componente informática, quer no que diz respeito à componente linguística.

O Analisador Morfossintáctico do ILTEC é dirigido por regras, recorrendo assim a uma base de dadoscomposta por informação lexical.

A componente informática foi desenvolvida com o objectivo de funcionar de um modo totalmenteindependente dos dados linguísticos, não obrigando a qualquer tipo de alteração com a modificação dainformação linguística. A fácil portabilidade do código--fonte, em relação ao suporte-máquina, foitambém uma das preocupações de base.

A plataforma primária de desenvolvimento é de base UNIX (SunOS(r) 4.1.3 em workstations Sun Sparc(r) e Linux em PC Intel(r) ). Para uma maior facilidade de compreensão e manutenção, assim como parauma maior manuseabilidade, o código-fonte foi dividido em vários ficheiros. Ficheiros estes que sãoagrupados depois numa Makefile que vai permitir a compilação do executável.

A bateria de regras e o dicionário desenvolvidos, isto é, a base de dados de informação lexical, permiteuma cobertura linguística que contempla a flexão de género, número, tempo/modo e pessoa; advérbios em-mente (a partir de adjectivos); avaliativos e z-avaliativos (de nomes e adjectivos); formas do superlativoabsoluto sintético (a partir do lema do adjectivo); contracções; e formas cliticizadas dos verbos.

1. Introdução

O analisador é uma ferramenta que tem por objectivo atribuir etiquetas às palavras de um texto. Ainfraestrutura informática permite efectuar uma análise que, decompondo o texto em diversas sequênciasgráficas, e baseando-se na informação linguística, atribui as respectivas etiquetas com a informaçãomorfossintáctica.

1

Optou-se, sempre que possível, pela construção de regras em detrimento do registo de lemas flexionadose/ou derivados, o que permitiu reduzir o número de entradas registadas e aumentar o número de palavrasetiquetadas.

2. A componente informática

Esta ferramenta foi escrita tendo em vista a maior portabilidade e independência do seu código-fonte emrelação ao suporte-máquina. Assim sendo, se bem que a plataforma primária de desenvolvimento seja debase UNIX (SunOS(r) 4.1.3 em workstations Sun Sparc(r) e Linux em PC Intel(r) ), nada impede, e vistoque é usada a Linguagem C e respeitado o padrão POSIX, que com um mínimo de esforço se possacompilar e executar o suporte lógico em plataformas não UNIX como o Windows NT ou o Windows 95.

Todo o suporte lógico usado para o desenvolvimento é de domínio público e extensões proprietáriasforam de todo evitadas. Assim, o compilador primário que foi usado durante a fase de desenvolvimento éo gcc-2.7.2 da Free Software Fundation (FSF/GNU). Foram também utilizadas, e para fazer o parsing dosficheiros de dados, duas outras ferramentas auxiliares: UNIX - o lex (flex) e o yacc (bison).

2.1. Estrutura Geral

2.1.1. O Código-Fonte

Para uma maior facilidade de compreensão e manutenção, assim como para uma maior manuseabilidade,o código-fonte encontra-se dividido em vários ficheiros. Ficheiros estes que são agrupados depois numaMakefile que vai permitir a compilação do executável.

2.1.2. Recolha e tratamento de dados

Para a recolha e tratamento de dados, todos os diferentes ficheiros de informação são tratados, por via dolex e do yacc, e deles é extraída a informação relevante que, depois de convenientemente tratada, écolocada em memória.

Um dos objectivos prioritários tido em conta na concepção desta ferramenta foi a obtenção de uma maiorindependência possível entre as componentes linguística e informática, de modo a que o suporte lógicopossuísse robustez suficiente para permitir, sem mudanças do seu código-fonte, alterações mais ou menosprofundas nos ficheiros de dados linguísticos.

Note-se que a primeira tarefa do programa é saber quais as categorias morfológicas que vai reconhecer.

Para salvaguardar a independência e estanquicidade das duas componentes - linguística e informática -separaram-se as categorias em dois grandes grupos, a saber: as categorias reais -criadas e definidas peloslinguistas - e as categorias internas - invisíveis ao utilizador comum e usadas internamente pelo programa.Assim, ambas as categorias, isto é, as reais e as internas, estão definidas em ficheiros separados.

Feito isto, é compilado um pequeno utilitário que vai, e de acordo com a informação categorial recolhida,gerar um ficheiro, em linguagem C. Ficheiro este que será parte integrante do código-fonte do programa.

Definidas as categorias reconhecíveis, o programa está apto a carregar os restantes dados.

2

2.1.3. O motor do programa

O código do motor do Programa está o mais possível separado do restante código, de modo a garantir arobustez do conjunto face a alterações nas restantes componentes, como por exemplo no que respeita aotratamento de dados. O código possui todas as funções constituintes do engine do analisador e rotinasusadas.

3. A componente linguística

A componente linguística ocupou-se da definição do tipo de informação que devia estar registada nodicionário e da construção de uma bateria de regras que permitisse o reconhecimento das palavrasflexionadas e de outros tipos de palavras morfologicamente complexas (por exemplo, diminutivos,advérbios em -mente, etc.), cujos lemas não estão registados em qualquer ficheiro.

3.1. Os lemas

A informação linguística foi distribuída por diversos ficheiros, que vão «construir o dicionário».

As diversas categorias foram divididas pelos diversos ficheiros, consoante o modo de implementação.

Cada ficheiro, onde se encontram registados lemas, está dividido por campos, onde está registada ainformação linguística.

Optou-se, sempre que possível, pela construção de regras em detrimento do registo de lemas flexionadosou derivados o que permitiu reduzir o número de entradas registadas e aumentar o número de palavrasreconhecidas. Por exemplo, o reconhecimento dos advérbios em -mente é feito a partir do lema doadjectivo, que está na base do advérbio, registado no dicionário e de um conjunto de regras (a título deexemplo, ao adjectivo óbvio vai ser aplicada uma regra de derivação que permitirá o reconhecimento doadvérbio correspondente - obviamente - sem que este esteja dicionarizado).

No ficheiro principal do dicionário, e designa-se principal por ser aquele que contém um maior número delemas e a maior parte das categorias sintácticas, estão registados cerca de 43 000 lemas (forma nãoflexionada de cada entrada lexical).

Por razões idiossincráticas à sua implementação, os verbos estão registados num ficheiro diferente, cercade 8000, apresentando, inclusivamente, outro formato (este ficheiro apresenta apenas quatro campos deinformação, enquanto que o principal apresenta nove).

Foram registados também em ficheiros diferentes os clíticos, as palavras compostas, as contracções, aslocuções, as siglas, as abreviaturas, os acrónimos, os numerais e a pontuação. Este «tipo» de lemas, apesarde terem a mesma categoria sintáctica que outros, tiveram um tratamento diferente, devido às suascaracterísticas próprias, como seja, em relação às palavras compostas, o facto de elas poderem flexionarapenas no primeiro «elemento», apenas no segundo ou em ambos, isto, obviamente no caso de compostoscom dois «elementos».

3.2. As regras

3

Para além dos ficheiros onde se registam os lemas e a informação sintáctica e morfossintáctica, foiconstituído um outro com as regras de flexão e derivação. O caso particular da flexão verbal foi tratado àparte, visto que apresenta um comportamento diferente das restantes categorias que admitem flexão.

As regras de flexão e derivação estão divididas em cinco grupos, a saber: plural, feminino, diminutivo(avaliativos e z-avaliativos), superlativo dos adjectivos e advérbios em -mente.

Visto que o modo como foi implementada a componente informática permite a aplicação sucessiva devárias regras, foi necessário definir que tipo de regra o programa poderia encontrar «aplicada» em cadaum dos grupos. Por exemplo, no grupo de regras do plural, definiu-se que, antes dessa, pode ser aplicada,mas não obrigatoriamente, uma das regras do grupo de regras do feminino. Poderá, também, o programa,ter de verificar se houve a «aplicação» de uma regra do grupo de regras dos diminutivos e também umadas regras do grupo de regras dos superlativos, visto que a flexão de número é periférica. Se o programaencontrasse a palavra bonitissimazinhas, para reconstituir o seu lema e verificar o seu registo ou não noficheiro principal do dicionário, tem de verificar que houve a «aplicação» de uma regra de flexão emnúmero, uma regra de flexão em género, uma regra de formação de diminutivo e uma regra de formaçãodo superlativo, reconstituindo, assim, o lema bonito.

A nível informático o que o programa vai fazer é «retirar» os diversos morfemas definidos nas regras ereconstituir as diversas formas até encontrar o lema no dicionário.

Há uma relação entre os campos de informação linguística das regras e os campos do dicionário. Estarelação encontra-se ao nível da definição das categorias sintácticas, na medida em que cada uma dasregras tem definida num dos seus campos a que categoria se aplica (ou a nomes, ou a adjectivos, etc.), etambém ao nível da informação morfossintáctica, na medida que, também, em cada regra está definido aque tipo de lema essa mesma regra é aplicada (a lemas masculinos, ou seja, que não admitem flexão degénero; a lemas femininos; a lemas singulares; etc.)

Para a implementação dos verbos foi utilizado um sistema de máscaras (masks), devido à irregularidadena grafia.

Foram, assim, criados três grupos de verbos de acordo com a sua regularidade, irregularidade flexional eirregularidade relativa à alternância de radical.

Ex.:

amar -> am

fugir -> fug, fog, fuj

ser -> s, é ? (tratamento irregular)

Os verbos irregulares foram inteiramente escritos num ficheiro distinto.

No sistema de máscaras utilizado, foi definido, para cada paradigma conjugacional, a que tempo/modo epessoa deve ser aplicado determinado radical. Tome-se como exemplo o verbo medir. Este verboapresenta, a nível ortográfico, duas formas diferentes de radical, med e meç. O radical med aplica-seapenas no presente do indicativo e no presente do conjuntivo, e apenas nalgumas pessoas. Foi, assim,definido, e utilizando um sistema binário, a que tempo/modo e pessoa se aplica cada um deles.

4

3.3. Particularidades de algumas categorias

As palavras compostas e as locuções têm a particularidade de conter dentro da mesma entidade lexical ocarácter «espaço» que é normalmente um separador de itens lexicais.

Foram definidos como compostos os elementos lexicais que contêm um ou mais caracteres «espaço» ouque contêm pelo menos um hífen e que poderão ser flexionados.

O tratamento destas palavras foi dividido em dois grupos: os compostos com espaços entre os seuscomponentes para um lado e os compostos com hífen entre os seus componentes para outro.

As locuções tiveram um tratamento idêntico ao das palavras compostas.

Para o analisador poder dar conta das contracções de duas unidades lexicais que possam ocorrer na línguaportuguesa, foi necessário criar um ficheiro indicando quais as suas combinações possíveis.

O formato das regras adoptadas engloba quatro «áreas» de informação, tal como se exemplifica abaixo.

<primeiro item lexical da contracção> <categoria> <forma truncada> <lista dos itens lexicais quepodem contrair e a respectiva informação lexical>

Por exemplo, a preposição de pode contrair, entre outros, com os artigos definidos. Sendo assim, foidefinido que a preposição, na sua forma contraída vai ser realizada por d, à qual se poderá juntar todas asformas flexionadas do artigo definido o (do, da, dos ,das).

Foram consideradas todas as contracções das preposições de, a, com, em, por, independentemente dacategoria sintáctica do segundo elemento da contracção.

Os pronomes pessoais átonos, pelas suas características sintácticas e morfossintácticas, tiveram um«tratamento» diferenciado, tal como outras categorias.

Foram consideradas várias «classes» e «subclasses» de pronomes, definidas consoante a sua forma e o seucomportamento.

As grandes classes consideradas são os pronomes simples, os pronomes «combinados» e os pronomescontraídos. Os pronomes simples foram ainda divididos em quatro «subclasses». Estas «subclasses» têmem conta o facto de os pronomes, consoante a forma verbal a que se associam, sofrerem alterações a nívelortográfico e «obrigarem», por vezes, a alterações na forma verbal.

Para além dos casos acima referidos, o analisador reconhece ainda abreviaturas, siglas e acrónimos,registados no dicionário.

4. Os resultados

Estando registados cerca de 53 000 lemas, através das regras implementadas, o analisador reconhece eclassifica mais de 10 000 000 de formas correctas do português.

A partir de uma lema, pode reconhecer uma série de formas ou apenas uma. Por exemplo, de um lemacom a categoria adjectivo, com flexão de género e número, são reconhecidas 33 formas.

5

Ex.: entrada: lindo/ADJ/

lindo linda lindos lindas

lindinho lindinha lindinhos lindinhas

lindito lindita linditos linditas

lindozinho lindazinha lindozinhos lindazinhas

lindozito lindazita lindozitos lindazitas

lindíssimo lindíssima lindíssimos lindíssimas

lindissimozinho lindissimazinha lindissimozinhos lindissimazinhas

lindissimozito lindissimazita lindissimozitos lindissimazitas

lindamente

No caso de uma conjunção ou de uma preposição é apenas reconhecida uma forma.

Ex.: entrada: e/CONJ

e

Ex.: entrada: por/PREP

por

A partir da entrada de um verbo são reconhecidas 77 formas flexionadas para além das cliticizadas.

Ex.: entrada: mud mudar a

Reconhece, assim, todas as formas flexionadas de todos os tempos/modos e pessoas. Para além dissoreconhece ainda 77 formas cliticizadas (ênclise e mesóclise).

5. Considerações finais

Na construção de um analisador, tentou-se, sempre que possível, implementar a informação de modo atorná-lo o menos ambíguo possível.

A fase seguinte do projecto centra-se, precisamente, no desfazer da ambiguidade categorial que nestemomento apresenta. Para isso está-se a desenvolver um «módulo» de desambiguação.

6. Bibliografia

AÏT-MOKHTAR, Salah

6

(1995), SMORPH: Guide d?utilisacion. Rapport tecnhique, GRIL, Université Blaise Pascal,Clermont-Ferrand.

ANDRADE, Ernesto d'

(1993), Dicionário Inverso do Português, Lisboa: Edições Cosmos.

CHANOD, J.-P. e Pasi TAPANAINEN

(1995), «Tagging French - comparing a statistical and a constraint-based method», inProceedings of the EACL-95, Dublin.

COSTA, J. Almeida e A. Sampaio e MELO

(1990), Dicionário da Língua Portuguesa, 6.ª edição revista e aumentada, Porto: Porto Editora.

CUESTA, Pilar Vázquez e Maria Albertina Mendes da LUZ

(1971), Gramática da Língua Portuguesa, Lisboa: Edições 70.

CUNHA, Celso e Lindley CINTRA

(1985), Nova Gramática do Português Contemporâneo, Rio de Janeiro: Editora Nova Fronteira.

FERREIRA, Aurélio Buarque de Holanda

(1986), Novo Dicionário da Língua Portuguesa, 2.ª edição revista e aumentada, 2.ª impressão, Riode Janeiro: Editora Nova Fronteira.

GREFENSTETTE, Gregory e Pasi TAPANAINEN

(1994), «What is a word. What is a sentence? Problems of Tokenization», in The Proceedings ofthe 3rd International Conference on Computational Lexicography (COMPLEX?94), Budapeste.

MATEUS, M.ª H. M., Ana Maria BRITO, Inês DUARTE e Isabel Hub FARIA

(1989), Gramática da Língua Portuguesa, 2.ª edição revista e aumentada, Série Linguística,Lisboa: Editorial Caminho.

SÁ NOGUEIRA, Rodrigo de

(1991), Dicionário de verbos portugueses conjugados, 9.ª edição, Lisboa: Clássica Editora.

SANCHEZ LEON, Fernando

(1995), «Development of a Spanish Version of the Xerox Tagger», Facultad de Filosofía y Letras,Universidade Autónoma de Madrid, Madrid.

SILVA, Emídeo e António TAVARES

(1989), Dicionário dos Verbos Portugueses: conjugação e referências, Porto: Porto Editora.

7

TEYSSIER, Paul

(1984), Manuel de Langue Portugaise - Portugal-Brésil, 12ème édition revue et corrigée, Paris:Editions Klincksieck.

VILLALVA, Alina

(1994), Estruturas Morfológicas: Unidades e Hierarquias nas Plavras do Português, Dissertaçãode Doutoramento apresentada à FLUL.

VILELA, Mário

(1990), Dicionário do Português Básico, Porto: Edições Asa.

WILKENS, Mike e Julian KUPIEC

(1995), «Training Hidden Markov Models for Part of Speech Tagging». Xerox Corporation, PaloAlto.

* A publicar em ILTEC WorkingPappers

7. Apêndice

Output gerado pelo Analisador:

----> MUNICÍPIO (município) município N MASC SING

----> DESENVOLVE (desenvolve) (desenvolver) V [ 3" pessoa singular : Pres. Indicat. ]

(desenvolve) (desenvolver) V [ 2" pessoa singular : Imperativo ]

----> SISTEMAS (sistemas) sistema N MASC PLU

----> DE (de) de PREP

----> CONTROLO (controlo) controlo N MASC SING

(controlo) (controlar) V [ 1" pessoa singular : Pres. Indicat. ]

----> E (e) e CONJ MASC SING

----> INFORMAÇÃO (informação) informação N FEM SING

----> BIG

----> BROTHER

----> VIGIA (vigia) vigia N MF SING

(vigia) (vigiar) V [ 3" pessoa singular : Pres. Indicat. ]

(vigia) (vigiar) V [ 2" pessoa singular : Imperativo ]

8

----> LISBOA (lisboa) lisboa NPN FEM SING

----> A (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> Câmara (câmara municipal) câmara municipal "N" FEM SING

----> de (de) de PREP

----> Lisboa (lisboa) lisboa NPN FEM SING

----> está (está) (estar) V [ 3" pessoa singular : Pres. Indicat. ]

(está) (estar) V [ 2" pessoa singular : Imperativo ]

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> desenvolver (desenvolver) (desenvolver) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(desenvolver) (desenvolver) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(desenvolver) (desenvolver) V [ 1" pessoa singular : Infinit. Pessoal ]

(desenvolver) (desenvolver) V [ 3" pessoa singular : Infinit. Pessoal ]

(desenvolver) (desenvolver) V [ Infinit. Impessoal ]

----> dois (dois) dois CARD MASC PLU

----> sistemas (sistemas) sistema N MASC PLU

----> de (de) de PREP

----> controlo (controlo) controlo N MASC SING

(controlo) (controlar) V [ 1" pessoa singular : Pres. Indicat. ]

----> e (e) e CONJ MASC SING

----> informação (informação) informação N FEM SING

----> que (que) que CONJ

(que) que INT

9

(que) que REL

----> lhe (lhe) lhe CLI 3" pessoa MF SING DAT

----> permitirão (permitirão) (permitir) V [ 3" pessoa plural : Fut. Imperf. Indicat. ]

----> , (",") "," VIRG

----> via (via) via N FEM SING

(via) via PREP

(via) (ver) V [ 1" pessoa singular : Pret. Imperf. Indicat. ]

(via) (ver) V [ 3" pessoa singular : Pret. Imperf. Indicat. ]

----> satélite (satélite) satélite N MASC SING

----> , (",") "," VIRG

----> dominar (dominar) (dominar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(dominar) (dominar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(dominar) (dominar) V [ 1" pessoa singular : Infinit. Pessoal ]

(dominar) (dominar) V [ 3" pessoa singular : Infinit. Pessoal ]

(dominar) (dominar) V [ Infinit. Impessoal ]

----> toda (toda) PRONQUANT todo

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> cidade (cidade) cidade N FEM SING

----> . (".") "." P_FIN

----> No (em) em PREP

----> No (o) o ART_DEF MASC SING

----> fundo (fundo) fundo ADJ MASC SING

(fundo) fundo N MASC SING

(fundo) (fundir) V [ 1" pessoa singular : Pres. Indicat. ]

10

(fundo) (fundar) V [ 1" pessoa singular : Pres. Indicat. ]

----> , (",") "," VIRG

----> trata (trata) (tratar) V [ 3" pessoa singular : Pres. Indicat. ]

(trata) (tratar) V [ 2" pessoa singular : Imperativo ]

----> se (se) se CLI 3" pessoa MF SING AC / DAT

----> de (de) de PREP

----> pôr (pôr) (pôr) V [ 1" pessoa singular : Infinit. Pessoal ]

(pôr) (pôr) V [ 3" pessoa singular : Infinit. Pessoal ]

(pôr) (pôr) V [ Infinit. Impessoal ]

----> ao (a) a PREP

----> ao (o) o ART_DEF MASC SING

----> serviço (serviço) serviço N MASC SING

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

----> município (município) município N MASC SING

----> um (um) um ART_INDEF MASC SING

(um) um CARD_UNI_UM MASC SING

----> verdadeiro (verdadeiro) verdadeiro ADJ MASC SING

(verdadeiro) verdadeiro N MASC SING

----> Big

----> Brother

----> . (".") "." P_FIN

----> Um (um) um ART_INDEF MASC SING

(um) um CARD_UNI_UM MASC SING

----> deles (de) de PREP

----> deles (ele) ele PES 3" pessoa MASC PLU

11

(deles) (delir) V [ 2" pessoa singular : Pres. Indicat. ]

----> fornece (fornece) (fornecer) V [ 3" pessoa singular : Pres. Indicat. ]

(fornece) (fornecer) V [ 2" pessoa singular : Imperativo ]

----> todos (todos) todo PRONQUANT MASC PLU

----> os (os) o ART_DEF MASC PLU

(os) o CLI 3" pessoa MASC PLU AC

----> dados (dados) (dar) V [ Part. Passado ] MASC PLU

(dados) dado N MASC PLU

(dados) dado ADJ MASC PLU

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

----> subsolo (subsolo) subsolo N MASC SING

----> e (e) e CONJ MASC SING

----> da (de) de PREP

----> da (a) o ART_DEF FEM SING

----> superfície (superfície) superfície N FEM SING

----> da (de) de PREP

----> da (a) o ART_DEF FEM SING

----> cidade (cidade) cidade N FEM SING

----> . (".") "." P_FIN

----> O (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> outro (outro) outro DEM_ADJ MASC SING

----> está (está) (estar) V [ 3" pessoa singular : Pres. Indicat. ]

(está) (estar) V [ 2" pessoa singular : Imperativo ]

----> voltado (voltado) voltado ADJ MASC SING

12

(voltado) (voltar) V [ Part. Passado ] MASC SING

----> para (para) para CONJ MASC SING

(para) para PREP

----> questões (questões) questão N FEM PLU

----> de (de) de PREP

----> segurança (segurança) segurança N FEM SING

----> , (",") "," VIRG

----> nomeadamente (nomeadamente) nomeado ADJ adv modo

----> sismos (sismos) sismo N MASC PLU

----> . (...) ... "P_FIN"

----> Em (em) em PREP

----> conferência (conferência) conferência N FEM SING

----> de (de) de PREP

----> imprensa (imprensa) imprensa N FEM SING

----> após (após) ADV após

(após) após CONJ

(após) após PREP

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> jogo (jogo) jogo N MASC SING

(jogo) (jogar) V [ 1" pessoa singular : Pres. Indicat. ]

----> , (",") "," VIRG

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> finalista (finalista) finalista ADJ MF SING

13

(finalista) finalista N MF SING

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

----> torneio (torneio) torneio N MASC SING

(torneio) (tornear) V [ 1" pessoa singular : Pres. Indicat. ]

----> de (de) de PREP

----> Sydney (sydney) sydney NPN MF SING

----> , (",") "," VIRG

----> de (de) de PREP

----> há (há) (haver) V [ 3" pessoa singular : Pres. Indicat. ]

(há) (haver) V [ 2" pessoa singular : Imperativo ]

----> uma (uma) um ART_INDEF FEM SING

(uma) um CARD FEM SING

----> semana (semana) semana N FEM SING

----> , (",") "," VIRG

----> não (não) ADV (Neg) não

(não) não N MASC SING

----> evitou (evitou) (evitar) V [ 3" pessoa singular : Pret. Perf. Indicat. ]

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> choro (choro) choro N MASC SING

(choro) (chorar) V [ 1" pessoa singular : Pres. Indicat. ]

----> pela (por) por PREP

----> pela (a) o ART_DEF FEM SING

(pela) (pelar) V [ 3" pessoa singular : Pres. Indicat. ]

(pela) (pelar) V [ 2" pessoa singular : Imperativo ]

14

----> derrota (derrota) derrota N FEM SING

(derrota) (derrotar) V [ 3" pessoa singular : Pres. Indicat. ]

(derrota) (derrotar) V [ 2" pessoa singular : Imperativo ]

----> : (":") ":" D_PONT

----> Não (não) ADV (Neg) não

(não) não N MASC SING

----> vou (vou) (ir) V [ 1" pessoa singular : Pres. Indicat. ]

----> começar (começar) (começar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(começar) (começar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(começar) (começar) V [ 1" pessoa singular : Infinit. Pessoal ]

(começar) (começar) V [ 3" pessoa singular : Infinit. Pessoal ]

(começar) (começar) V [ Infinit. Impessoal ]

----> agora (agora) ADV agora

(agora) agora INTERJ

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> colocar (colocar) (colocar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(colocar) (colocar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(colocar) (colocar) V [ 1" pessoa singular : Infinit. Pessoal ]

(colocar) (colocar) V [ 3" pessoa singular : Infinit. Pessoal ]

(colocar) (colocar) V [ Infinit. Impessoal ]

----> em (em) em PREP

----> causa (causa) causa N FEM SING

(causa) (causar) V [ 3" pessoa singular : Pres. Indicat. ]

(causa) (causar) V [ 2" pessoa singular : Imperativo ]

15

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> meu (meu) meu POSS MASC SING

----> futuro (futuro) futuro ADJ MASC SING

(futuro) futuro N MASC SING

(futuro) (futurar) V [ 1" pessoa singular : Pres. Indicat. ]

----> . (".") "." P_FIN

----> Tentarei (tentarei) (tentar) V [ 1" pessoa singular : Fut. Imperf. Indicat. ]

----> , (",") "," VIRG

----> pelo (por) por PREP

----> pelo (o) o ART_DEF MASC SING

(pelo) (pelar) V [ 1" pessoa singular : Pres. Indicat. ]

----> contrário (contrário) contrário ADJ MASC SING

(contrário) contrário N MASC SING

----> , (",") "," VIRG

----> pensar (pensar) (pensar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(pensar) (pensar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(pensar) (pensar) V [ 1" pessoa singular : Infinit. Pessoal ]

(pensar) (pensar) V [ 3" pessoa singular : Infinit. Pessoal ]

(pensar) (pensar) V [ Infinit. Impessoal ]

----> positivamente (positivamente) positivo ADJ adv modo

----> e (e) e CONJ MASC SING

----> preocupar (preocupar) (preocupar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(preocupar) (preocupar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(preocupar) (preocupar) V [ 1" pessoa singular : Infinit. Pessoal ]

(preocupar) (preocupar) V [ 3" pessoa singular : Infinit. Pessoal ]

16

(preocupar) (preocupar) V [ Infinit. Impessoal ]

----> me (me) me CLI 1" pessoa MF SING AC / DAT

----> com (com) com PREP

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> próximo (próximo) próximo ADJ MASC SING

(próximo) próximo N MASC SING

----> encontro (encontro) encontro N MASC SING

(encontro) (encontrar) V [ 1" pessoa singular : Pres. Indicat. ]

----> , (",") "," VIRG

----> disse (disse) (dizer) V [ 1" pessoa singular : Pret. Perf. Indicat. ]

(disse) (dizer) V [ 3" pessoa singular : Pret. Perf. Indicat. ]

----> . (".") "." P_FIN

----> A (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> imagem (imagem) imagem N FEM SING

----> que (que) que CONJ

(que) que INT

(que) que REL

----> passa (passa) passa N FEM SING

(passa) (passar) V [ 3" pessoa singular : Pres. Indicat. ]

(passa) (passar) V [ 2" pessoa singular : Imperativo ]

----> é (é) (ser) V [ 3" pessoa singular : Pres. Indicat. ]

----> a (a) a PREP

(a) o ART_DEF FEM SING

17

(a) o CLI 3" pessoa FEM SING AC

----> de (de) de PREP

----> que (que) que CONJ

(que) que INT

(que) que REL

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> PS (ps) ps N MASC SING

----> perdeu (perdeu) (perder) V [ 3" pessoa singular : Pret. Perf. Indicat. ]

----> em (em) em PREP

----> toda (toda) PRONQUANT todo

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> linha (linha) linha N FEM SING

----> . (".") "." P_FIN

----> O (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> acordo (acordo) acordo N MASC SING

(acordo) (acordar) V [ 1" pessoa singular : Pres. Indicat. ]

----> é (é) (ser) V [ 3" pessoa singular : Pres. Indicat. ]

----> uma (uma) um ART_INDEF FEM SING

(uma) um CARD FEM SING

----> vitória (vitória) vitória N FEM SING

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

18

----> PSD (psd) psd N MASC SING

----> , (",") "," VIRG

----> como (como) como CONJ

(como) (comer) V [ 1" pessoa singular : Pres. Indicat. ]

----> escreveu (escreveu) (escrever) V [ 3" pessoa singular : Pret. Perf. Indicat. ]

----> Vital (vital) vital ADJ MF SING

----> Moreira (moreira) moreira NP MF SING

----> ? (?) ? P_INT

----> Não (não) ADV (Neg) não

(não) não N MASC SING

----> , (",") "," VIRG

----> não (não) ADV (Neg) não

(não) não N MASC SING

----> é (é) (ser) V [ 3" pessoa singular : Pres. Indicat. ]

----> uma (uma) um ART_INDEF FEM SING

(uma) um CARD FEM SING

----> vitória (vitória) vitória N FEM SING

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

----> PSD (psd) psd N MASC SING

----> . (".") "." P_FIN

----> É (é) (ser) V [ 3" pessoa singular : Pres. Indicat. ]

----> fácil (fácil) fácil ADJ MF SING

----> verificar (verificar) (verificar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(verificar) (verificar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(verificar) (verificar) V [ 1" pessoa singular : Infinit. Pessoal ]

19

(verificar) (verificar) V [ 3" pessoa singular : Infinit. Pessoal ]

(verificar) (verificar) V [ Infinit. Impessoal ]

----> que (que) que CONJ

(que) que INT

(que) que REL

----> quase (quase) ADV quase

----> todas (todas) todo FEM PLU

----> as (as) o ART_DEF FEM PLU

(as) o CLI 3" pessoa FEM PLU AC

----> propostas (propostas) proposta N FEM PLU

(propostas) proposto ADJ FEM PLU

(propostas) (propor) V [ Part. Passado Irregular ] FEM PLU

----> apresentadas (apresentadas) (apresentar) V [ Part. Passado ] FEM PLU

(apresentadas) apresentado ADJ FEM PLU

----> pelo (por) por PREP

----> pelo (o) o ART_DEF MASC SING

(pelo) (pelar) V [ 1" pessoa singular : Pres. Indicat. ]

----> PS (ps) ps N MASC SING

----> ficaram (ficaram) (ficar) V [ 3" pessoa plural : Pret. Perf. Indicat. ]

(ficaram) (ficar) V [ 3" pessoa plural : Pret. mq Perf. Indicat. ]

----> consagradas (consagradas) (consagrar) V [ Part. Passado ] FEM PLU

(consagradas) consagrado ADJ FEM PLU

----> no (no) no CLI 3" pessoa MASC SING AC

(em) em PREP

----> no (o) o ART_DEF MASC SING

----> texto (texto) texto N MASC SING

20

----> final (final) final ADJ MF SING

(final) final N MF SING

----> do (de) de PREP

----> do (o) o ART_DEF MASC SING

----> acordo (acordo) acordo N MASC SING

(acordo) (acordar) V [ 1" pessoa singular : Pres. Indicat. ]

----> . (".") "." P_FIN

----> Para (para) para CONJ

(para) para PREP

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> chanceler (chanceler) chanceler N MASC SING

----> Kohl (kohl) kohl NP MF SING

----> , (",") "," VIRG

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> acordo (acordo) acordo N MASC SING

(acordo) (acordar) V [ 1" pessoa singular : Pres. Indicat. ]

----> com (com) com PREP

----> a (a) a PREP

(a) o ART_DEF FEM SING

(a) o CLI 3" pessoa FEM SING AC

----> oposição (oposição) oposição N FEM SING

----> social (social-democrata) social-democrata "ADJ" MF SING

(social-democrata) social-democrata "N" MF SING

----> permitiria (permitiria) (permitir) V [ 1" pessoa singular : Condicional ]

21

(permitiria) (permitir) V [ 3" pessoa singular : Condicional ]

----> poupar (poupar) (poupar) V [ 1" pessoa singular : Fut. Imperf. Conjunt. ]

(poupar) (poupar) V [ 3" pessoa singular : Fut. Imperf. Conjunt. ]

(poupar) (poupar) V [ 1" pessoa singular : Infinit. Pessoal ]

(poupar) (poupar) V [ 3" pessoa singular : Infinit. Pessoal ]

(poupar) (poupar) V [ Infinit. Impessoal ]

----> tempo (tempo) tempo N MASC SING

----> , (",") "," VIRG

----> evitando (evitando) (evitar) V [ Gerundio ]

----> que (que) que CONJ

(que) que INT

(que) que REL

----> o (o) o ART_DEF MASC SING

(o) o CLI 3" pessoa MASC SING AC

----> projecto (projecto) projecto N MASC SING

(projecto) (projectar) V [ 1" pessoa singular : Pres. Indicat. ]

----> percorresse (percorresse) (percorrer) V [ 1" pessoa singular : Pret. Imperf. Conjunt. ]

(percorresse) (percorrer) V [ 3" pessoa singular : Pret. Imperf. Conjunt. ]

----> um (um) um ART_INDEF MASC SING

(um) um CARD_UNI_UM MASC SING

----> demorado (demorado) demorado ADJ MASC SING

(demorado) (demorar) V [ Part. Passado ] MASC SING

----> e (e) e CONJ MASC SING

----> arriscado (arriscado) arriscado ADJ MASC SING

(arriscado) (arriscar) V [ Part. Passado ] MASC SING

----> caminho (caminho) caminho N MASC SING

22

(caminho) (caminhar) V [ 1" pessoa singular : Pres. Indicat. ]

----> pelo (por) por PREP

----> pelo (o) o ART_DEF MASC SING

(pelo) (pelar) V [ 1" pessoa singular : Pres. Indicat. ]

----> parlamento (parlamento) parlamento N MASC SING

----> . (".") "." P_FIN

23