CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO
Licencia: Creative Commons (by)
Autor(es): Jackson Wilke da Cruz SOUZA
Ariani Di FELIPPO
A complementaridade é um fenômeno multidocumento comumente observado entre
notícias que versam sobre um mesmo evento. A partir de um corpus em português composto
por um conjunto de pares de sentenças manualmente anotadas com as relações da CrossDocument Structure Theory (CST) que explicitam a complementaridade temporal (Historical
background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse
tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o
potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado
pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho
reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou
Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras
do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é
o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui
gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do
Brasil que são baseados na CST.
Compartir:
Una vez que el usuario haya visto al menos un documento, este fragmento será visible.