Detecção de posicionamentos a partir de textos usando expansão semiautomática de córpus
A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interess...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | Catalan |
| Published: |
Universidade do Minho & Universidade de Vigo
2024-12-01
|
| Series: | Linguamática |
| Subjects: | |
| Online Access: | https://www.linguamatica.com/index.php/linguamatica/article/view/436 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Summary: | A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interesse. Uma vez que esses tópicos são em princípio ilimitados, a necessidade de novos córpus rotulados também o é. Como forma de amenizar algumas dessas dificuldades, este trabalho adapta para a detecção de posicionamento um método de expansão de córpus originalmente desenvolvido para a tarefa análoga de análise de sentimento. O método é então aplicado a um grande (46 mil instâncias) córpus de posicionamentos cobrindo seis temas de interesse político e/ou moral em português brasileiro, obtendo um aumento substancial no número de instâncias. Resultados de avaliação automática e humana sugerem que a adição de instâncias rotuladas semiautomaticamente ao conjunto de dados original não prejudica a precisão da classificação, e que os rótulos gerados automaticamente estão, em sua maioria, corretos.
|
|---|---|
| ISSN: | 1647-0818 |