Title: | Comparação de técnicas de classificação para identificação de fake news em português |
Author: | Pereira, Matheus Ferreira |
Abstract: |
O avanço da Internet resultou em um aumento na disseminação de informações, mas não é possível garantir a qualidade dessas informações, levando ao problema de Fake News. As mesmas são responsáveis por diferentes tipos de danos a sociedade. Para resolver esse problema, existem distintas aproximações automatizadas. Este trabalho comparou diferentes técnicas usadas para a identificação de Fake News, buscando ajudar a entender o que é mais eficaz para a tarefa no idioma Português. Foram levantadas 9 questões de pesquisa e realizados experimentos em uma base de dados com 7.200 notícias reais para respondê-las. O melhor resultado foi atingido pelo modelo BERTimbau, um modelo BERT pré-treinado em português, alcançando Medida-F1 de 99%. The advance of the Internet has resulted in an increase in the dissemination of information, but the quality of this information cannot be guaranteed, leading to the problem of Fake News. These are responsible for different types of damage to society. To solve this problem, there are different automatized approaches. This work compared different techniques used to identify Fake News, seeking to help understand what is more effective for the task in the Portuguese language. Nine research questions were raised and experiments were performed on a database with 7,200 real news in order to answer them. The best result was achieved by the BERTimbau model, a pre-trained BERT model in Portuguese, reaching F1-Measure of 99%. |
URI: | https://dspace.ifrs.edu.br/xmlui/handle/123456789/1263 |
Date: | 2023 |
Files | Size | Format | View | Description |
---|---|---|---|---|
1234567891263.pdf | 564.9Kb |
View/ |
Texto completo |