Avaliação de Metodologia Forense de Comparação Automática de Locutores em Vozes Sintetizadas
DOI:
https://doi.org/10.70365/2764-0779.2025.164Palavras-chave:
Vozes Sintetizadas, Comparação Forense de Locutor, Clonagem de Voz, Sistema de Reconhecimento Automático de Locutor, DeepfakeResumo
A comunicação oral carrega informações identificadoras além da mensagem transmitida, permitindo o desenvolvimento de sistemas biométricos vocais e protocolos científicos para comparação forense de locutores (CFL). Com a evolução da síntese de voz por inteligência artificial, surgem preocupações sobre a segurança e capacidade de detecção humana. Apesar do desempenho dos Sistemas de Reconhecimento Automático de Locutores (SRAL), estes ainda precisam evoluir para contornar as tecnologias de síntese por IA, especialmente no contexto do português brasileiro. Este trabalho objetiva comparar o desempenho de SRAL aplicadas com metodologias da CFL em vozes sintetizadas por IA, questionando como o SRAL utilizando ECAPA-TDNN implementado no SpeechBrain reage à comparação de vozes clonadas. A metodologia exploratória quantitativa utilizou o Corpus Forense do Português Brasileiro (CFPB) para calibração e o corpus CEFALA-1 para experimento, empregando o modelo ECAPA-TDNN do SpeechBrain e serviços de clonagem ElevenLabs® e Coqui-TTS®. Os resultados mostraram que o framework apresentou desempenho ótimo em vozes naturais (precisão balanceada >95%), mas vulnerabilidades às vozes sintetizadas, com todas as vozes clonadas classificadas como do mesmo locutor. Frente a este resultado, recomenda-se o desenvolvimento de protocolos específicos para análises forenses com suspeita de clonagem vocal.
Downloads
Downloads
Publicado
Declaração de Disponibilidade de Dados
Os dados referentes a esta pesquisa podem ser solicitados junto aos autores via email.
Edição
Seção
Licença
Copyright (c) 2025 Avante: Revista Acadêmica da Polícia de Minas Gerais

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.

