Ricardo Buoso Neto
Orientador(a): Plínio Almeida Barbosa
Co-orientador(a): Júlio César Cavalcanti de Oliveira
Mestrado em Linguística - 2025
Nro. chamada: DISSERTAÇÃO DIGITAL - B889
Resumo: Esta dissertação de mestrado investiga a robustez de parâmetros acústicos na comparação de locutor sob condições de disfarce de voz, com o objetivo de aprimorar metodologias fonético-forenses. O estudo examina o impacto de seis técnicas diferentes de disfarce de voz (abaixamento da F0 (voz grave), aumento da F0 (voz aguda), voz rouca, voz nasal, lápis entre os dentes e uso de máscara N95) em parâmetros acústicos de natureza prosódica, formântica, intensidade e temporais. Os dados foram coletados de 10 falantes (5 homens, 5 mulheres) lendo um texto padronizado sob cada condição de disfarce, bem como em sua voz natural. Os dados coletados foram segmentados usando o Praat, e os parâmetros acústicos foram extraídos usando scripts especializados, incluindo Prosody Descriptor Extractor, Local features Forensic Descriptor (LFD) e Acoustic Parameters Descriptor For Forensics (APD). O estudo empregou a Análise Discriminante Linear (LDA) para classificar as diferentes condições de disfarce e avaliar o poder discriminatório de vários parâmetros acústicos. Os resultados indicam que os modelos foram geralmente mais bem-sucedidos na identificação do disfarce de “voz aguda” em diferentes conjuntos de parâmetros e grupos de falantes. O desempenho dos modelos variou dependendo do tipo de disfarce e do sexo do falante, com os modelos para falantes masculinos geralmente superando os dos falantes femininos. Os modelos que incorporaram uma gama mais ampla de parâmetros acústicos tenderam a ter um desempenho melhor do que aqueles focados em um conjunto limitado de parâmetros ou parâmetros individuais. As descobertas revelam que, embora alguns parâmetros, como as medidas relacionadas à F0, sejam suscetíveis ao uso de disfarces vocais, outros, particularmente aqueles relacionados aos formantes F3 e F4 e características espectrais de nasais e laterais na faixa de 1000-2000 Hz, demonstram maior robustez. O estudo também destaca os desafios na distinção entre certas condições de disfarce, especialmente ao usar o disfarce de “lápis entre os dentes”, o que frequentemente levou à classificação incorreta. Os resultados sugerem que, embora parâmetros individuais possam ter poder discriminatório limitado, uma abordagem multidimensional incorporando uma ampla gama de características acústicas pode aumentar a precisão das comparações de falantes. As descobertas do estudo ressaltam a importância de considerar as condições específicas sob as quais as amostras de voz são obtidas e o impacto potencial do disfarce de voz na confiabilidade da comparação forense de voz
Palavras-chave: Fonética forense; Comparação forense de locutor


