Desenvolvimento de uma Rede Neural Convolucional para classificação de sinais acústicos da deglutição de indivíduos com disfagia orofaríngea

No Thumbnail Available
Date
2024-10-18
Journal Title
Journal ISSN
Volume Title
Publisher
item.page.contributor.editor
Abstract
Introdução: A deglutição é um processo contínuo que se inicia na cavidade oral e termina quando o alimento chega ao estômago. Qualquer alteração no trânsito do bolo alimentar, que interfira na segurança e na eficiência durante o trajeto, é considerado de disfagia. A disfagia afeta significativamente a vida de quem sofre dessa condição, causando consequências severas à saúde do indivíduo. O exame padrão ouro para diagnóstico de disfagia é a videofluoroscopia, que é um exame de raio-x dinâmico, que está relacionado ao desconforto e riscos ao indivíduo. A avaliação clínica ainda é permeada de subjetividade e o uso do aprendizado de máquina mostra-se promissor para a qualificação da mesma. Objetivo: Analisar a acurácia diagnóstica de um modelo baseado em Rede Neural Convolucional que permitirá classificar deglutições de indivíduos com disfagia orofaríngea e indivíduos com deglutição normal ou funcional. Método: Estudo transversal de acurácia diagnóstica, realizado a partir de um banco de dados com sinais acústicos de deglutição de indivíduos adultos e idosos, captados por meio da ausculta cervical digital e classificados por um fonoaudiólogo capacitado como deglutição normal e com disfagia orofaríngea. O diagnóstico de disfagia orofaríngea foi confirmado pela videofluoroscopia da deglutição. As gravações de áudio completas, com todos os eventos de deglutição amostrados em uma frequência de 4 kHz, foram transformadas em espectrogramas e escalogramas e, em seguida, em imagens. Uma arquitetura de rede neural convolucional binária foi desenvolvida para classificar deglutições normais e alteradas. Os modelos foram treinados usando um holdout de 3 vias e validação cruzada de 10 vezes. Os espectrogramas e escalogramas foram usados separadamente como entrada para a rede para extração de características. Assim, as frequências presentes nas gravações de áudio foram representadas visualmente ao longo do tempo. Quatro experimentos foram realizados com gravações de áudio de deglutição de saliva, líquido, pastoso e sólido, alternando o tipo de entrada para a rede. Os três primeiros experimentos verificaram o desempenho dos modelos na classificação da deglutição normal ou alterada. O último experimento usou exclusivamente sinais de deglutição com consistência pastosa para verificar o desempenho dos modelos na classificação do tipo de deglutição, se normal ou anormal e a forma, se livre ou controlada. Resultados: O modelo com espectrograma obteve melhores resultados no primeiro experimento, com acurácia de 90,54% e recall de 91,89%. No segundo experimento, o modelo com escalograma obteve melhor desempenho, com uma acurácia de 89,44%, recall de 95,92%. Os modelos avaliados no terceiro experimento tiveram a mesma acurácia de 73,68%. No quarto experimento, três modelos obtiveram acurácia e recall de 100%; apenas o modelo com avaliação intragrupo (disfagia) teve desempenho inferior, com acurácia de 70% e recall de 75%. Conclusão: Os modelos treinados com espectrogramas e escalogramas tiveram resultados semelhantes em todos os experimentos, sendo promissores para a classificação automática de sinais de deglutição normal e alterada. Os modelos propostos apresentam potencial para uso na prática clínica para uma identificação precoce e acurada da disfagia orofaríngea.
Description
Dissertação (Mestrado)-Programa de Pós-Graduação em Tecnologias da Informação e Gestão em Saúde, Fundação Universidade Federal de Ciências da Saúde de Porto Alegre.
Keywords
Ausculta Cervical, Transtornos de Deglutição, Rede Neural Convolucional, [en] Cervical Auscultation, [en] Deglutition Disorders, [en] Convolutional Neural Network
Citation