Desenvolvimento de uma Rede Neural Convolucional para classificação de sinais acústicos da deglutição de indivíduos com disfagia orofaríngea

dc.contributor.advisorBecker, Carla Diniz Lopes
dc.contributor.advisor-coRech, Rafaela Soares
dc.contributor.authorAndrade, Dieine Estela Bernieri Schiavon
dc.contributor.departmentPrograma de Pós-Graduação em Tecnologias da Informação e Gestão em Saúde
dc.date.accessioned2024-11-14T21:17:43Z
dc.date.available2024-11-14T21:17:43Z
dc.date.date-insert2024-11-14
dc.date.issued2024-10-18
dc.descriptionDissertação (Mestrado)-Programa de Pós-Graduação em Tecnologias da Informação e Gestão em Saúde, Fundação Universidade Federal de Ciências da Saúde de Porto Alegre.pt_BR
dc.description.abstractIntrodução: A deglutição é um processo contínuo que se inicia na cavidade oral e termina quando o alimento chega ao estômago. Qualquer alteração no trânsito do bolo alimentar, que interfira na segurança e na eficiência durante o trajeto, é considerado de disfagia. A disfagia afeta significativamente a vida de quem sofre dessa condição, causando consequências severas à saúde do indivíduo. O exame padrão ouro para diagnóstico de disfagia é a videofluoroscopia, que é um exame de raio-x dinâmico, que está relacionado ao desconforto e riscos ao indivíduo. A avaliação clínica ainda é permeada de subjetividade e o uso do aprendizado de máquina mostra-se promissor para a qualificação da mesma. Objetivo: Analisar a acurácia diagnóstica de um modelo baseado em Rede Neural Convolucional que permitirá classificar deglutições de indivíduos com disfagia orofaríngea e indivíduos com deglutição normal ou funcional. Método: Estudo transversal de acurácia diagnóstica, realizado a partir de um banco de dados com sinais acústicos de deglutição de indivíduos adultos e idosos, captados por meio da ausculta cervical digital e classificados por um fonoaudiólogo capacitado como deglutição normal e com disfagia orofaríngea. O diagnóstico de disfagia orofaríngea foi confirmado pela videofluoroscopia da deglutição. As gravações de áudio completas, com todos os eventos de deglutição amostrados em uma frequência de 4 kHz, foram transformadas em espectrogramas e escalogramas e, em seguida, em imagens. Uma arquitetura de rede neural convolucional binária foi desenvolvida para classificar deglutições normais e alteradas. Os modelos foram treinados usando um holdout de 3 vias e validação cruzada de 10 vezes. Os espectrogramas e escalogramas foram usados separadamente como entrada para a rede para extração de características. Assim, as frequências presentes nas gravações de áudio foram representadas visualmente ao longo do tempo. Quatro experimentos foram realizados com gravações de áudio de deglutição de saliva, líquido, pastoso e sólido, alternando o tipo de entrada para a rede. Os três primeiros experimentos verificaram o desempenho dos modelos na classificação da deglutição normal ou alterada. O último experimento usou exclusivamente sinais de deglutição com consistência pastosa para verificar o desempenho dos modelos na classificação do tipo de deglutição, se normal ou anormal e a forma, se livre ou controlada. Resultados: O modelo com espectrograma obteve melhores resultados no primeiro experimento, com acurácia de 90,54% e recall de 91,89%. No segundo experimento, o modelo com escalograma obteve melhor desempenho, com uma acurácia de 89,44%, recall de 95,92%. Os modelos avaliados no terceiro experimento tiveram a mesma acurácia de 73,68%. No quarto experimento, três modelos obtiveram acurácia e recall de 100%; apenas o modelo com avaliação intragrupo (disfagia) teve desempenho inferior, com acurácia de 70% e recall de 75%. Conclusão: Os modelos treinados com espectrogramas e escalogramas tiveram resultados semelhantes em todos os experimentos, sendo promissores para a classificação automática de sinais de deglutição normal e alterada. Os modelos propostos apresentam potencial para uso na prática clínica para uma identificação precoce e acurada da disfagia orofaríngea.
dc.description.abstract-enIntroduction: Swallowing is a continuous process that begins in the oral cavity and ends when food reaches the stomach. Any change in the transit of the food bolus that interferes with its safety and efficiency during its journey is considered dysphagia. Dysphagia significantly affects the lives of those who suffer from this condition, causing severe consequences to the individual's health. The gold standard exam for diagnosing dysphagia is videofluoroscopy, which is a dynamic x-ray exam that is related to discomfort and risks to the individual. Clinical evaluation is still permeated by subjectivity, and the use of machine learning shows promise for its qualification. Objective: To analyze the diagnostic accuracy of a model based on the Convolutional Neural Network that will allow the classification of swallowing of individuals with oropharyngeal dysphagia and individuals with normal or functional swallowing. Method: Cross-sectional study of diagnostic accuracy, carried out from a database with acoustic swallowing signals from adults and elderly individuals, captured through digital cervical auscultation and classified by a trained speech-language pathologist as normal swallowing and with oropharyngeal dysphagia. The diagnosis of oropharyngeal dysphagia was confirmed by videofluoroscopy of swallowing. The complete audio recordings, with all swallowing events sampled at a frequency of 4 kHz, were transformed into spectrograms and scalograms and then into images. A binary convolutional neural network architecture was developed to classify tasks for a supervised learner. The models were trained using a 3-way holdout and 10-fold cross-validation. The spectrograms and scalograms were used separately as input to the network for feature extraction. Thus, the frequencies present in the audio recordings were visually represented over time. Four experiments were performed with audio recordings of swallowing saliva, liquid, pasty, and solid, alternating the input type to the network. The first three experiments verified the performance of the models in classifying normal or abnormal swallowing. The last experiment exclusively used swallowing signals with pasty consistency to verify the performance of the models in classifying the type of swallowing, whether normal or abnormal and the form, whether free or controlled. Results: The model with the spectrogram obtained better results in the first experiment, with an accuracy of 90.54% and a recall of 91.89%. In the second experiment, the better model was with a scalogram that obtained an accuracy of 89.44% and a recall of 95.92%. The models evaluated in the third experiment had the same accuracy of 73.68%. In the fourth experiment, three models obtained accuracy and recall of 100%; only the model with intragroup evaluation (dysphagia) had lower performance, with an accuracy of 70% and recall of 75%. Conclusion: The models trained with spectrograms and scalograms had similar results in all experiments, promising for automatically classifying normal and altered swallowing signals. The proposed models can be used in clinical practice for early and accurate identification of oropharyngeal dysphagia.
dc.identifier.urihttps://repositorio.ufcspa.edu.br/handle/123456789/3065
dc.language.isopt_BR
dc.relation.requiresTEXTO - Adobe Reader
dc.rightsAcesso Embargadopt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectAusculta Cervicalpt_BR
dc.subjectTranstornos de Deglutiçãopt_BR
dc.subjectRede Neural Convolucionalpt_BR
dc.subject[en] Cervical Auscultationen
dc.subject[en] Deglutition Disorderspt_BR
dc.subject[en] Convolutional Neural Networkpt_BR
dc.titleDesenvolvimento de uma Rede Neural Convolucional para classificação de sinais acústicos da deglutição de indivíduos com disfagia orofaríngea
dc.typeDissertação
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
[DISSERTAÇÃO] Andrade, Dieine Estela Bernieri Schiavon de (P).pdf
Tamanho:
538.91 KB
Formato:
Adobe Portable Document Format