^
Fact-checked
х

Todo o conteúdo do iLive é medicamente revisado ou verificado pelos fatos para garantir o máximo de precisão factual possível.

Temos diretrizes rigorosas de fornecimento e vinculamos apenas sites de mídia respeitáveis, instituições de pesquisa acadêmica e, sempre que possível, estudos médicos revisados por pares. Observe que os números entre parênteses ([1], [2], etc.) são links clicáveis para esses estudos.

Se você achar que algum dos nossos conteúdos é impreciso, desatualizado ou questionável, selecione-o e pressione Ctrl + Enter.

Voz como Análise: Sinais Precoces de Câncer e Lesões Benignas

Alexey Kryvenko, Revisor Médico
Última revisão: 18.08.2025
2025-08-12 08:13
">

Pesquisadores da Oregon Health & Science University analisaram gravações de fala do novo conjunto de dados Bridge2AI-Voice, disponível ao público, e encontraram uma característica acústica simples que pode revelar patologias nas pregas vocais. Estamos falando da razão harmônico-ruído (HNR) — a razão entre "tons musicais" e ruído. Seu nível e variabilidade distinguiam as vozes de pessoas com câncer de laringe e lesões benignas daquelas saudáveis e alguns outros distúrbios vocais. O efeito foi especialmente evidente em homens cisgênero; a significância estatística não foi suficiente para as mulheres — os autores culpam o pequeno tamanho da amostra e pedem uma expansão dos dados. O trabalho foi publicado como um breve relatório na Frontiers in Digital Health.

Contexto do estudo

  • Por que procurar por "marcadores vocais"? Rouquidão é uma queixa comum. As causas são variadas: de resfriados e refluxo a nódulos/pólipos e câncer de laringe. Atualmente, o caminho para o diagnóstico é uma consulta com um otorrinolaringologista e uma endoscopia (uma câmera no nariz/garganta). É preciso, mas nem sempre está disponível rapidamente e não é adequado para automonitoramento domiciliar. A triagem prévia é necessária: uma maneira simples de entender quem deve consultar um médico primeiro.
  • O que é um biomarcador de voz? A fala é um sinal que pode ser facilmente gravado em um telefone. Seu "padrão" pode ser usado para avaliar como as pregas vocais vibram. Lesões tornam as vibrações irregulares: mais "ruído" e menos "música".
  • Por que novos conjuntos de dados são importantes. Anteriormente, esses trabalhos dependiam de pequenas amostras "caseiras" — os modelos eram frágeis. O Bridge2AI-Voice é um conjunto amplo, multicêntrico e eticamente coletado de gravações de áudio vinculadas a diagnósticos. Foi criado como um "campo de testes comum" para, finalmente, treinar e testar algoritmos em dados grandes e heterogêneos.
  • Onde estão as principais dificuldades?
    • A voz muda devido ao microfone, ruído ambiente, frio, fumo, idioma, gênero e idade.
    • Tradicionalmente, há menos dados femininos, e a voz feminina tem maior frequência — as métricas se comportam de maneira diferente.
    • Nenhum teste “caseiro” pode substituir um exame ou fazer um diagnóstico - no máximo, ajuda a decidir: “é necessário consultar um otorrinolaringologista com urgência?”
  • Por que a clínica e os pacientes precisam disso? Se pessoas com alto risco de nódulos/tumores puderem ser selecionadas para uma consulta prioritária em um curto espaço de tempo, isso agilizará o diagnóstico, reduzirá encaminhamentos desnecessários e fornecerá uma ferramenta para automonitoramento entre as consultas (após a cirurgia, durante o tratamento).
  • Aonde isso deve levar: Para aplicações/módulos de telemedicina validados que:
    1. escrever um discurso de acordo com o padrão (frase + “aaa” prolongado),
    2. calcular características básicas (HNR, jitter, shimmer, F0),
    3. emitir uma recomendação para contatar um especialista caso o perfil seja alarmante,
    4. manter a dinâmica após o tratamento.

A ideia é simples: “colocar o telefone no ouvido de um médico otorrinolaringologista” – não para diagnóstico, mas para não deixar passar despercebido quem precisa de ajuda rápida e presencial.

O que exatamente eles fizeram?

  • Pegamos a primeira versão do conjunto de dados Bridge2AI-Voice multicêntrico e coletado eticamente, um projeto emblemático do NIH em que gravações de voz são vinculadas a informações clínicas (diagnósticos, questionários, etc.).
  • Foram formadas duas amostras analíticas:
    1. "câncer de laringe / linfonodos benignos / saudável";
    2. "câncer ou nódulos benignos" versus disfonia espasmódica e paralisia das pregas vocais (outras causas comuns de rouquidão).
  • Características básicas da voz foram identificadas a partir de frases padronizadas: tom fundamental (F0), jitter, shimmer e RNH, e os grupos foram comparados por meio de estatísticas não paramétricas. Resultado: as diferenças mais estáveis foram em RNH e F0, com RNH e sua variabilidade diferenciando melhor as lesões benignas tanto da norma quanto do câncer de laringe. Esses sinais foram mais distintos em homens.

Por que isso é importante?

  • Triagem precoce sem sonda. Atualmente, o caminho para o diagnóstico frequentemente inclui nasoendoscopia e, se suspeita, biópsia. Se recursos acústicos simples combinados com IA puderem priorizar aqueles que precisam de endoscopia, os pacientes serão encaminhados a um otorrinolaringologista mais cedo e os encaminhamentos desnecessários serão reduzidos. Isso é um complemento, não um substituto para o médico.
  • Big data para voz. O Bridge2AI-Voice é um projeto raro em que a voz é coletada usando protocolos uniformes e vinculada a diagnósticos; os dados estão disponíveis para pesquisadores via PhysioNet/Health Data Nexus. Isso acelera o desenvolvimento de biomarcadores de voz confiáveis em vez de "aplicativos milagrosos" em pequenas amostras.

O que é HNR?

Quando falamos, as pregas vocais vibram e criam sobretons (harmônicos). Mas a vibração nunca é perfeita – sempre há ruído no sinal. A RNH é simplesmente o quanto mais "música" há na voz do que "chiado". Quando as pregas vocais são danificadas, a vibração se torna menos uniforme – há mais ruído, a RNH cai e seus saltos (variabilidade) aumentam. Esse é o padrão que os autores identificaram.

Avisos importantes

  • Trata-se de uma análise piloto e exploratória: sem validação clínica, com restrições à amostra de mulheres — portanto, seus efeitos não foram significativos. São necessários dados maiores e mais diversos, além da "processamento" de modelos em diferentes clínicas e em diferentes idiomas.
  • A voz é um ser "multivalorado": é afetada por um resfriado, fumo, refluxo, um microfone, barulho no ambiente. Qualquer "teste caseiro" deve ser capaz de levar em conta o contexto — e ainda servir como um filtro para um encaminhamento a um otorrinolaringologista, e não um diagnóstico por clique.

O que vem a seguir?

  • Expanda o conjunto de dados (incluindo mulheres e idades), padronize tarefas e acústica (leitura de uma frase, “aaa” prolongado, etc.), experimente modelos multimodais (voz + sintomas/fatores de risco do questionário).
  • Vincule os sinais acústicos aos resultados dos exames (endoscopia, estroboscopia) e à dinâmica após o tratamento, para que o perfil HNR também possa ser usado para monitoramento.
  • Continue a “ciência aberta”: a Bridge2AI-Voice já está publicando versões do conjunto de dados e ferramentas - esta é uma chance de alcançar rapidamente pilotos reais em clínicas.

Conclusão

É possível "ouvir" problemas nas pregas vocais a partir da voz — e talvez encaminhar a pessoa ao especialista certo mais cedo. Por enquanto, é uma boa pista (HNR e sua variabilidade), mas graças ao big data aberto, os biomarcadores vocais finalmente têm a chance de se tornar uma ferramenta de triagem confiável.

Fonte: Jenkins P. et al. Voz como Biomarcador: Análise Exploratória para Lesões Benignas e Malignas nas Pregas Vocais. Frontiers in Digital Health, 2025 (aceito para publicação). Dados — Bridge2AI-Voice (NIH/PhysioNet).


O portal iLive não fornece aconselhamento médico, diagnóstico ou tratamento.
As informações publicadas no portal são apenas para referência e não devem ser usadas sem consultar um especialista.
Leia atentamente as regras e políticas do site. Você também pode entrar em contato conosco!

Copyright © 2011 - 2025 iLive. Todos os direitos reservados.