Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão

Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão

Auscultadores que utilizam a IA para destacar uma voz num espaço lotado.
Auscultadores que utilizam a IA para destacar uma voz num espaço lotado.
Universidade de Washington

Os investigadores integraram a IA em auscultadores normais para isolar a voz de um único orador numa multidão ruidosa, bastando para isso olhar para ele. O código para este sistema avançado de cancelamento de ruído está disponível gratuitamente para qualquer pessoa interessada em construir a sua própria versão.

Ouvir uma pessoa num ambiente cheio de gente e ruidoso, onde muitas pessoas estão a falar, pode ser um desafio, especialmente para quem tem dificuldades auditivas. Embora os aparelhos auditivos modernos utilizem tecnologia de cancelamento de ruído, não conseguem eliminar completamente o ruído de fundo.

Melhorar a Audição em Ambientes Ruidosos

Os investigadores da Universidade de Washington (UW) criaram uma solução para melhorar a audição em ambientes ruidosos. Ao equipar os auscultadores normais com cancelamento de ruído com IA, desenvolveram um sistema que consegue focar a voz de um orador quando o utilizador olha para ele.

“Hoje em dia, associamos frequentemente a IA a chatbots baseados na Web que respondem a perguntas”, disse Shyam Gollakota, professor da Escola de Ciências e Engenharia Informática Paul G. Allen da UW e autor sénior do estudo. “No entanto, neste projeto, desenvolvemos IA para melhorar a perceção auditiva de quem usa auscultadores de acordo com as suas preferências. Os nossos dispositivos permitem ouvir claramente um único altifalante, mesmo num ambiente ruidoso com muitas pessoas a falar.”

Os auscultadores disponíveis no mercado estão equipados com microfones e um botão.
Os auscultadores disponíveis no mercado estão equipados com microfones e um botão.
Universidade de Washington

O sistema “target speech hearing” (THS) criado pelos investigadores é simples mas muito eficaz. Os auscultadores normais estão equipados com dois microfones, um em cada auricular.

Quando o utilizador olha para a pessoa que quer ouvir e prime um botão na parte lateral dos auscultadores durante três a cinco segundos, as ondas sonoras da voz desse orador chegam aos dois microfones simultaneamente (com uma margem de erro de 16 graus).

Análise de Sinal e Isolamento de voz

Estes sinais são enviados para um computador de bordo, onde o software de aprendizagem automática analisa os padrões vocais do orador. Em seguida, o sistema isola a voz do orador e canaliza-a através dos auscultadores, mesmo que este se mova, ao mesmo tempo que filtra o ruído de fundo.

O vídeo abaixo demonstra a eficácia dos auscultadores, mostrando a sua capacidade de eliminar rapidamente o ruído ambiente e de se concentrar no orador. Isto inclui a remoção do ruído de uma pessoa próxima a falar ao telemóvel dentro de casa e o som de uma fonte exterior muito ruidosa.

Os auscultadores com IA filtram o ruído para que possa ouvir uma só voz no meio da multidão

Com que rapidez é que a IA consegue processar a voz do orador e eliminar os sons indesejados? Nos testes, os investigadores descobriram que o seu sistema apresentava uma latência de ponta a ponta de 18,24 milissegundos. Para termos uma perspetiva, um piscar de olhos dura normalmente entre 300 e 400 milissegundos.

Isto significa que não existe praticamente nenhum atraso entre olhar para alguém que se quer ouvir e ouvir apenas a sua voz através dos auscultadores; o processo ocorre em tempo real.

Avaliação pelos Participantes

Os investigadores forneceram o seu sistema THS a 21 participantes, que avaliaram as capacidades de supressão de ruído dos auscultadores em ambientes interiores e exteriores reais.

Em média, os participantes classificaram a clareza da voz do orador quase duas vezes mais do que quando não foi processada.

O sistema THS baseia-se na tecnologia de “audição semântica” desenvolvida anteriormente pelos investigadores da UW. Semelhante à THS, esta tecnologia utilizava um algoritmo de IA que funcionava num smartphone ligado sem fios a auscultadores com cancelamento de ruído. O sistema de audição semântica podia identificar ruídos específicos, como o canto dos pássaros, sirenes e alarmes.

Atualmente, o novo sistema só pode filtrar um altifalante alvo de cada vez e apenas quando não há outra voz alta a emanar da mesma direção que o altifalante. No entanto, se o utilizador dos auscultadores estiver insatisfeito com a qualidade do som, tem a opção de reamostrar a voz do altifalante para aumentar a clareza.

Os investigadores estão a trabalhar ativamente na expansão do seu sistema para incluir auriculares e aparelhos auditivos. Além disso, tornaram o seu código THS acessível ao público no GitHub para incentivar o seu desenvolvimento. É importante notar que o sistema ainda não está disponível para compra comercial.

Os investigadores apresentaram as suas descobertas no início deste mês na conferência da Association of Computing Machinery (ACM) Computer-Human Interaction (CHI) sobre Human Factors in Computing Systems em Honolulu, Hawai’i, onde receberam uma Menção Honrosa. O artigo de investigação não publicado está disponível para revisão aqui.


Leia o Artigo Original New Atlas

Leia mais Tecnologia de Aceleradores de Partículas do CERN Trata agora Tumores Cerebrais

Share this post