Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão
Os investigadores integraram a IA em auscultadores normais para isolar a voz de um único orador numa multidão ruidosa, bastando para isso olhar para ele. O código para este sistema avançado de cancelamento de ruído está disponível gratuitamente para qualquer pessoa interessada em construir a sua própria versão.
Ouvir uma pessoa num ambiente cheio de gente e ruidoso, onde muitas pessoas estão a falar, pode ser um desafio, especialmente para quem tem dificuldades auditivas. Embora os aparelhos auditivos modernos utilizem tecnologia de cancelamento de ruído, não conseguem eliminar completamente o ruído de fundo.
Melhorar a Audição em Ambientes Ruidosos
Os investigadores da Universidade de Washington (UW) criaram uma solução para melhorar a audição em ambientes ruidosos. Ao equipar os auscultadores normais com cancelamento de ruído com IA, desenvolveram um sistema que consegue focar a voz de um orador quando o utilizador olha para ele.
“Hoje em dia, associamos frequentemente a IA a chatbots baseados na Web que respondem a perguntas”, disse Shyam Gollakota, professor da Escola de Ciências e Engenharia Informática Paul G. Allen da UW e autor sénior do estudo. “No entanto, neste projeto, desenvolvemos IA para melhorar a perceção auditiva de quem usa auscultadores de acordo com as suas preferências. Os nossos dispositivos permitem ouvir claramente um único altifalante, mesmo num ambiente ruidoso com muitas pessoas a falar.”
O sistema “target speech hearing” (THS) criado pelos investigadores é simples mas muito eficaz. Os auscultadores normais estão equipados com dois microfones, um em cada auricular.
Quando o utilizador olha para a pessoa que quer ouvir e prime um botão na parte lateral dos auscultadores durante três a cinco segundos, as ondas sonoras da voz desse orador chegam aos dois microfones simultaneamente (com uma margem de erro de 16 graus).
Análise de Sinal e Isolamento de voz
Estes sinais são enviados para um computador de bordo, onde o software de aprendizagem automática analisa os padrões vocais do orador. Em seguida, o sistema isola a voz do orador e canaliza-a através dos auscultadores, mesmo que este se mova, ao mesmo tempo que filtra o ruído de fundo.
O vídeo abaixo demonstra a eficácia dos auscultadores, mostrando a sua capacidade de eliminar rapidamente o ruído ambiente e de se concentrar no orador. Isto inclui a remoção do ruído de uma pessoa próxima a falar ao telemóvel dentro de casa e o som de uma fonte exterior muito ruidosa.
Com que rapidez é que a IA consegue processar a voz do orador e eliminar os sons indesejados? Nos testes, os investigadores descobriram que o seu sistema apresentava uma latência de ponta a ponta de 18,24 milissegundos. Para termos uma perspetiva, um piscar de olhos dura normalmente entre 300 e 400 milissegundos.
Isto significa que não existe praticamente nenhum atraso entre olhar para alguém que se quer ouvir e ouvir apenas a sua voz através dos auscultadores; o processo ocorre em tempo real.
Avaliação pelos Participantes
Os investigadores forneceram o seu sistema THS a 21 participantes, que avaliaram as capacidades de supressão de ruído dos auscultadores em ambientes interiores e exteriores reais.
Em média, os participantes classificaram a clareza da voz do orador quase duas vezes mais do que quando não foi processada.
O sistema THS baseia-se na tecnologia de “audição semântica” desenvolvida anteriormente pelos investigadores da UW. Semelhante à THS, esta tecnologia utilizava um algoritmo de IA que funcionava num smartphone ligado sem fios a auscultadores com cancelamento de ruído. O sistema de audição semântica podia identificar ruídos específicos, como o canto dos pássaros, sirenes e alarmes.
Atualmente, o novo sistema só pode filtrar um altifalante alvo de cada vez e apenas quando não há outra voz alta a emanar da mesma direção que o altifalante. No entanto, se o utilizador dos auscultadores estiver insatisfeito com a qualidade do som, tem a opção de reamostrar a voz do altifalante para aumentar a clareza.
Os investigadores estão a trabalhar ativamente na expansão do seu sistema para incluir auriculares e aparelhos auditivos. Além disso, tornaram o seu código THS acessível ao público no GitHub para incentivar o seu desenvolvimento. É importante notar que o sistema ainda não está disponível para compra comercial.
Os investigadores apresentaram as suas descobertas no início deste mês na conferência da Association of Computing Machinery (ACM) Computer-Human Interaction (CHI) sobre Human Factors in Computing Systems em Honolulu, Hawai’i, onde receberam uma Menção Honrosa. O artigo de investigação não publicado está disponível para revisão aqui.
Leia o Artigo Original New Atlas
Leia mais Tecnologia de Aceleradores de Partículas do CERN Trata agora Tumores Cerebrais