Auscultadores de Audição Selectiva: Ouvir Claramente no Meio...

Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão

By Jorge Paka Inteligência Artificial, Tech Auscultadores de Audição Selectiva Comentários desativados

Auscultadores que utilizam a IA para destacar uma voz num espaço lotado.
Universidade de Washington

Os investigadores integraram a IA em auscultadores normais para isolar a voz de um único orador numa multidão ruidosa, bastando para isso olhar para ele. O código para este sistema avançado de cancelamento de ruído está disponível gratuitamente para qualquer pessoa interessada em construir a sua própria versão.

Ouvir uma pessoa num ambiente cheio de gente e ruidoso, onde muitas pessoas estão a falar, pode ser um desafio, especialmente para quem tem dificuldades auditivas. Embora os aparelhos auditivos modernos utilizem tecnologia de cancelamento de ruído, não conseguem eliminar completamente o ruído de fundo.

Melhorar a Audição em Ambientes Ruidosos

Os investigadores da Universidade de Washington (UW) criaram uma solução para melhorar a audição em ambientes ruidosos. Ao equipar os auscultadores normais com cancelamento de ruído com IA, desenvolveram um sistema que consegue focar a voz de um orador quando o utilizador olha para ele.

“Hoje em dia, associamos frequentemente a IA a chatbots baseados na Web que respondem a perguntas”, disse Shyam Gollakota, professor da Escola de Ciências e Engenharia Informática Paul G. Allen da UW e autor sénior do estudo. “No entanto, neste projeto, desenvolvemos IA para melhorar a perceção auditiva de quem usa auscultadores de acordo com as suas preferências. Os nossos dispositivos permitem ouvir claramente um único altifalante, mesmo num ambiente ruidoso com muitas pessoas a falar.”

Os auscultadores disponíveis no mercado estão equipados com microfones e um botão.
Universidade de Washington

O sistema “target speech hearing” (THS) criado pelos investigadores é simples mas muito eficaz. Os auscultadores normais estão equipados com dois microfones, um em cada auricular.

Quando o utilizador olha para a pessoa que quer ouvir e prime um botão na parte lateral dos auscultadores durante três a cinco segundos, as ondas sonoras da voz desse orador chegam aos dois microfones simultaneamente (com uma margem de erro de 16 graus).

Análise de Sinal e Isolamento de voz

Estes sinais são enviados para um computador de bordo, onde o software de aprendizagem automática analisa os padrões vocais do orador. Em seguida, o sistema isola a voz do orador e canaliza-a através dos auscultadores, mesmo que este se mova, ao mesmo tempo que filtra o ruído de fundo.

O vídeo abaixo demonstra a eficácia dos auscultadores, mostrando a sua capacidade de eliminar rapidamente o ruído ambiente e de se concentrar no orador. Isto inclui a remoção do ruído de uma pessoa próxima a falar ao telemóvel dentro de casa e o som de uma fonte exterior muito ruidosa.

Os auscultadores com IA filtram o ruído para que possa ouvir uma só voz no meio da multidão

Com que rapidez é que a IA consegue processar a voz do orador e eliminar os sons indesejados? Nos testes, os investigadores descobriram que o seu sistema apresentava uma latência de ponta a ponta de 18,24 milissegundos. Para termos uma perspetiva, um piscar de olhos dura normalmente entre 300 e 400 milissegundos.

Isto significa que não existe praticamente nenhum atraso entre olhar para alguém que se quer ouvir e ouvir apenas a sua voz através dos auscultadores; o processo ocorre em tempo real.

Avaliação pelos Participantes

Os investigadores forneceram o seu sistema THS a 21 participantes, que avaliaram as capacidades de supressão de ruído dos auscultadores em ambientes interiores e exteriores reais.

Em média, os participantes classificaram a clareza da voz do orador quase duas vezes mais do que quando não foi processada.

O sistema THS baseia-se na tecnologia de “audição semântica” desenvolvida anteriormente pelos investigadores da UW. Semelhante à THS, esta tecnologia utilizava um algoritmo de IA que funcionava num smartphone ligado sem fios a auscultadores com cancelamento de ruído. O sistema de audição semântica podia identificar ruídos específicos, como o canto dos pássaros, sirenes e alarmes.

Atualmente, o novo sistema só pode filtrar um altifalante alvo de cada vez e apenas quando não há outra voz alta a emanar da mesma direção que o altifalante. No entanto, se o utilizador dos auscultadores estiver insatisfeito com a qualidade do som, tem a opção de reamostrar a voz do altifalante para aumentar a clareza.

Os investigadores estão a trabalhar ativamente na expansão do seu sistema para incluir auriculares e aparelhos auditivos. Além disso, tornaram o seu código THS acessível ao público no GitHub para incentivar o seu desenvolvimento. É importante notar que o sistema ainda não está disponível para compra comercial.

Os investigadores apresentaram as suas descobertas no início deste mês na conferência da Association of Computing Machinery (ACM) Computer-Human Interaction (CHI) sobre Human Factors in Computing Systems em Honolulu, Hawai’i, onde receberam uma Menção Honrosa. O artigo de investigação não publicado está disponível para revisão aqui.

Leia o Artigo Original New Atlas

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão

Auscultadores de Audição Seletiva: Ouvir Claramente no Meio de uma Multidão

Melhorar a Audição em Ambientes Ruidosos

Análise de Sinal e Isolamento de voz

Avaliação pelos Participantes

Share this post

Author

Related Posts