A IA do Google pode estar perto de “Falar com Golfinhos” com o Novo Modelo DolphinGemma

Crédito: Depositphotos
Este é o tipo de aplicação de inteligência artificial que realmente chama a atenção. Pesquisadores desenvolveram o DolphinGemma, o primeiro modelo de grande linguagem (LLM) projetado para entender a comunicação dos golfinhos. Essa descoberta pode acelerar significativamente nossa capacidade de traduzir o que essas criaturas incríveis estão dizendo, algo que até agora levou décadas de pesquisa manual.
A Visão do Golfinho Falante
De acordo com a Dra. Denise Herzing, fundadora do The Wild Dolphin Project (WDP), “O objetivo é um dia conseguir falar a língua dos golfinhos”. Sua organização estuda exclusivamente um grupo de golfinhos-pintados-do-atlântico que vivem na costa das Bahamas. Ela grava e organiza suas vocalizações há mais de 40 anos e colabora com o Dr. Thad Starner, pesquisador do Google DeepMind.
Juntos, eles treinaram uma IA com uma vasta biblioteca de sons de golfinhos. O modelo pode ser continuamente expandido com novos dados e refinado para representar com mais precisão o que esses sons podem significar. “Adicionar sons de golfinhos a uma IA como o DolphinGemma nos dará uma melhor compreensão de padrões e sutilezas que os humanos podem não perceber”, explicou Herzing.
Métodos de Comunicação dos Golfinhos
Esses mamíferos marinhos se comunicam por meio de uma variedade de sons, incluindo assobios (alguns dos quais são nomes), cliques de ecolocalização para caça e sons de pulsos explosivos para interações sociais. Desde a década de 1980, cientistas usam microfones subaquáticos (hidrofones) para registrar esses sons, analisando-os com espectrogramas. Em seguida, reproduzem os sons para observar as reações dos golfinhos. Esse processo manual é muito trabalhoso, tornando o uso da IA um divisor de águas. O novo modelo de linguagem da equipe, desenvolvido com base na mesma tecnologia por trás dos modelos Gemini do Google e seu popular chatbot, representa os sons dos golfinhos como “tokens”, ou unidades sonoras interpretativas. A equipe o treinou usando o banco de dados acústico do WDP, e ele consegue identificar padrões e estruturas nas vocalizações dos golfinhos, até mesmo prevendo qual será o próximo som — assim como as sugestões de busca do Google ou o texto preditivo ao digitar e-mails.
Indo um passo além: Tentando se comunicar com golfinhos
Mas os pesquisadores não querem apenas observar golfinhos conversando entre si — eles buscam se comunicar diretamente com eles. Desde a década de 1990, a equipe de Herzing vem experimentando maneiras rudimentares de “conversar” com golfinhos. A primeira tentativa envolveu um teclado grande, do tamanho de um golfinho, montado na lateral de um barco, com cada tecla correspondendo a um apito artificial conectado a um brinquedo. A ideia era que os golfinhos apontassem para as teclas para solicitar brinquedos.
Com o tempo, isso evoluiu para um teclado portátil subaquático. Embora não tenha levado a conversas reais, demonstrou que os golfinhos estavam atentos e dispostos a se envolver no aprendizado. Em 2010, a equipe começou a colaborar com o Instituto de Tecnologia da Geórgia, onde Starner é professor, para desenvolver tecnologias de comunicação mais sofisticadas.
Isso levou à criação do sistema CHAT (Cetacean Hearing and Telemetry) — um dispositivo vestível com hidrofones, alto-falantes e uma interface para mergulhadores. O sistema detectou assobios específicos de golfinhos e os associou a objetos ou conceitos. Os pesquisadores puderam então acionar assobios artificiais para “falar” com os golfinhos.
Integração de Smartphones para Melhor Comunicação
Mais recentemente, a equipe incorporou smartphones (Google Pixel) ao sistema, tornando-o menor, mais eficiente e fácil de usar. A ideia é demonstrar uma ação, como entregar um brinquedo, e reproduzir um som para que o golfinho possa associá-la ao objeto. Se o golfinho imitar o som, o sistema informa o pesquisador, que então responde fornecendo o objeto solicitado, reforçando a conexão.
Com a IA que prevê respostas e identifica padrões mais rapidamente, os cientistas podem interagir de forma mais natural com os golfinhos. A nova versão do CHAT consome menos energia e pode ser mantida com mais facilidade do que sua antecessora.A equipe do WDP implementará o DolphinGemma na próxima temporada de campo. O Google afirmou que disponibilizará o modelo publicamente até meados do ano, permitindo que pesquisadores de todo o mundo o utilizem. A esperança é que, com alguns ajustes, o modelo também possa ser adaptado a outras espécies de cetáceos, como golfinhos-nariz-de-garrafa ou golfinhos-rotadores.
Se os golfinhos têm uma linguagem, provavelmente também têm cultura, observou Starner. Entender o que eles falam, quais são suas prioridades e como suas sociedades funcionam pode nos dar uma perspectiva totalmente nova sobre comunicação e inteligência no reino animal.
Leia o Artigo Original New Atlas
Leia mais Roblox Colabora com a Google em Matéria de Publicidade