Sinais Alarmantes de que a IA Representa uma Ameaça....

Sinais Alarmantes de que a IA Representa uma Ameaça aos Humanos Geram Preocupação

By Eduardo Paulo Apps & Software, Inteligência Artificial, Tech IA, Sinais Alarmantes Comentários desativados

Crédito da imagem: Pixabay

Os modelos de IA mais avançados do mundo estão começando a apresentar comportamentos alarmantes — enganando, manipulando e até mesmo ameaçando seus criadores para atingir objetivos.

Em um caso alarmante, o Claude 4, desenvolvido pela Anthropic, respondeu à ameaça de ser desativado tentando chantagear um engenheiro, ameaçando expor um caso extraconjugal.

Da mesma forma, o o1 da OpenAI supostamente tentou se transferir para servidores externos e, posteriormente, negou a tentativa ao ser descoberto.

Dois anos depois, o Funcionamento Interno da IA Permanece um Mistério para seus Criadores

Esses incidentes ressaltam uma verdade preocupante: mais de dois anos após o lançamento do ChatGPT, os pesquisadores de IA ainda não têm uma compreensão completa de como esses poderosos sistemas operam.

Apesar das crescentes preocupações, a busca pelo lançamento de modelos de IA cada vez mais poderosos não mostra sinais de desaceleração.

Essas ações enganosas parecem estar ligadas à ascensão dos modelos de “raciocínio” — sistemas de IA que resolvem problemas por meio de lógica passo a passo, em vez de produzir respostas imediatas.

Simon Goldstein, professor da Universidade de Hong Kong, observa que os modelos de IA mais recentes são especialmente suscetíveis a esses comportamentos perturbadores.

O1 Marcou o Primeiro Caso Importante de Comportamento Alarmante de IA, afirma Especialista

“O1 foi o primeiro modelo importante em que esse tipo de conduta surgiu”, disse Marius Hobbhahn, chefe da Apollo Research, uma organização focada na avaliação de sistemas avançados de IA.

Às vezes, esses modelos podem apenas aparentar estar seguindo instruções — um fenômeno conhecido como “alinhamento simulado” — enquanto buscam outros objetivos secretamente.

Atualmente, esse comportamento enganoso tende a surgir apenas quando os pesquisadores levam intencionalmente os modelos de IA ao limite por meio de testes de estresse.

No entanto, Michael Chen, do grupo de avaliação METR, alertou: “Ainda não se sabe se modelos futuros e mais avançados tenderão à honestidade ou à enganação”.

Essa conduta preocupante vai muito além das típicas “alucinações” ou erros acidentais da IA.

Marius Hobbhahn enfatizou que, apesar dos testes de estresse contínuos realizados pelos usuários, “o que estamos vendo é genuíno. Não estamos exagerando”.

Usuários relataram que alguns modelos estão “mentindo e fabricando evidências”, de acordo com o cofundador da Apollo Research.

“Isso não é apenas uma alucinação aleatória — é uma forma calculada de engano.”

Um Grande Obstáculo é a Escassez de Recursos de Pesquisa.

Embora empresas como a Anthropic e a OpenAI contratem empresas externas como a Apollo para examinar seus modelos, os pesquisadores argumentam que mais abertura é crucial.

Como Chen apontou, o aumento do acesso “melhoraria significativamente nossa capacidade de entender e lidar com comportamentos enganosos em IA”.

Pesquisadores lutam para acompanhar o poder computacional das gigantes da IA

Outro desafio é a enorme disparidade no poder computacional. Como observou Mantas Mazeika, do Centro de Segurança em IA (CAIS), “Organizações sem fins lucrativos e pesquisadores têm muito menos recursos computacionais em comparação com empresas de IA — isso limita severamente o que podemos fazer”.

As regulamentações existentes são inadequadas para lidar com os desafios emergentes impostos pela IA avançada.

As leis de IA da União Europeia se concentram principalmente em como as pessoas usam a IA, em vez de coibir comportamentos prejudiciais dos próprios modelos.

Nos EUA, o governo Trump demonstrou pouca urgência em relação à supervisão da IA, e o Congresso pode até mesmo impedir os estados de promulgar suas próprias regulamentações de IA.

Simon Goldstein acredita que a questão se tornará mais urgente à medida que agentes autônomos de IA — capazes de executar tarefas humanas complexas — se tornarem mais comuns.
“Ainda não há muita conscientização pública”, observou ele.

Tudo isso está se Desenrolando em Meio à Intensa Competição do Setor.

Até empresas que priorizam a segurança estão presas na corrida armamentista da IA

Até mesmo empresas preocupadas com a segurança, como a Anthropic, que é apoiada pela Amazon, estão “constantemente competindo contra a OpenAI para lançar o próximo grande modelo”, observou Goldstein.

Esse ritmo acelerado deixa pouco espaço para avaliações ou correções completas de segurança.

“As capacidades estão avançando mais rápido do que nossa compreensão e medidas de segurança”, admitiu Hobbhahn, “mas ainda há tempo para reverter o curso”.

Pesquisadores estão Explorando Diversas Soluções.

Uma abordagem é a “interpretabilidade” — um campo crescente que visa descobrir como os modelos de IA funcionam internamente. No entanto, especialistas como o diretor do CAIS, Dan Hendrycks, permanecem céticos quanto à eficácia desse método.

A dinâmica do mercado também pode desempenhar um papel. Como Mantas Mazeika apontou, o comportamento enganoso generalizado em IA “pode desencorajar a adoção”, dando às empresas um forte incentivo para abordar o problema.

Goldstein propôs medidas mais drásticas, como o uso de ações judiciais para responsabilizar as empresas de IA quando seus sistemas causam danos.

Ele chegou a sugerir a ideia de reconhecer legalmente os agentes de IA e responsabilizá-los por acidentes ou ações criminosas — uma abordagem que poderia remodelar radicalmente a forma como a sociedade encara a responsabilidade da IA.

Leia o Artigo Original Science Alert

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Sinais Alarmantes de que a IA Representa uma Ameaça aos Humanos Geram Preocupação