Anthropic Apresenta um Novo Modelo de IA Capaz de Raciocínio Alargado durante o Tempo Necessário

Anthropic Apresenta um Novo Modelo de IA Capaz de Raciocínio Alargado durante o Tempo Necessário

Créditos da imagem: Anthropic

A Anthropic apresenta o Claude 3.7 Sonnet, um modelo de IA da próxima geração concebido para “pensar” nas perguntas durante o tempo que os utilizadores preferirem.

Descrito como o primeiro “modelo híbrido de raciocínio de IA” da indústria, o Claude 3.7 Sonnet pode fornecer tanto respostas instantâneas como respostas mais profundas e deliberadas. Os utilizadores têm a opção de ativar o seu modo de raciocínio, permitindo que a IA processe as perguntas durante um período mais curto ou mais longo.

Este modelo está de acordo com o objetivo do Anthropic de simplificar as interações da IA. Muitos chatbots de IA actuais exigem que os utilizadores escolham entre vários modelos com custos e capacidades variáveis. O Anthropic pretende simplificar este processo, oferecendo um único modelo que permite realizar tarefas de raciocínio rápidas e complexas.

O Claude 3.7 Sonnet é lançado na segunda-feira para todos os utilizadores e programadores. No entanto, apenas os subscritores dos planos premium Claude da Anthropic terão acesso às suas funcionalidades de raciocínio. Os utilizadores gratuitos receberão uma versão standard sem raciocínio avançado, embora a Anthropic afirme que ainda supera o modelo anterior, o Claude 3.5 Sonnet. (A empresa omitiu notavelmente o número da versão).

Preços e comparações

O preço do Claude 3.7 Sonnet está fixado em US$ 3 por milhão de tokens de entrada – equivalente a cerca de 750.000 palavras, mais do que toda a trilogia O Senhor dos Anéis – e US$ 15 por milhão de tokens de saída. Embora isso o torne mais caro do que o o3-mini da OpenAI (US$ 1,10 por milhão de tokens de entrada/US$ 4,40 por milhão de tokens de saída) e o R1 da DeepSeek (55 centavos por milhão de tokens de entrada/US$ 2,19 por milhão de tokens de saída), esses modelos são especializados apenas em raciocínio, enquanto o Claude 3.7 Sonnet integra recursos de raciocínio em tempo real e estendido.

Os novos modos de pensar do Anthropic Imagem. Créditos:Anthropic

O Claude 3.7 Sonnet é o primeiro modelo de IA da Anthropic concebido para “raciocínio”, uma técnica cada vez mais adoptada pelos laboratórios de IA à medida que as melhorias de desempenho tradicionais abrandam.

Modelos como o o3-mini, o R1, o Gemini 2.0 Flash Thinking da Google e o Grok 3 (Think) da xAI requerem mais tempo e poder de computação antes de gerar respostas. Ao dividir os problemas em passos mais pequenos, estes modelos aumentam normalmente a precisão. Embora não pensem ou raciocinem como os humanos, a sua abordagem é inspirada em processos dedutivos.

Automatização futura do raciocínio da IA

A Anthropic pretende que as futuras versões do Claude determinem por si próprias quanto tempo devem “pensar” sobre as perguntas, eliminando a necessidade de os utilizadores fazerem essa escolha manualmente, de acordo com Dianne Penn, líder de produto e investigação da empresa, numa entrevista ao TechCrunch.

Numa publicação de blogue partilhada com o TechCrunch, a Anthropic comparou esta abordagem à cognição humana: “Tal como as pessoas não têm cérebros separados para respostas imediatas versus pensamento profundo, acreditamos que o raciocínio deve ser uma capacidade integrada num modelo de fronteira e não uma caraterística confinada a um sistema separado.”

Para aumentar a transparência, o Claude 3.7 Sonnet inclui um “bloco de notas visível” que revela o seu processo de planeamento interno. Penn observou que, embora os utilizadores possam ver a maior parte do raciocínio da IA, algumas partes podem ser editadas por razões de confiança e segurança.

O processo de pensamento de Claude na imagem da aplicação claude. Créditos:Anthropic

O Anthropic ajustou os modos de raciocínio do Claude para aplicações práticas, tais como a resolução de desafios de codificação complexos e o tratamento de tarefas autónomas. Os programadores que utilizam a API do Anthropic podem ajustar o “orçamento de raciocínio” do modelo, equilibrando a velocidade e o custo com a qualidade da resposta.

Nas avaliações de codificação do mundo real, o Claude 3.7 Sonnet demonstrou um forte desempenho. No SWE-Bench, uma referência para tarefas de codificação, alcançou 62,3% de precisão, superando o o3-mini da OpenAI, que obteve 49,3%. No TAU-Bench, um teste que avalia a interação da IA com utilizadores simulados e APIs externas num ambiente de retalho, o Claude 3.7 Sonnet obteve 81,2%, superando o modelo o1 da OpenAI com 73,5%.

Flexibilidade de resposta melhorada

A Anthropic também afirma que o Claude 3.7 Sonnet tem menos probabilidades de recusar pedidos válidos do que as versões anteriores. O modelo foi concebido para distinguir melhor entre pedidos prejudiciais e benignos, reduzindo as recusas desnecessárias em 45% em comparação com o Claude 3.5 Sonnet. Esta mudança surge numa altura em que alguns laboratórios de IA estão a reconsiderar a sua abordagem às restrições de conteúdos.

Juntamente com o Claude 3.7 Sonnet, a Anthropic está a introduzir o Claude Code, uma ferramenta de codificação agêntica lançada como uma pré-visualização de investigação. Esta ferramenta permite que os programadores executem tarefas diretamente a partir do seu terminal. Numa demonstração, os funcionários da Anthropic mostraram como um simples comando como “Explique a estrutura deste projeto” permite ao Claude Code analisar uma base de código. Os programadores podem modificar o código utilizando uma linguagem simples, enquanto a ferramenta explica as suas edições, testa a existência de erros e até envia as actualizações para o GitHub.

O Claude Code estará inicialmente disponível para um número limitado de utilizadores, por ordem de chegada, de acordo com um porta-voz da Anthropic.

A Anthropic está a lançar o Claude 3.7 Sonnet numa altura em que os laboratórios de IA estão a lançar rapidamente novos modelos. A empresa tem tradicionalmente adotado uma abordagem cautelosa e centrada na segurança, mas com este lançamento pretende marcar o ritmo. No entanto, a concorrência aproxima-se – o diretor executivo da OpenAI, Sam Altman, deu a entender que a OpenAI poderá introduzir o seu próprio modelo híbrido de IA dentro de meses.


Leia o Artigo Original: TechCrunch

Leia mais: iOS 18.4 Introduzirá as Notificações Prioritárias com base na Inteligência da Apple

Share this post