Anthropic Apresenta um Novo Modelo de IA Capaz de Raciocínio Alargado durante o Tempo Necessário

By Jorge Paka Inteligência Artificial Anthropic, IA Comentários desativados

Créditos da imagem: Anthropic

A Anthropic apresenta o Claude 3.7 Sonnet, um modelo de IA da próxima geração concebido para “pensar” nas perguntas durante o tempo que os utilizadores preferirem.

Descrito como o primeiro “modelo híbrido de raciocínio de IA” da indústria, o Claude 3.7 Sonnet pode fornecer tanto respostas instantâneas como respostas mais profundas e deliberadas. Os utilizadores têm a opção de ativar o seu modo de raciocínio, permitindo que a IA processe as perguntas durante um período mais curto ou mais longo.

Este modelo está de acordo com o objetivo do Anthropic de simplificar as interações da IA. Muitos chatbots de IA actuais exigem que os utilizadores escolham entre vários modelos com custos e capacidades variáveis. O Anthropic pretende simplificar este processo, oferecendo um único modelo que permite realizar tarefas de raciocínio rápidas e complexas.

O Claude 3.7 Sonnet é lançado na segunda-feira para todos os utilizadores e programadores. No entanto, apenas os subscritores dos planos premium Claude da Anthropic terão acesso às suas funcionalidades de raciocínio. Os utilizadores gratuitos receberão uma versão standard sem raciocínio avançado, embora a Anthropic afirme que ainda supera o modelo anterior, o Claude 3.5 Sonnet. (A empresa omitiu notavelmente o número da versão).

Preços e comparações

O preço do Claude 3.7 Sonnet está fixado em US$ 3 por milhão de tokens de entrada – equivalente a cerca de 750.000 palavras, mais do que toda a trilogia O Senhor dos Anéis – e US$ 15 por milhão de tokens de saída. Embora isso o torne mais caro do que o o3-mini da OpenAI (US$ 1,10 por milhão de tokens de entrada/US$ 4,40 por milhão de tokens de saída) e o R1 da DeepSeek (55 centavos por milhão de tokens de entrada/US$ 2,19 por milhão de tokens de saída), esses modelos são especializados apenas em raciocínio, enquanto o Claude 3.7 Sonnet integra recursos de raciocínio em tempo real e estendido.

Os novos modos de pensar do Anthropic Imagem. Créditos:Anthropic

O Claude 3.7 Sonnet é o primeiro modelo de IA da Anthropic concebido para “raciocínio”, uma técnica cada vez mais adoptada pelos laboratórios de IA à medida que as melhorias de desempenho tradicionais abrandam.

Modelos como o o3-mini, o R1, o Gemini 2.0 Flash Thinking da Google e o Grok 3 (Think) da xAI requerem mais tempo e poder de computação antes de gerar respostas. Ao dividir os problemas em passos mais pequenos, estes modelos aumentam normalmente a precisão. Embora não pensem ou raciocinem como os humanos, a sua abordagem é inspirada em processos dedutivos.

Automatização futura do raciocínio da IA

A Anthropic pretende que as futuras versões do Claude determinem por si próprias quanto tempo devem “pensar” sobre as perguntas, eliminando a necessidade de os utilizadores fazerem essa escolha manualmente, de acordo com Dianne Penn, líder de produto e investigação da empresa, numa entrevista ao TechCrunch.

Numa publicação de blogue partilhada com o TechCrunch, a Anthropic comparou esta abordagem à cognição humana: “Tal como as pessoas não têm cérebros separados para respostas imediatas versus pensamento profundo, acreditamos que o raciocínio deve ser uma capacidade integrada num modelo de fronteira e não uma caraterística confinada a um sistema separado.”

Para aumentar a transparência, o Claude 3.7 Sonnet inclui um “bloco de notas visível” que revela o seu processo de planeamento interno. Penn observou que, embora os utilizadores possam ver a maior parte do raciocínio da IA, algumas partes podem ser editadas por razões de confiança e segurança.

O processo de pensamento de Claude na imagem da aplicação claude. Créditos:Anthropic

O Anthropic ajustou os modos de raciocínio do Claude para aplicações práticas, tais como a resolução de desafios de codificação complexos e o tratamento de tarefas autónomas. Os programadores que utilizam a API do Anthropic podem ajustar o “orçamento de raciocínio” do modelo, equilibrando a velocidade e o custo com a qualidade da resposta.

Nas avaliações de codificação do mundo real, o Claude 3.7 Sonnet demonstrou um forte desempenho. No SWE-Bench, uma referência para tarefas de codificação, alcançou 62,3% de precisão, superando o o3-mini da OpenAI, que obteve 49,3%. No TAU-Bench, um teste que avalia a interação da IA com utilizadores simulados e APIs externas num ambiente de retalho, o Claude 3.7 Sonnet obteve 81,2%, superando o modelo o1 da OpenAI com 73,5%.

Flexibilidade de resposta melhorada

A Anthropic também afirma que o Claude 3.7 Sonnet tem menos probabilidades de recusar pedidos válidos do que as versões anteriores. O modelo foi concebido para distinguir melhor entre pedidos prejudiciais e benignos, reduzindo as recusas desnecessárias em 45% em comparação com o Claude 3.5 Sonnet. Esta mudança surge numa altura em que alguns laboratórios de IA estão a reconsiderar a sua abordagem às restrições de conteúdos.

Juntamente com o Claude 3.7 Sonnet, a Anthropic está a introduzir o Claude Code, uma ferramenta de codificação agêntica lançada como uma pré-visualização de investigação. Esta ferramenta permite que os programadores executem tarefas diretamente a partir do seu terminal. Numa demonstração, os funcionários da Anthropic mostraram como um simples comando como “Explique a estrutura deste projeto” permite ao Claude Code analisar uma base de código. Os programadores podem modificar o código utilizando uma linguagem simples, enquanto a ferramenta explica as suas edições, testa a existência de erros e até envia as actualizações para o GitHub.

O Claude Code estará inicialmente disponível para um número limitado de utilizadores, por ordem de chegada, de acordo com um porta-voz da Anthropic.

A Anthropic está a lançar o Claude 3.7 Sonnet numa altura em que os laboratórios de IA estão a lançar rapidamente novos modelos. A empresa tem tradicionalmente adotado uma abordagem cautelosa e centrada na segurança, mas com este lançamento pretende marcar o ritmo. No entanto, a concorrência aproxima-se – o diretor executivo da OpenAI, Sam Altman, deu a entender que a OpenAI poderá introduzir o seu próprio modelo híbrido de IA dentro de meses.

Leia o Artigo Original: TechCrunch

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Anthropic Apresenta um Novo Modelo de IA Capaz de Raciocínio Alargado durante o Tempo Necessário