Por que ele Pode Superar o ChatGPT na Corrida da IA

Por que ele Pode Superar o ChatGPT na Corrida da IA

 

Crédito: Futuro Prossimo

Alex Albert, da Anthropic, não se conteve: “O Claude 4 é o melhor modelo de programação do mundo”. Uma afirmação ousada — mas os dados parecem sustentá-la. Com uma pontuação de 72,5% no benchmark SWE-bench Verified, rodando de forma autônoma por horas a fio e lidando com milhares de etapas sequenciais, o Claude 4 não é apenas mais uma atualização. É uma mudança no que esperamos que a IA faça. E a melhor parte? Você pode experimentar agora mesmo.

Quando a IA vira a noite

A Anthropic causou sensação hoje com o lançamento do Claude 4 Opus e do Claude 4 Sonnet — marcando seu retorno aos modelos em escala real após meses refinando variantes do Sonnet. O que realmente se destaca é a resistência do Claude 4: ele pode permanecer operacional por 24 horas seguidas sem perder precisão ou contexto.

Isso mesmo. Enquanto seu colega desenvolvedor pode começar a reclamar após oito horas de depuração, o Claude 4 Opus demonstrou jogar Pokémon sem parar ou refatorar código por sete horas seguidas. Os modelos mais antigos geralmente atingiam seu limite após algumas horas. Como disse Alex Albert: “Há uma demanda enorme por aplicativos baseados em agentes, e o Claude 4 se encaixa perfeitamente nesse papel.

Crédito:O e-mail que recebi algumas horas atrás. Daí em diante foi só testar, testar, testar.

Os números que estão deixando os rivais nervosos

Pense em benchmarks como pôquer — e o Claude 4 acaba de fazer um royal flush. Com 72,5% no teste SWE-bench Verified, ele deixa os modelos anteriores para trás. Para contextualizar, atingir mais de 50% já foi visto como uma grande vitória. Ele também obteve sólidos 43,2% no Terminal-bench.

O impacto foi imediato: o GitHub adotou o Claude 4 Sonnet como base para seu mais recente agente de codificação Copilot. Esse tipo de mudança não acontece sem um bom motivo. A Sourcegraph chamou isso de “um grande salto no desenvolvimento de software” e a Augment Code relatou “maiores taxas de sucesso e alterações de código mais limpas e precisas“. Resumindo, todos querem um ingresso no expresso Claude 4.

Claude 4: Poderoso, mas construído com a segurança em mente

A Anthropic ativou seu protocolo de segurança de IA de Nível 3 pela primeira vez — normalmente reservado para modelos com potencial para auxiliar no desenvolvimento de armas químicas, biológicas ou nucleares. O Claude 4 Opus é tão poderoso que exige salvaguardas rigorosas para evitar o uso indevido.

Apresentando o Modo “Pensamento Profundo

Um recurso de destaque do Claude 4 é a capacidade de alternar entre respostas rápidas e raciocínios mais profundos e deliberados. Ative o modo de pensamento estendido e o modelo leva um momento para “pensar” — até mesmo mostrando uma prévia do que está processando. É como ter um colega que lhe explica a lógica em vez de apenas dar a resposta.

A integração com o Claude Code também está amplamente disponível, completa com GitHub Actions e suporte integrado para VS Code e JetBrains. As alterações de código sugeridas aparecem diretamente nos seus arquivos — chega de copiar e colar tediosos. É perfeito.

Uma aposta multibilionária que está dando resultado

A Anthropic agora gera mais de US$ 2 bilhões em receita anualizada, dobrando seus resultados anteriores. O diretor de produtos Mike Krieger — que também cofundou o Instagram — afirma abertamente: “Eu costumava escrever a maior parte sozinho, usando o Claude para trocar ideias. Agora, o Claude 4 escreve a maior parte.”

E ele não é o único impressionado. O Cursor descreve o Claude 4 como “inovador em codificação“, enquanto o Replit destaca “ganhos enormes no processamento de edições em vários arquivos“. Quando as principais ferramentas para desenvolvedores estão construindo em torno dele, você sabe que tem algo revolucionário.

O Momento Decisivo do Claude 4

Como visto com o Claude 2.0, o espaço da IA ​​generativa está mais competitivo do que nunca. Mas, desta vez, adotei uma abordagem diferente — uma que torna esta análise diferente de todas as outras.

Nas últimas horas, levei o Claude 4 ao limite. Pesquisa na web, validação de fontes, escrita estruturada, narrativa criativa — até mesmo humor e sátira. E os resultados? Genuinamente impressionantes. Aliás, as 700 palavras que você acabou de ler? Elas são o resultado desses testes.

Então, aqui está a verdadeira pergunta: você consegue dizer quais partes eu escrevi e quais o Claude 4 fez? Porque, honestamente, depois desse experimento, não tenho mais certeza se consigo.

O futuro da IA ​​não é mais uma promessa distante. Ele já está aqui — e pode ter acabado de lhe contar essa história.


Leia o artigo original em: Futuro Próssimo

Leia mais: Análise de 4 Milhões de Conversas do ChatGPT Sugere uma Conexão com a Solidão

Share this post