Por que ele Pode Superar o ChatGPT na Corrida da IA

By Denilson Martins Tech, Technology-Enhanced Learning ChatGPT, Claude 4, IA Comentários desativados

Crédito: Futuro Prossimo

Alex Albert, da Anthropic, não se conteve: “O Claude 4 é o melhor modelo de programação do mundo”. Uma afirmação ousada — mas os dados parecem sustentá-la. Com uma pontuação de 72,5% no benchmark SWE-bench Verified, rodando de forma autônoma por horas a fio e lidando com milhares de etapas sequenciais, o Claude 4 não é apenas mais uma atualização. É uma mudança no que esperamos que a IA faça. E a melhor parte? Você pode experimentar agora mesmo.

Quando a IA vira a noite

A Anthropic causou sensação hoje com o lançamento do Claude 4 Opus e do Claude 4 Sonnet — marcando seu retorno aos modelos em escala real após meses refinando variantes do Sonnet. O que realmente se destaca é a resistência do Claude 4: ele pode permanecer operacional por 24 horas seguidas sem perder precisão ou contexto.

Isso mesmo. Enquanto seu colega desenvolvedor pode começar a reclamar após oito horas de depuração, o Claude 4 Opus demonstrou jogar Pokémon sem parar ou refatorar código por sete horas seguidas. Os modelos mais antigos geralmente atingiam seu limite após algumas horas. Como disse Alex Albert: “Há uma demanda enorme por aplicativos baseados em agentes, e o Claude 4 se encaixa perfeitamente nesse papel.“

Crédito:O e-mail que recebi algumas horas atrás. Daí em diante foi só testar, testar, testar.

Os números que estão deixando os rivais nervosos

Pense em benchmarks como pôquer — e o Claude 4 acaba de fazer um royal flush. Com 72,5% no teste SWE-bench Verified, ele deixa os modelos anteriores para trás. Para contextualizar, atingir mais de 50% já foi visto como uma grande vitória. Ele também obteve sólidos 43,2% no Terminal-bench.

O impacto foi imediato: o GitHub adotou o Claude 4 Sonnet como base para seu mais recente agente de codificação Copilot. Esse tipo de mudança não acontece sem um bom motivo. A Sourcegraph chamou isso de “um grande salto no desenvolvimento de software” e a Augment Code relatou “maiores taxas de sucesso e alterações de código mais limpas e precisas“. Resumindo, todos querem um ingresso no expresso Claude 4.

Claude 4: Poderoso, mas construído com a segurança em mente

A Anthropic ativou seu protocolo de segurança de IA de Nível 3 pela primeira vez — normalmente reservado para modelos com potencial para auxiliar no desenvolvimento de armas químicas, biológicas ou nucleares. O Claude 4 Opus é tão poderoso que exige salvaguardas rigorosas para evitar o uso indevido.

**Apresentando o Modo “Pensamento Profundo“**

Um recurso de destaque do Claude 4 é a capacidade de alternar entre respostas rápidas e raciocínios mais profundos e deliberados. Ative o modo de pensamento estendido e o modelo leva um momento para “pensar” — até mesmo mostrando uma prévia do que está processando. É como ter um colega que lhe explica a lógica em vez de apenas dar a resposta.

A integração com o Claude Code também está amplamente disponível, completa com GitHub Actions e suporte integrado para VS Code e JetBrains. As alterações de código sugeridas aparecem diretamente nos seus arquivos — chega de copiar e colar tediosos. É perfeito.

Uma aposta multibilionária que está dando resultado

A Anthropic agora gera mais de US$ 2 bilhões em receita anualizada, dobrando seus resultados anteriores. O diretor de produtos Mike Krieger — que também cofundou o Instagram — afirma abertamente: “Eu costumava escrever a maior parte sozinho, usando o Claude para trocar ideias. Agora, o Claude 4 escreve a maior parte.”

E ele não é o único impressionado. O Cursor descreve o Claude 4 como “inovador em codificação“, enquanto o Replit destaca “ganhos enormes no processamento de edições em vários arquivos“. Quando as principais ferramentas para desenvolvedores estão construindo em torno dele, você sabe que tem algo revolucionário.

O Momento Decisivo do Claude 4

Como visto com o Claude 2.0, o espaço da IA generativa está mais competitivo do que nunca. Mas, desta vez, adotei uma abordagem diferente — uma que torna esta análise diferente de todas as outras.

Nas últimas horas, levei o Claude 4 ao limite. Pesquisa na web, validação de fontes, escrita estruturada, narrativa criativa — até mesmo humor e sátira. E os resultados? Genuinamente impressionantes. Aliás, as 700 palavras que você acabou de ler? Elas são o resultado desses testes.

Então, aqui está a verdadeira pergunta: você consegue dizer quais partes eu escrevi e quais o Claude 4 fez? Porque, honestamente, depois desse experimento, não tenho mais certeza se consigo.

O futuro da IA não é mais uma promessa distante. Ele já está aqui — e pode ter acabado de lhe contar essa história.

Leia o artigo original em: Futuro Próssimo

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Por que ele Pode Superar o ChatGPT na Corrida da IA