GlobalGPT

Claude Sonnet 4.5: a IA mais poderosa para mais de 30 horas de codificação ininterrupta

claude-sonnet-4-5-a-IA-mais-poderosa-para-30-horas-de-programação-ininterrupta

A Anthropic acaba de lançar oficialmente Claude Sonnet 4.5, e os resultados são impressionantes.

A propósito, se você quiser usar o ChatGPT com Gêmeos e outros modelos de IA de ponta a um preço extremamente baixo, GPT global oferece uma experiência integrada tudo-em-um.

Claude Sonnet 4.5 lidera o ranking verificado do SWE-bench

No Verificado pela SWE-bench teste — que avalia a capacidade de programação no mundo real — Claude Sonnet 4.5 obteve a #1 posição no setor.

Ainda mais louco? Ele consegue manter o foco e trabalhar continuamente por mais de 30 horas seguidas.

Sim, a IA acaba de adicionar mais uma vantagem em relação aos humanos.

Claude Sonnet 4.5 lidera o ranking verificado do SWE-bench

Poder de codificação incomparável: criar aplicativos com a mesma facilidade com que se respira

Por exemplo, quando encarregado de criar um aplicativo de bate-papo semelhante ao Slack ou ao Teams, ele produziu 11.000 linhas de código de uma só vez. Em comparação, os modelos mais antigos Claude Opus 4 e Codex só conseguiam funcionar por cerca de 7 horas seguidas.

De acordo com a Anthropic, Claude Sonnet 4.5 é agora o modelo de codificação mais poderoso do mundo — com melhorias significativas na construção de agentes complexos, operações computacionais, raciocínio e matemática.

 O Claude Sonnet 4.5 é agora o modelo de codificação mais poderoso do mundo

Em OSWorld, um benchmark projetado para testar tarefas reais do computador, obteve a seguinte pontuação 61.4%, novamente conquistando o primeiro lugar. Há apenas quatro meses, o Sonnet 4 liderava com 42,21 TP3T — portanto, o salto de desempenho é impressionante.

Claude Sonnet 4.5 alcançando 61,41 TP3T no benchmark OSWorld para tarefas reais de computador

Novos recursos e atualizações de ferramentas de Claude Soneto 4.5

A Anthropic também lançou várias atualizações importantes junto com o novo modelo:

  • Suporte para pontos de verificação está finalmente disponível, permitindo que o progresso seja salvo e revertido para estados anteriores a qualquer momento.
  • Informações de uso agora pode ser consultado diretamente no Claude Code usando /uso.
  • Plugin nativo do VS Code está disponível, semelhante ao plugin Codex da OpenAI.
  • SDK Claude Code foi oficialmente renomeado para SDK do Claude Agent, aprimorando as capacidades de construção de agentes.
  • Interface do terminal foi significativamente redesenhado, permitindo que os usuários vejam o histórico das sessões anteriores e as novas listas de recursos rapidamente ao iniciar o programa.
Novos recursos e atualizações de ferramentas do Claude Sonnet 4.5

A Anthropic até abriu a infraestrutura subjacente que usa para construir o Claude Code, chamada SDK do Claude Agent.

Gerenciar a memória dos agentes durante tarefas de longa duração, projetar sistemas de permissão que equilibrem autonomia e controle do usuário e coordenar vários subagentes para atingir objetivos são aspectos desafiadores da construção e do projeto de agentes de IA.

Com o SDK do Claude Agent, Agora você pode aproveitar essa infraestrutura para criar seus próprios produtos.

Reações iniciais dos usuários: uma relação de amor e ódio

A partir de hoje, os desenvolvedores podem chamar claude-soneto-4-5 através da API Claude. O preço permanece inalterado em relação ao Sonnet 4: $3/$15 por milhão de tokens.

Os primeiros testadores já estão impressionados:

Um desenvolvedor compartilhou sua experiência imediatamente após experimentá-lo:

“O Claude 4.5 Sonnet refatorou toda a minha base de código em uma única execução — 25 invocações de ferramentas, mais de 3.000 novas linhas de código e 12 arquivos totalmente novos. Ele modularizou tudo, quebrou a estrutura monolítica e limpou o código espaguete. O resultado não funcionou, mas uau, ficou realmente elegante.” Essa avaliação parece uma mistura de amor e frustração.

A Cursor afirmou que observou um desempenho de programação de ponta com o Claude Sonnet 4.5, especialmente com melhorias no tratamento de tarefas de longa duração. Isso explica ainda mais por que muitos usuários da Cursor escolhem o Claude para lidar com os problemas mais complexos.

O conhecido blogueiro de tecnologia Dan Shipper observou que o Claude 4.5 parece mais rápido, mais controlável e mais estável.

Segurança aprimorada: o melhor alinhamento até agora

O desempenho é uma coisa, mas a segurança deve acompanhar o ritmo.

O Claude Sonnet 4.5 é, segundo a Anthropic, o seu modelo mais avançado até à data.

Graças às capacidades aprimoradas de Claude, combinadas com um rigoroso treinamento em segurança, a Anthropic fez melhorias significativas no comportamento do modelo, reduzindo tendências como bajulação, engano, busca por poder e incentivo a ilusões. Além disso, a Anthropic alcançou grandes avanços na defesa contra ataques de injeção de prompts e na minimização da classificação incorreta de conteúdo.

Claude Sonnet 4.5 Recurso experimental: Imagine com Claude

Ao mesmo tempo, a Anthropic lançou um visualização temporária da pesquisa chamado Imagine com Claude. Nesse modo, Claude gera software em tempo real — nenhuma das funções ou códigos são pré-escritos. Tudo é criado e ajustado interativamente na hora.

Esta pré-visualização está disponível apenas para Assinantes do Claude Max nos próximos 5 dias.

Acesse aqui:https://claude.ai/imagine/

Claude Sonnet 4.5 Recurso experimental: “Imagine com Claude”

Concorrência no mercado e importância estratégica de Claude Sonnet 4.5

A Anthropic está atualmente avaliada em $183 bilhões, com uma receita anualizada de $5 bilhões em agosto — grande parte impulsionada por ferramentas de codificação. Mas a concorrência é acirrada: OpenAI e Google Gemini também estão competindo para dominar o mercado de desenvolvedores.

Notavelmente, a conferência anual de desenvolvedores da OpenAI está a apenas uma semana de distância. O lançamento do Claude 4.5 pela Anthropic agora é uma clara manobra para pressionar.

O cofundador e cientista-chefe da Anthropic, Jared Kaplan, já deu a entender que um sistema ainda mais avançado está a caminho. Modelo Claude Opus será lançado ainda este ano.

Problemas anteriores e restauração da confiança do usuário

Nem tudo tem sido fácil. Nos últimos dois meses, os usuários acusaram a série Claude de ter sido “simplificada”. Muitos relataram quedas acentuadas na qualidade do raciocínio, codificação, formatação e uso de ferramentas — mesmo os assinantes pagos do Max.

A Anthropic admitiu dois bugs independentes e reverteu a atualização do Opus 4.1, negando motivos de redução de custos. Mas, sem compensação ou reembolso, a reação negativa se espalhou no GitHub e no X, com alguns usuários mudando para concorrentes como o Codex.

O lançamento de Claude Sonnet 4.5 é a chance da Anthropic reconquistá-los. O sucesso dependerá do desempenho do modelo em uso no mundo real nas próximas semanas.

Compartilhe a postagem:

Publicações relacionadas

GlobalGPT