GlobalGPT

Claude Sonnet 4.5: самый мощный ИИ для более чем 30 часов непрерывного программирования

claude-sonnet-4-5-самый-мощный-искусственный-интеллект-для-30-часов-непрерывного-программирования

Anthropic только что официально выпустила Клод Соннет 4.5, и результаты просто потрясающие.

Кстати, если вы хотите использовать ChatGPT с Близнецы и другие лучшие модели AI по очень низкой цене, Глобальный GPT предлагает интегрированный опыт "все в одном".

Claude Sonnet 4.5 возглавляет рейтинговую таблицу SWE-bench Verified

На Проверено SWE-bench тест, который оценивает реальные программистские навыки, Claude Sonnet 4.5 занял #1 место в отрасли.

Еще более безумно? Он может оставаться сосредоточенным и работать непрерывно в течение более 30 часов подряд.

Да, ИИ только что добавил еще одно преимущество перед людьми.

Claude Sonnet 4.5 возглавляет рейтинговую таблицу SWE-bench Verified

Непревзойденная мощность кодирования: создание приложений, как дышать

Например, когда перед ним была поставлена задача создать приложение для чата, подобное Slack или Teams, оно выдавало 11 000 строк кода за один присест. Для сравнения, более старые модели Claude Opus 4 и Codex могли работать непрерывно только около 7 часов.

По данным Anthropic, Клод Соннет 4.5 — теперь самая мощная в мире модель кодирования — с огромными улучшениями в создании сложных агентов, компьютерных операциях, рассуждениях и математике.

 Claude Sonnet 4.5 — теперь самая мощная модель кодирования в мире

На OSWorld, тесте, предназначенном для проверки реальных компьютерных задач, он набрал 61.4%, снова заняв первое место. Всего четыре месяца назад Sonnet 4 лидировал с результатом 42,21 TP3T, так что скачок производительности просто ошеломляющий.

Claude Sonnet 4.5 достиг 61,41 TP3T в тесте OSWorld для реальных компьютерных задач.

Новые функции и обновления инструментов Клода Соннета 4.5

Anthropic также выпустила несколько важных обновлений вместе с новой моделью:

  • Поддержка контрольных точек наконец-то доступна, что позволяет сохранять прогресс и в любой момент возвращаться к предыдущим состояниям.
  • Информация об использовании теперь можно запрашивать непосредственно в Claude Code с помощью /использование.
  • Нативный плагин VS Code доступен, аналогично плагину Codex от OpenAI.
  • Claude Code SDK был официально переименован в SDK Claude Agent, усиливая возможности по созданию агентов.
  • Терминальный интерфейс был значительно переработан, что позволяет пользователям сразу же после запуска просматривать историю предыдущих сеансов и списки новых функций.
Новые функции и обновления инструментов в Claude Sonnet 4.5

Anthropic даже открыла доступ к базовой инфраструктуре, которую они используют для создания Claude Code, называемой SDK Claude Agent.

Управление памятью агентов во время длительных задач, разработка систем разрешений, обеспечивающих баланс между автономностью и контролем со стороны пользователя, а также координация нескольких под-агентов для достижения целей — все это сложные аспекты создания и проектирования ИИ-агентов.

С помощью SDK Claude Agent, теперь вы можете использовать эту инфраструктуру для создания собственных продуктов.

Ранние отзывы пользователей: любовь-ненависть

С сегодняшнего дня разработчики могут вызывать Клод-сонет-4-5 через API Claude. Цены остаются неизменными по сравнению с Sonnet 4: $3/$15 на миллион токенов.

Первые тестеры уже впечатлены:

Один разработчик поделился своим опытом сразу после того, как попробовал его:

“Claude 4.5 Sonnet только что рефакторил всю мою кодовую базу за один проход — 25 вызовов инструментов, более 3000 новых строк кода и 12 совершенно новых файлов. Он модулировал все, разбил монолитную структуру и очистил спагетти-код. Результат на самом деле не заработал, но, вау, это было действительно элегантно”. Этот отзыв выглядит как смесь любви и разочарования.

Cursor заявила, что они наблюдали передовую производительность программирования с Claude Sonnet 4.5, особенно с улучшениями в обработке длительных задач. Это еще больше объясняет, почему многие пользователи Cursor выбирают Claude для решения самых сложных задач.

Известный обозреватель и технический блогер Дэн Шиппер отметил, что Claude 4.5 вызывает ощущение быстрее, более управляемый и более стабильный.

Повышенная безопасность: наилучшая настройка на сегодняшний день

Производительность – это одно, но безопасность должна идти в ногу с ней.

Claude Sonnet 4.5, по словам Anthropic, является их самой совершенной моделью на сегодняшний день.

Благодаря расширенным возможностям Claude в сочетании с тщательным обучением по вопросам безопасности, Anthropic значительно улучшила поведение модели, уменьшив такие тенденции, как льстивость, обман, стремление к власти и поощрение заблуждений. Кроме того, Anthropic добилась значительных успехов в защите от атак с внезапным введением команд и минимизации ошибочной классификации контента.

Клод Соннет 4.5 Экспериментальная функция: Представьте себе с Клодом

В то же время компания Anthropic запустила временный предварительный просмотр исследования называемый Представьте себе с Клодом. В этом режиме Claude генерирует программное обеспечение в режиме реального времени — ни одна из функций или код не написаны заранее. Все создается и настраивается интерактивно на месте.

Этот предварительный просмотр доступен только для Подписчики Claude Max в течение следующих 5 дней.

Доступ к нему можно получить здесь:https://claude.ai/imagine/

Клод Соннет 4.5 Экспериментальная функция: “Представьте себе с Клодом”

Рыночная конкуренция и стратегическое значение Claude Sonnet 4.5

В настоящее время стоимость Anthropic оценивается в $183 миллиарда, с годовым доходом в 1,5 миллиарда долларов по состоянию на август — большая часть которого приходится на инструменты для программирования. Но конкуренция жесткая: OpenAI и Google Gemini также борются за доминирование на рынке разработчиков.

Примечательно, что до ежегодной конференции разработчиков OpenAI осталась всего неделя. Выпуск Anthropic Claude 4.5 в данный момент является явным шагом, направленным на оказание давления.

Соучредитель и главный научный сотрудник Anthropic Джаред Каплан уже намекнул, что еще более продвинутая Модель Claude Opus будет запущен позднее в этом году.

Прошлые проблемы и восстановление доверия пользователей

Не все было гладко. За последние два месяца пользователи обвинили серию Claude в “упрощении”. Многие сообщили о резком снижении качества рассуждений, кодирования, форматирования и использования инструментов — даже платные подписчики Max.

Anthropic признала наличие двух независимых ошибок и отменила обновление Opus 4.1, отрицая мотивы сокращения расходов. Но без компенсации или возмещения средств негативная реакция распространилась на GitHub и X, и некоторые пользователи перешли к конкурентам, таким как Codex.

Выпуск Клод Соннет 4.5 — это шанс для Anthropic вернуть их. Удастся ли это, будет зависеть от того, как модель проявит себя в реальных условиях в течение ближайших нескольких недель.

Поделиться сообщением:

Похожие посты

GlobalGPT