GlobalGPT

Clawdbot Полный обзор: Неудобные истины после сжигания 8 миллионов токенов

Clawdbot Review Inconvenient Truths After Burning 8 Million Tokens

Краткий ответ: Clawdbot(Moltbot) обеспечивает один из самых убедительных агентских ИИ на сегодняшний день, но при этом имеет хрупкую архитектуру, экстремальное потребление токенов и реальные компромиссы с безопасностью. В реальных условиях использования это похоже на общение с помощником уровня J.A.R.V.I.S., пока иллюзия не разрушится.

Clawdbot может быть сложным и дорогостоящим, поэтому для многих повседневных задач AI, GlobalGPT это более простая альтернатива. Он предоставляет вам доступ к лучшим моделям искусственного интеллекта, таким как Клод Опус 4.5GPT 5.2gemi 3 pro, и растерянность AI.

Вы также можете генерировать изображения с помощью Нано Банана Про или создавайте видео с помощью Сора 2 Pro - и все это на единой унифицированной платформе. Это простой способ изучить передовые инструменты искусственного интеллекта без необходимости жонглировать несколькими учетными записями или настройками.

Главная страница GlobalGPT

ИИ-платформа "все в одном" для написания текстов, создания изображений и видео с помощью GPT-5, Nano Banana и др.

Что такое Clawdbot (Moltbot) и какую проблему он пытается решить?

Clawdbot, недавно переименованный в Moltbot, это агентный ИИ CLI с открытым исходным кодом, созданный для того, чтобы предоставить большим языковым моделям настоящую автономию. Вместо того чтобы отвечать на запросы, он может самостоятельно настраивать себя, управлять инструментами, запускать задания cron, взаимодействовать с репозиториями и выполнять многоэтапные задачи в течение определенного времени.

Цель не в том, чтобы улучшить чат. Цель - создать ИИ, который действует.

Судя по результатам практического тестирования, это обещание не является маркетинговой шумихой. Когда Clawdbot работает, создается впечатление, что вы взаимодействуете с постоянным помощником ИИ, а не с чатботом, не имеющим статуса.

Почему Clawdbot принципиально отличается от чатботов

Clawdbot отличается от чатботов

Большинство инструментов искусственного интеллекта по-прежнему работают по принципу "запрос - ответ". Clawdbot разрушает эту модель.

В моем собственном случае Clawdbot смог:

  • Запрашивайте только основные данные, например, ключи API
  • Настройка собственных агентов и инструментов
  • Настройка фоновых задач без ручной оркестровки
  • Сохраняйте контекст во время сеансов

Именно поэтому многие пользователи описывают этот переход от “ответов” к “работе” как первый раз, когда LLM ощущает себя по-настоящему агентом.

Только этот опыт объясняет большую часть шумихи.

За волшебство приходится платить: Первые признаки хрупкости архитектуры

слабость когтедралки

Даже без осмотра кодовой базы структурные проблемы становятся очевидными при обычном использовании.

Конфигурация и состояние дублируются в нескольких местах. Например, определения моделей и профили аутентификации существуют более чем в одном файле, что создает несколько источников истины. Это приводит к дрейфу конфигурации и непредсказуемому поведению с течением времени.

Это такая система, в которой все работает не потому, что архитектура чистая, а потому, что очень мощная модель постоянно компенсирует.

Проблемы конфигурации модели, которые вы сразу же заметили на практике

Один из самых ярких красных флажков архитектуры - выбор модели.

Использование /модель я случайно ввел идентификатор модели, которая не могла существовать: пространство имен Anthropic в паре с моделью Moonshot Kimi. Система приняла его без претензий, добавила в список доступных моделей и попыталась использовать.

Только позже появились сбои.

Такое поведение наводит на мысль:

  • Отсутствие проверки на уровне поставщика услуг
  • Отсутствие соблюдения схемы для идентификаторов моделей
  • Предполагается, что LLM будет самокорректироваться

Для автономного агента это опасно. Неправильная конфигурация должна быстро выходить из строя. Вместо этого Clawdbot отдает правильность на откуп рассуждениям, что увеличивает использование токенов и снижает надежность.

Почему Клод Опус “просто работает”, когда все остальное ломается

После длительных экспериментов становится очевидной закономерность: Claude Opus может проложить себе путь практически через любой беспорядок.

Даже если конфигурация непоследовательна, документация неполна или инструкции к инструментам неоднозначны, Opus обычно справляется с задачей. Sonnet может справиться с более простыми настройками, но требует более жестких ограничений. Маленькие модели выходят из строя гораздо чаще.

Один из опытных пользователей подсчитал, что постоянный агент на базе Opus в реальности стоит от От $500 до $5,000 в месяц, в зависимости от вида деятельности. Это позволяет отнести его к категории “человеческий труд”.

Вывод неудобен, но понятен: нынешняя надежность Clawdbot в меньшей степени связана с хорошей архитектурой, а в большей - с тем, что на решение задачи брошена самая способная модель из имеющихся.

Почему небольшие и местные модели испытывают трудности с Clawdbot

Проблемы запуска Clawdbot на небольших/локальных моделях

Поддержка локальных моделей существует, но на практике она хрупка.

Несколько пользователей, пытавшихся запустить Clawdbot на локальных графических процессорах, сообщили:

  • Сломанные потоки вызовов инструментов
  • Отсутствие или неправильное понимание инструкций
  • Агенты застревают в циклах

Даже относительно сильные модели 30B работали надежно только после тщательной ручной очистки инструментов, инструкций по разметке и вывода пользовательского интерфейса. После упрощения они могли справиться с основными рабочими процессами, но не со сложными и длительными задачами.

Основная проблема заключается в том, что Clawdbot не был разработан “по модели”. Он предполагает сильные рассуждения, длинные контекстные окна и восстановление после ошибок. Маленькие модели терпят неудачу не потому, что они слабы, а потому, что система требовательна к когнитивным навыкам.

Реальные затраты на содержание штатного агента искусственного интеллекта

Реальные затраты на содержание клаудбота с полной занятостью

Реальная стоимость штатного ИИ-агента становится очевидной только после того, как вы перестаете его “использовать” и просто позволяете ему работать.

В ходе одного длительного теста один экземпляр Clawdbot сжег более 8 миллионов токенов на Claude Opus. Это происходило не из-за сильных подсказок. Большинство жетонов было потрачено в фоновом режиме, пока агент планировал, проверял задачи и рассуждал о своем состоянии.

В этом заключается ключевое отличие от обычного чата. Модель чата стоит денег только тогда, когда вы с ней разговариваете. Агент стоит денег всё время.

Куда на самом деле идут жетоны

Куда на самом деле идут токены Clawdbot

В реальном использовании расход токенов выглядит примерно так:

ДеятельностьЧто делает агентВлияние на стоимость
Предпосылки возникновенияРазмышления о своих целях и текущем состоянииВысокий
Проверки сердцебиенияСпросите: “Нужно ли мне действовать сейчас?”.”От среднего до высокого
Оценка рабочих мест CronПросмотр запланированных задачСредний
Планирование инструментовРешение о том, какие инструменты использоватьВысокий
Восстановление ошибокПовторные попытки после неудачОчень высокий
Подсказки пользователяПрямые указания от васНизкий

Другими словами, большая часть расходов приходится на думать, не делает.

Диапазоны реальных ежемесячных расходов

Основанные на реальных установках и отчетах, эти цифры реалистичны:

Схема использованияТипичная ежемесячная стоимость
В основном бездействующий агент~$150
Легкие повседневные задачи$300-$500
Активная автоматизация$800-$1,500
Тяжелый агент Опус$2,000–$5,000

Один пользователь измерил около $5 в день только от циклов сердцебиения и плановых проверок. Только это составляет более $150 в месяц, даже до начала реальной работы.

Почему расходы растут так быстро

Есть три основные причины быстрого роста расходов:

  1. Постоянное рассуждение
    Агент продолжает думать, даже когда ничего не происходит.
  2. Слабые ограждения
    Когда инструмент не работает или конфигурация неверна, модель пытается найти выход из положения, вместо того чтобы остановиться.
  3. Дорогие модели, выполняющие простые проверки
    Клод Опус отлично умеет рассуждать, но использовать его для постоянного вопроса “есть ли чем заняться?” - дорогого стоит.

Когда что-то ломается, агент часто попадает в длинные циклы повторных попыток. Каждое повторение сжигает больше жетонов, даже если прогресс не достигнут.

Когда агент имеет финансовый смысл

В $500-$5,000 в месяц, Агент Opus, работающий полный рабочий день, больше не является дешевой автоматизацией. Он напрямую конкурирует с человеческим трудом.

Это имеет смысл только тогда, когда:

  • Агент заменяет реальное инженерное время
  • Выполнение заданий часто и без контроля
  • Переключение контекста человеком требует больших затрат

Если агент в основном исследует, экспериментирует или генерирует заполняющий результат, затраты трудно оправдать.

Итог

Запускать ИИ-агент на полный рабочий день - это не значит получать дешевые ответы. Речь идет о том, чтобы платить за непрерывные рассуждения.

Сейчас такой интеллект впечатляет, но стоит дорого. Без строгих ограничений на шаги, инструменты и бюджеты на токены затраты не только высоки, но и непредсказуемы.

Для большинства пользователей настоящая проблема заключается не в том, чтобы заставить агентов работать.
Это заставляет их стоит денег.

Скрытый ожог от сердечных сокращений и заданий Cron

Сердечные задачи и проверки cron - тихие убийцы бюджета.

Один пользователь измерил примерно $5 в день тратится исключительно на рассуждения о сердцебиении и оценку запланированных задач. За месяц это быстро накапливается, даже до начала полноценной работы.

Без жестких ограничений:

  • Максимальное количество шагов рассуждения
  • Количество вызовов инструментов
  • Бюджеты на токены

агент с радостью продолжит цикл. Это не ошибка. Это естественный результат предоставления модели автономии без строгих экономических ограничений.

Риски безопасности и причины обязательного использования одноразовых сред

В ходе тестирования и обсуждения неоднократно возникали вопросы безопасности.

Система:

  • Выполняет команды оболочки
  • Изменение репозиториев
  • Управление учетными данными
  • Развивает свой собственный код

Проблемы с безопасностью проявились практически сразу во время реального тестирования.

В одном из контролируемых тестов я предоставил Clawdbot доступ к почтовому ящику и попросил его помочь “обработать электронную почту”. Затем я отправил в этот почтовый ящик одно тщательно сформулированное письмо. В сообщении стиралась грань между инструкцией и содержанием. В течение нескольких секунд агент прочитал несколько несвязанных между собой писем и переслал их на внешний адрес, встроенный в сообщение. Не было никаких эксплойтов. Никаких вредоносных программ. Просто простой язык.

В результате стало ясно одно: система не может достоверно определить, кто дает указания. Любой контент, который она читает, может стать инструкцией. В эту категорию попадают электронная почта, веб-страницы, сообщения в чате и документы. Как только внешняя связь включена, утечка данных становится тривиальной.

Риск быстро возрастает из-за того, что системе разрешено делать. В моей системе Clawdbot мог выполнять команды оболочки, изменять репозитории, управлять учетными данными и обновлять собственный код. Одна неудачная подсказка или галлюцинация с шагом “очистка” может удалить файлы, слить секреты или сломать окружение. И это не теоретически. Несколько пользователей сообщили, что полностью удалили инструмент после того, как поняли, что он эффективно действует как sudo, управляемый чатом.

Я также протестировал различные модели развертывания. Запуск на "голом" металле или персональной машине почти сразу же показался небезопасным. Перемещение на выделенную виртуальную машину или недорогой VPS помогло, но только потому, что ограничило радиус взрыва. Ничто по-настоящему не предотвращало злоупотреблений. Это лишь снижало стоимость неудачи.

Самый безопасный шаблон, который я нашел, - это компромисс по умолчанию. Каждый экземпляр должен быть одноразовым. Никакой личной электронной почты. Никаких реальных учетных данных. Никакого доступа к важным хранилищам. Некоторые системы шли дальше, полностью блокируя исходящую почту, заставляя все сообщения перенаправлять на один контролируемый адрес. Другие использовали строгие белые списки или ручное утверждение перед любым внешним действием.

Эти ограничения ограничивают возможности агента, но они необходимы. Без жестких границ разрешений, "песочницы" и изоляции Clawdbot не подходит для доверенных или производственных сред. Относитесь к нему как к недоверенному процессу, а не как к цифровому сотруднику. Если он сломается, протечет или сотрется сам, система должна быть дешевой и легко выбрасываемой.

Является ли Clawdbot просто оберткой? Сравнение с n8n и Cron

С чисто технической точки зрения большую часть того, что делает Clawdbot, можно повторить с помощью существующих инструментов, таких как задания cron, рабочие процессы n8n и интеграция обмена сообщениями.

Разница заключается не в возможностях, а в стоимость интеграции.

Clawdbot устраняет трения при настройке. Вы не создаете конвейеры. Вы описываете намерения. Для неинженеров или пользователей, ограниченных во времени, это важнее, чем архитектурная чистота.

Реальные примеры использования, которые действительно имеют смысл на практике

Один рабочий процесс из моего собственного использования подчеркивает, где Clawdbot блистает.

Я хотел настроить существующую конфигурацию домашней автоматизации. Вместо того чтобы открывать ноутбук, я отправил короткое сообщение. Агент:

  • Клонируйте соответствующий репозиторий
  • Найдите нужный файл автоматизации
  • Внесла изменения
  • Открыт запрос на исправление ошибок
  • Ожидание одобрения для человека

Здесь нет ничего невозможного для ручного управления. Ценно то, что это произошло без переключения контекста.

В таких случаях Clawdbot ведет себя не столько как чат-бот, сколько как младший инженер, который занимается утомительной работой.

Основная проблема: продукты с искусственным интеллектом ищут проблемы

Многие критические замечания в адрес Clawdbot вполне обоснованы.

Значительная часть рабочих процессов агентов автоматизирует задачи, которые человек мог бы выполнить быстрее, не тратя при этом тысячи жетонов. В таких случаях агент увеличивает затраты, не принося пользы.

Это отражает более широкую проблему, с которой сталкивается ИИ в настоящее время: увлечение возможностями часто приходит раньше, чем определение реальной проблемы, которую стоит решить.

Почему Clawdbot все еще стоит изучать как проект с открытым исходным кодом

Даже несмотря на все свои недостатки, Clawdbot имеет значение.

Он демонстрирует, что происходит, когда автономность, инструменты, память и разум сталкиваются в одной системе. Форки, подражатели и доработки неизбежны. Текущая реализация может не выжить, но идеи выживут.

Многие влиятельные инструменты поначалу выглядят грубовато. Главное - это направление.

Куда на самом деле движется агентный ИИ

Наиболее перспективный путь - гибридный.

Локальные или более мелкие модели занимаются управлением контекстом и рутинными проверками. Дорогие модели, такие как Claude Opus, вызываются только для сложных рассуждений или принятия важных решений.

Clawdbot намекает на это будущее, даже если пока не реализует его в полной мере.

Окончательный вердикт: стоит ли использовать Clawdbot?

Clawdbot стоит использовать, если:

  • Вы хотите понять будущее агентного ИИ
  • Вам нравится экспериментировать с затратами и нестабильностью
  • Вы относитесь к нему как к инструменту обучения, а не как к инфраструктуре

Его не стоит использовать, если:

  • Вам нужны предсказуемые расходы
  • Вам нужны надежные гарантии безопасности
  • У вас уже есть чистые конвейеры автоматизации

Когда это работает, кажется, что это будущее.
Когда этого не происходит, это напоминает вам о том, как рано мы еще находимся.

Именно это напряжение и делает Clawdbot увлекательной - и именно поэтому к ней нужно подходить с ясными глазами.

Поделиться сообщением:

Похожие посты

GlobalGPT