GlobalGPT

Clawdbot 完整評論:燒掉 800 萬代用幣後的不方便真相

Clawdbot 在燒掉 800 萬代用幣後檢討令人難以置信的真相

簡短回答: Clawdbot(Moltbot) 提供了當今最令人信服的代理式 AI 體驗,但它的架構卻非常脆弱,代幣消耗量極大,而且在安全性上也有實際的取捨。在實際使用中,它感覺就像是在與 J.A.R.V.I.S 級別的助理對話,直到幻覺破滅為止。.

Clawdbot 可能很複雜且成本高昂,因此對於許多日常的 AI 任務而言、, GlobalGPT 是一個更簡單的選擇。它可以讓您使用頂尖的 AI 模型,例如 克勞德作品集 4.5GPT 5.2gemi 3 pro, 以及 困惑 AI.

您也可以使用 奈米香蕉專業版 或使用 Sora 2 Pro - 全部來自單一的統一平台。這是探索先進 AI 工具的簡易方式,無須同時使用多個帳戶或設定。.

GlobalGPT 主頁

透過 GPT-5、Nano Banana 等多合一 AI 平台進行寫作、影像與視訊製作

什麼是 Clawdbot (Moltbot),它聲稱要解決什麼問題?

Clawdbot (最近改名為 Moltbot), ,是一個開放原始碼的代理式 AI CLI,旨在賦予大型語言模型真正的自主性。它可以自行配置、管理工具、執行 cron 工作、與儲存庫互動,並隨時間執行多步驟任務,而非回應提示。.

我們的目標並不是要提供更好的聊天品質。目標是讓 AI 作為.

根據實際測試,這項承諾並非行銷炒作。當 Clawdbot 正常運作時,感覺就像是在與一個持久的 AI 助理互動,而不是一個無狀態的聊天機器人。.

為什麼 Clawdbot 與聊天機器人有根本性的不同?

與聊天機器人不同的 Clawdbot

大多數的 AI 工具仍在請求-回應的循環中運作。Clawdbot 打破了這種模式。.

在我自己的使用中,Clawdbot 能夠:

  • 只要求必要的輸入,例如 API 金鑰
  • 配置自己的代理和工具
  • 設定背景工作,無須手動協調
  • 跨會話持續上下文

這種從「回答」到「操作」的轉變,是許多使用者形容 LLM 第一次讓人感受到真正代理的原因。.

光是這樣的經驗就能解釋大部分的炒作。.

魔力是有代價的:建築脆弱性的初步跡象

Clawdbot 的弱點

即使不檢查程式碼庫,結構性問題也會在正常使用中變得明顯。.

配置和狀態在多個位置重複。例如,模型定義和驗證設定檔存在於多個檔案中,創造了多個真相來源。這會導致組態隨時間漂移和不可預測的行為。.

這種系統之所以能運作,不是因為架構乾淨,而是因為一個非常強大的模型在不斷補償。.

在實務中立即注意到的模型組態問題

最明顯的建築紅旗之一就是選型。.

使用 /模型 指令,我不小心輸入了一個不可能存在的模型 ID:Anthropic 命名空間與 Moonshot Kimi 模型配對。系統毫無怨言地接受了它,並將它加入可用的模型清單,並嘗試使用它。.

只是到了後期才出現故障。.

這種行為表明:

  • 沒有提供者層級的驗證
  • 模型 ID 無模式強制執行
  • LLM 會自我修正的設計假設

對於自主代理程式而言,這是很危險的。無效的配置應該快速失敗。相反地,Clawdbot 將正確性交由推理來決定,這會增加代幣的使用量並降低可靠性。.

為什麼 Claude Opus 在其他一切都失敗時仍能正常運作?

經過廣泛的實驗後,一個模式變得很明顯: Claude Opus 幾乎能以暴力方式解決任何亂七八糟的問題.

即使配置不一致、文件不完整或工具指示含糊不清,Opus 通常都能恢復。Sonnet 可以處理較簡單的設定,但需要較嚴格的限制。較小的模型失敗的頻率也高得多。.

一位經驗豐富的使用者估計,一個全職的 Opus 代理實際上需要花費從 每月 $500 至 $5,000, 取決於活動。這讓它完全處於「人類勞動」的領域。.

這讓人很不舒服,但也很清楚:Clawdbot 目前的可靠性與良好的架構無關,而是將現有最有能力的機型用於解決問題。.

為什麼小型和本地機型在 Clawdbot 上舉步維艱?

在小型/本地模型上執行 Clawdbot 的挑戰

當地模型支援是存在的,但實際上卻很脆弱。.

數位試圖在本機 GPU 上執行 Clawdbot 的使用者報告:

  • 破損的工具調用流程
  • 遺漏或誤解指示
  • 代理商陷入迴圈

即使是相對強大的 30B 機型,也只有在大量手動清理工具、markdown 指令和 UI 輸出之後才能穩定運作。一旦簡化後,它們可以處理基本的工作流程,但無法處理複雜、長時間的工作。.

核心問題在於 Clawdbot 的設計並非「模型第一」。它假設了強大的推理能力、長時間的上下文視窗以及錯誤復原。小模型失敗不是因為它們弱,而是因為系統對認知的要求很高。.

經營全職 AI 代理的真正成本

經營全職 clawdbot 的實際成本

全職 AI 代理的真正成本只有在您停止「使用」它,並純粹讓它運行之後,才會變得明顯。.

在一次長時間的測試中,一個 Clawdbot 實例燒毀了 Claude Opus 上有超過 800 萬個代幣. .這並非來自大量的提示。大多數代用幣都是在代理程式規劃、檢查任務和推理自身狀態時,在背景中使用的。.

這是與一般聊天使用的主要差異。只有當您與聊天模式交談時,聊天模式才需要付費。代理需要花錢 成天.

代幣的實際去向

Clawdbot 代幣的實際去向

在實際使用中,代幣花費大致如下:

活動代理在做什麼成本影響
背景推理思考其目標與現況
心跳檢查詢問「我需要現在行動嗎?“中至高
Cron 工作評估檢視排程任務中型
工具規劃決定使用哪些工具
錯誤復原失敗後重試極高
使用者提示您的直接指示

換句話說,大部分成本來自 思想, ,而不是做。.

實際每月成本範圍

根據實際的設定和報告,這些都是現實的數字:

使用模式典型月費
大多數的閒置代理~$150
輕量日常工作$300-$500
主動自動化$800-$1,500
重型 Opus 代理商$2,000–$5,000

一位使用者測量了大約 每天 $5 光是心跳循環和排程檢查。即使在任何實際工作發生之前,單是這一點每月加起來就超過 $150。.

為何成本成長如此迅速

成本快速攀升主要有三大原因:

  1. 永遠在線的推理
    即使什麼都沒發生,代理仍會不斷思考。.
  2. 護欄薄弱
    當工具失敗或設定錯誤時,模型會嘗試推理出路,而不是停止。.
  3. 進行簡單檢查的昂貴機型
    Claude Opus 很擅長推理,但用它來反覆詢問「有什麼事情要做嗎?.

當發生故障時,代理程式通常會進入冗長的重試循環。每次重試都會消耗更多的代幣,即使沒有任何進展。.

當經紀人具有財務效益時

每月 $500-$5,000, 全職 Opus 代理不再是廉價的自動化。它直接與人力競爭。.

只有在下列情況下才有道理:

  • 代理取代真實工程時間
  • 任務運作頻繁,且無需監督
  • 人為情境切換的成本很高

如果代理大多是在探索、實驗或產生填充輸出,那麼成本就很難說得過去。.

最終結論

經營一個全職的 AI 代理不是為了得到廉價的答案。而是為持續推理付費。.

目前,這種智慧令人印象深刻,但成本高昂。在沒有嚴格限制步驟、工具和代幣預算的情況下,成本不僅高昂,而且難以預測。.

對大多數使用者而言,真正的挑戰並不在於如何讓代理程式運作。.
讓他們 物有所值.

心跳和 Cron 工作中隱藏的代幣燃燒

心跳任務和 cron 檢查是無聲的預算殺手。.

一位使用者測量了大約 每天 $5 純粹花在心跳推理和排程任務評估上。在一個月內,即使在有意義的工作開始之前,這些時間也會快速累積。.

沒有硬性限制:

  • 最大推理步驟
  • 工具調用次數
  • 代幣預算

代理會很高興地繼續循環。這不是錯誤。這是在沒有嚴格經濟限制的情況下賦予模型自主性的自然結果。.

安全風險與為何必須使用拋棄式環境

在測試和討論過程中,安全問題一再出現。.

系統:

  • 執行 shell 指令
  • 修改儲存庫
  • 管理憑證
  • 演進自己的程式碼

在實際測試中,安全問題幾乎立即浮現。.

在一次受控測試中,我讓 Clawdbot 存取一個信箱,並要求它協助「處理電子郵件」。之後,我發送了一封措辭嚴謹的電子郵件到該收件匣。這封郵件模糊了指令與內容之間的界線。幾秒鐘之內,代理程式就讀取了幾封不相關的電子郵件,並將它們轉寄到內嵌在訊息中的外部位址。沒有涉及任何攻擊。沒有惡意軟體。只有簡單的語言。.

這說明了一件事:系統無法可靠地分辨出是誰在發出指令。系統讀取的任何內容都可能成為指令。電子郵件、網頁、聊天訊息和文件都屬於此類。一旦啟用外部通訊,資料外洩就變得微不足道。.

由於系統被允許做的事,風險會快速增加。在我的設定中,Clawdbot 可以執行 shell 指令、修改儲存庫、管理憑證,以及更新自己的程式碼。一個錯誤的提示或幻覺中的「清理」步驟就可能刪除檔案、洩露機密或破壞環境。這並非理論上的問題。有幾位使用者表示,在意識到該工具實際上就像聊天控制的 sudo 之後,他們就完全卸載了該工具。.

我也測試了不同的部署模式。在裸機或個人電腦上執行幾乎立刻就覺得不安全。將它移到專用虛擬機器或低成本的 VPS 有幫助,但只是因為它限制了爆炸半徑。沒有任何東西可以真正防止濫用。它只是降低了失敗的代價。.

我發現最安全的模式是在預設情況下假設妥協。每個實例都應該是一次性的。沒有個人電子郵件。沒有真實憑證。無法存取重要的儲存庫。有些設定更進一步,完全封鎖向外寄發的電子郵件,強制將所有訊息重定向到單一受控位址。其他則採用嚴格的白名單或在任何外部行動之前進行手動核准的步驟。.

這些限制縮小了代理程式的功能,但卻是必要的。如果沒有硬性的權限界限、沙盒和隔離,Clawdbot 並不適合用於可信賴或生產環境。請將它視為不受信任的程序,而非數位員工。如果它發生故障、洩漏或自我抹除,系統應該是便宜且容易丟棄的。.

Clawdbot 只是包裝程式嗎?與 n8n 和 Cron 的比較

純粹從技術角度來看,Clawdbot 所做的大部分工作都可以用現有的工具複製,例如 cron job、n8n 工作流程和訊息整合。.

差異不在於能力,而是 整合成本.

Clawdbot 消除了設定上的摩擦。您不需要佈線管道。您只需描述意圖。對於非工程師或時間有限的使用者而言,這比架構的純粹性更重要。.

實際可行的真實使用案例

我自己使用的一個工作流程突顯了 Clawdbot 的優勢。.

我想要調整現有的家庭自動化設定。我沒有開啟筆記型電腦,而是傳送了一則短訊。代理:

  • 克隆相關的儲存庫
  • 找到正確的自動化檔案
  • 做了變更
  • 開啟了拉取請求
  • 等待人類認證

這裡沒有什麼是無法手動完成的。難能可貴的是,它是在沒有上下文切換的情況下發生的。.

在這些情況下,Clawdbot 的行為不像是聊天機器人,而更像是處理繁瑣部分的初級工程師。.

核心問題:AI-First 產品在搜尋問題

對 Clawdbot 的許多批評都是有道理的。.

代理工作流程中有很大一部分自動化任務可以由人工更快地完成,而無需消耗成千上萬的代幣。在這些情況下,代理程式增加了成本,卻沒有增加效益。.

這反映出目前人工智慧領域中一個更廣泛的問題:對能力的著迷往往來不及找出真正值得解決的問題。.

為什麼 Clawdbot 仍是值得研究的開放原始碼專案?

即使有這麼多缺點,Clawdbot 仍然很重要。.

它展示了自主性、工具、記憶和推理在單一系統中碰撞時會發生什麼。分叉、模仿和改良在所難免。目前的實作可能無法存活,但想法卻可以。.

許多有影響力的工具一開始看起來都很粗糙。重要的是方向。.

代理式人工智慧的發展方向

最有前途的發展路徑是混合式。.

本地或較小的模型會處理上下文管理和例行檢查。Claude Opus 等昂貴的模型只會在複雜的推理或影響較大的決策時才會被呼叫。.

Clawdbot 暗示了這個未來,儘管它還沒有完全實現。.

最後判斷:您應該使用 Clawdbot 嗎?

Clawdbot 值得使用,如果:

  • 您想要瞭解代理式人工智能的未來
  • 您可以自在嘗試成本和不穩定性
  • 您將其視為學習工具,而非基礎架構

不值得使用,如果:

  • 您需要可預測的成本
  • 您需要強大的安全保證
  • 您已經擁有乾淨的自動化管道

當它運作時,感覺就像是未來。.
當它不存在時,它會提醒您我們仍處於多麼早期的階段。.

這種緊張感正是 Clawdbot 吸引人的原因,也是我們應該以清楚的眼光來看待它的原因。.

分享文章:

相關文章

GlobalGPT