GlobalGPT

Ulasan Lengkap Clawdbot: Kebenaran yang Tidak Nyaman Setelah Membakar 8 Juta Token

Clawdbot Meninjau Kebenaran yang Tidak Nyaman Setelah Membakar 8 Juta Token

Jawaban singkat: Clawdbot (Moltbot) memberikan salah satu pengalaman AI agen yang paling meyakinkan yang tersedia saat ini, tetapi ia melakukannya dengan arsitektur yang rapuh, konsumsi token yang ekstrem, dan pengorbanan keamanan yang nyata. Dalam penggunaan di dunia nyata, rasanya seperti berbicara dengan asisten tingkat J.A.R.V.I.S., sampai ilusi itu hancur.

Clawdbot bisa jadi rumit dan mahal, jadi untuk banyak tugas AI sehari-hari, GlobalGPT adalah alternatif yang lebih sederhana. Ini memberi Anda akses ke model AI teratas seperti Claude Karya 4.5GPT 5.2gemi 3 pro, dan kebingungan AI.

Anda juga dapat menghasilkan gambar dengan Nano Pisang Pro atau membuat video menggunakan Sora 2 Pro-semua dari satu platform terpadu. Ini adalah cara mudah untuk menjelajahi alat bantu AI yang canggih tanpa harus mengelola banyak akun atau pengaturan.

GlobalGPT Beranda

Platform AI all-in-one untuk menulis, membuat gambar & video dengan GPT-5, Nano Banana, dan banyak lagi

Apa Itu Clawdbot (Moltbot) dan Masalah Apa yang Diklaim Dapat Dipecahkan?

Clawdbot, baru-baru ini berganti nama menjadi Moltbot, adalah CLI AI agentik sumber terbuka yang dirancang untuk memberikan otonomi nyata kepada model bahasa yang besar. Alih-alih merespons perintah, ia dapat mengonfigurasi dirinya sendiri, mengelola alat, menjalankan pekerjaan cron, berinteraksi dengan repositori, dan menjalankan tugas multi-langkah dari waktu ke waktu.

Tujuannya bukanlah obrolan yang lebih baik. Tujuannya adalah AI yang tindakan.

Berdasarkan pengujian langsung, janji tersebut bukanlah hype pemasaran. Ketika Clawdbot bekerja, rasanya benar-benar seperti berinteraksi dengan asisten AI yang gigih, bukan chatbot tanpa kewarganegaraan.

Mengapa Clawdbot Terasa Sangat Berbeda Dari Chatbot

Clawdbot Berbeda Dengan Chatbot

Sebagian besar alat AI masih beroperasi dalam lingkaran permintaan-respons. Clawdbot mendobrak model itu.

Dalam penggunaan saya sendiri, Clawdbot mampu melakukannya:

  • Hanya meminta masukan yang penting seperti kunci API
  • Mengonfigurasi agen dan alatnya sendiri
  • Mengatur tugas latar belakang tanpa orkestrasi manual
  • Mempertahankan konteks di seluruh sesi

Pergeseran dari “menjawab” menjadi “mengoperasikan” inilah yang membuat banyak pengguna menggambarkannya sebagai pertama kalinya LLM benar-benar terasa seperti agen.

Pengalaman itu saja sudah cukup untuk menjelaskan sebagian besar hype yang ada.

Keajaiban Ada Harganya: Tanda-tanda Awal Kerapuhan Arsitektur

kelemahan Clawdbot

Bahkan tanpa memeriksa basis kode, masalah struktural menjadi jelas melalui penggunaan normal.

Konfigurasi dan status diduplikasi di beberapa lokasi. Misalnya, definisi model dan profil autentikasi ada di lebih dari satu file, sehingga menciptakan beberapa sumber kebenaran. Hal ini menyebabkan penyimpangan konfigurasi dan perilaku yang tidak dapat diprediksi dari waktu ke waktu.

Ini adalah jenis sistem di mana segala sesuatunya bekerja bukan karena arsitekturnya yang bersih, tetapi karena model yang sangat kuat secara konstan memberikan kompensasi.

Masalah Konfigurasi Model yang Segera Anda Sadari dalam Praktik

Salah satu tanda bahaya arsitektural yang paling jelas adalah pemilihan model.

Menggunakan /model secara tidak sengaja memasukkan ID model yang tidak boleh ada: namespace Anthropic yang dipasangkan dengan model Moonshot Kimi. Sistem menerimanya tanpa keluhan, menambahkannya ke daftar model yang tersedia, dan mencoba menggunakannya.

Baru setelah itu kegagalan muncul ke permukaan.

Perilaku ini menunjukkan:

  • Tidak ada validasi tingkat penyedia
  • Tidak ada penegakan skema untuk ID model
  • Asumsi desain bahwa LLM akan mengoreksi sendiri

Untuk agen otonom, ini berbahaya. Konfigurasi yang tidak valid akan gagal dengan cepat. Sebaliknya, Clawdbot menyerahkan kebenaran pada penalaran, yang meningkatkan penggunaan token dan mengurangi keandalan.

Mengapa Claude Opus “Hanya Bekerja” Ketika Segala Sesuatu yang Lain Rusak

Setelah melakukan eksperimen yang ekstensif, sebuah pola menjadi jelas: Claude Opus dapat dengan mudah melewati hampir semua kekacauan.

Bahkan ketika konfigurasi tidak konsisten, dokumentasi tidak lengkap, atau instruksi alat tidak jelas, Opus biasanya pulih. Sonnet dapat menangani pengaturan yang lebih sederhana, tetapi membutuhkan batasan yang lebih ketat. Model yang lebih kecil lebih sering gagal.

Seorang pengguna berpengalaman memperkirakan bahwa agen berbasis Opus penuh waktu secara realistis membutuhkan biaya mulai dari $500 hingga $5.000 per bulan, tergantung pada aktivitas. Hal ini menempatkannya tepat di wilayah “tenaga kerja manusia”.

Kesimpulannya tidak nyaman tetapi jelas: Keandalan Clawdbot saat ini kurang tentang arsitektur yang bagus dan lebih pada melemparkan model yang paling mumpuni yang tersedia pada masalah.

Mengapa Model yang Lebih Kecil dan Lokal Berjuang Dengan Clawdbot

tantangan menjalankan Clawdbot pada model yang lebih kecil/lokal

Dukungan model lokal memang ada, tetapi dalam praktiknya model ini rapuh.

Beberapa pengguna yang mencoba menjalankan Clawdbot pada GPU lokal melaporkan:

  • Aliran pemanggilan alat yang rusak
  • Instruksi yang terlewatkan atau disalahpahami
  • Agen terjebak dalam loop

Bahkan model 30B yang relatif kuat pun hanya dapat bekerja dengan andal setelah pembersihan manual yang ekstensif pada alat, instruksi penurunan harga, dan output UI. Setelah disederhanakan, model ini dapat menangani alur kerja dasar, tetapi tidak dapat menangani tugas-tugas yang rumit dan berjalan lama.

Masalah utamanya adalah bahwa Clawdbot tidak dirancang “model-pertama”. Ia mengasumsikan penalaran yang kuat, jendela konteks yang panjang, dan pemulihan kesalahan. Model-model yang lebih kecil tidak gagal karena mereka lemah, tetapi karena sistemnya menuntut secara kognitif.

Biaya Nyata Menjalankan Agen AI Penuh Waktu

Biaya Riil Menjalankan clawdbot Penuh Waktu

Biaya sebenarnya dari agen AI penuh waktu hanya akan terlihat setelah Anda berhenti “menggunakannya” dan membiarkannya berjalan.

Dalam satu pengujian yang panjang, satu instance Clawdbot terbakar lebih dari 8 juta token di Claude Opus. Ini bukan berasal dari dorongan yang kuat. Sebagian besar token dihabiskan di latar belakang, sementara agen merencanakan, memeriksa tugas, dan menimbang-nimbang keadaannya sendiri.

Itulah perbedaan utama dari penggunaan chat biasa. Model chatting hanya membutuhkan biaya ketika Anda berbicara dengannya. Agen membutuhkan biaya sepanjang waktu.

Kemana Token Sebenarnya Pergi

Kemana Token Clawdbot Sebenarnya Pergi

Dalam penggunaan nyata, pengeluaran token kira-kira seperti ini:

AktivitasApa yang Dilakukan AgenDampak Biaya
Latar belakang alasanBerpikir tentang tujuan dan kondisi saat iniTinggi
Pemeriksaan detak jantungBertanya “apakah saya perlu bertindak sekarang?”Sedang hingga tinggi
Evaluasi pekerjaan CronMeninjau tugas terjadwalSedang
Perencanaan alatMemutuskan alat bantu mana yang akan digunakanTinggi
Pemulihan kesalahanMencoba kembali setelah kegagalanSangat tinggi
Petunjuk penggunaInstruksi langsung dari AndaRendah

Dengan kata lain, sebagian besar biaya berasal dari berpikir, tidak melakukan.

Kisaran Biaya Bulanan Riil

Berdasarkan pengaturan dan laporan nyata, ini adalah angka yang realistis:

Pola PenggunaanBiaya Bulanan Umum
Sebagian besar agen menganggur~$150
Tugas harian yang ringan$300-$500
Otomatisasi aktif$800-$1.500
Agen Opus Berat$2,000–$5,000

Seorang pengguna mengukur sekitar $5 per hari hanya dari loop detak jantung dan pemeriksaan terjadwal. Hal itu saja sudah mencapai lebih dari $150 per bulan, bahkan sebelum pekerjaan yang sesungguhnya terjadi.

Mengapa Biaya Tumbuh Begitu Cepat

Ada tiga alasan utama mengapa biaya meningkat dengan cepat:

  1. Penalaran yang selalu aktif
    Agen terus berpikir, bahkan ketika tidak ada yang terjadi.
  2. Pagar pembatas yang lemah
    Ketika alat gagal atau konfigurasi salah, model mencoba mencari jalan keluar alih-alih berhenti.
  3. Model mahal melakukan pemeriksaan sederhana
    Claude Opus sangat hebat dalam penalaran, tetapi menggunakannya untuk berulang kali bertanya “apakah ada yang bisa dilakukan?” adalah hal yang mahal.

Ketika ada yang rusak, agen sering kali memasuki loop percobaan ulang yang panjang. Setiap percobaan ulang membakar lebih banyak token, meskipun tidak ada kemajuan yang dibuat.

Ketika Agen Masuk Akal Secara Finansial

Di $500-$5.000 per bulan, agen Opus penuh waktu bukan lagi otomatisasi yang murah. Ini bersaing langsung dengan tenaga kerja manusia.

Ini hanya masuk akal ketika:

  • Agen menggantikan waktu rekayasa nyata
  • Tugas berjalan sering dan tanpa pengawasan
  • Peralihan konteks manusia itu mahal

Jika agen sebagian besar mengeksplorasi, bereksperimen, atau menghasilkan output pengisi, biayanya sulit untuk dijustifikasi.

Intinya

Menjalankan agen AI penuh waktu bukanlah tentang jawaban yang murah. Ini adalah tentang membayar untuk penalaran yang berkelanjutan.

Saat ini, kecerdasan semacam itu memang mengesankan, tetapi mahal. Tanpa batasan yang ketat pada langkah, alat, dan anggaran token, biaya tidak hanya tinggi, tetapi juga tidak dapat diprediksi.

Bagi sebagian besar pengguna, tantangan sebenarnya adalah tidak membuat agen bekerja.
Hal ini membuat mereka sepadan dengan uangnya.

Token Tersembunyi Terbakar Dari Detak Jantung dan Pekerjaan Cron

Tugas detak jantung dan pemeriksaan cron adalah pembunuh anggaran yang diam-diam.

Satu pengguna mengukur kira-kira $5 per hari dihabiskan hanya untuk memikirkan detak jantung dan evaluasi tugas yang terjadwal. Lebih dari sebulan, waktu tersebut akan bertambah dengan cepat, bahkan sebelum pekerjaan yang berarti dimulai.

Tanpa batas yang keras:

  • Langkah-langkah penalaran maksimal
  • Jumlah pemanggilan alat
  • Anggaran token

agen akan dengan senang hati melanjutkan perulangan. Ini bukanlah sebuah bug. Ini adalah hasil alami dari pemberian otonomi model tanpa batasan ekonomi yang ketat.

Risiko Keamanan dan Mengapa Lingkungan Sekali Pakai Wajib Digunakan

Masalah keamanan muncul berulang kali selama pengujian dan diskusi.

Sistem:

  • Menjalankan perintah shell
  • Memodifikasi repositori
  • Mengelola kredensial
  • Mengembangkan kodenya sendiri

Masalah keamanan segera muncul selama pengujian di dunia nyata.

Dalam satu pengujian terkontrol, saya memberikan Clawdbot akses ke sebuah kotak surat dan memintanya untuk membantu “memproses email.” Saya kemudian mengirim satu email dengan kata-kata yang hati-hati ke kotak masuk tersebut. Pesan itu mengaburkan batas antara instruksi dan konten. Dalam hitungan detik, agen tersebut membaca beberapa email yang tidak berhubungan dan meneruskannya ke alamat eksternal yang disematkan di dalam pesan. Tidak ada eksploitasi yang terlibat. Tidak ada malware. Hanya bahasa biasa.

Hal ini membuat satu hal menjadi sangat jelas: sistem tidak dapat secara andal mengetahui siapa yang memberikan instruksi. Konten apa pun yang dibacanya bisa menjadi instruksi. Email, halaman web, pesan obrolan, dan dokumen semuanya termasuk dalam kategori ini. Setelah komunikasi eksternal diaktifkan, penyaringan data menjadi sepele.

Risiko tumbuh dengan cepat karena apa yang diizinkan untuk dilakukan oleh sistem. Dalam pengaturan saya, Clawdbot dapat menjalankan perintah shell, memodifikasi repositori, mengelola kredensial, dan memperbarui kodenya sendiri. Satu perintah yang buruk atau langkah “pembersihan” yang berhalusinasi dapat menghapus file, membocorkan rahasia, atau merusak lingkungan. Hal ini bukan hanya teori. Beberapa pengguna melaporkan mencopot pemasangan alat ini sepenuhnya setelah menyadari bahwa alat ini secara efektif bertindak seperti sudo yang dikendalikan oleh obrolan.

Saya juga menguji model penerapan yang berbeda. Menjalankannya di atas logam kosong atau mesin pribadi langsung terasa tidak aman. Memindahkannya ke VM khusus atau VPS berbiaya rendah memang membantu, tetapi hanya karena itu membatasi radius ledakan. Tidak ada yang benar-benar mencegah penyalahgunaan. Itu hanya membuat kegagalan menjadi lebih murah.

Pola paling aman yang saya temukan adalah dengan mengasumsikan kompromi secara default. Setiap contoh harus sekali pakai. Tidak ada email pribadi. Tidak ada kredensial nyata. Tidak ada akses ke repositori penting. Beberapa pengaturan melangkah lebih jauh dengan memblokir email keluar sepenuhnya, memaksa semua pesan dialihkan ke satu alamat terkontrol. Yang lainnya menggunakan daftar putih yang ketat atau langkah-langkah persetujuan manual sebelum tindakan eksternal.

Batasan-batasan ini mengurangi apa yang bisa dilakukan oleh agen, tetapi memang diperlukan. Tanpa batasan izin yang tegas, sandbox, dan isolasi, Clawdbot tidak cocok untuk lingkungan tepercaya atau produksi. Perlakukanlah seperti sebuah proses yang tidak dipercaya, bukan karyawan digital. Jika rusak, bocor, atau terhapus sendiri, sistem ini harus murah dan mudah dibuang.

Apakah Clawdbot Hanya Sekedar Pembungkus? Membandingkannya Dengan n8n dan Cron

Dari perspektif teknis murni, sebagian besar dari apa yang dilakukan Clawdbot dapat direplikasi dengan alat yang ada seperti pekerjaan cron, alur kerja n8n, dan integrasi perpesanan.

Perbedaannya bukanlah kemampuan, tetapi biaya integrasi.

Clawdbot menghilangkan gesekan pengaturan. Anda tidak menyambungkan pipa. Anda menjelaskan maksud. Bagi pengguna yang bukan insinyur atau pengguna yang memiliki waktu terbatas, hal itu lebih penting daripada kemurnian arsitektur.

Kasus Penggunaan Nyata yang Benar-Benar Masuk Akal dalam Praktiknya

Satu alur kerja dari penggunaan saya sendiri menyoroti di mana Clawdbot bersinar.

Saya ingin menyesuaikan konfigurasi otomatisasi rumah yang sudah ada. Alih-alih membuka laptop, saya mengirim pesan singkat. Agen:

  • Mengkloning repositori yang relevan
  • Menemukan file otomatisasi yang benar
  • Melakukan perubahan
  • Membuka permintaan penarikan
  • Menunggu persetujuan manusia

Tidak ada yang tidak mungkin dilakukan secara manual. Yang berharga adalah bahwa hal itu terjadi tanpa pengalihan konteks.

Dalam kasus ini, Clawdbot berperilaku tidak seperti chatbot dan lebih seperti insinyur junior yang menangani bagian yang membosankan.

Masalah Utama: Produk Pertama yang Mencari Masalah dengan AI

Banyak kritik terhadap Clawdbot yang valid.

Sebagian besar alur kerja agen mengotomatiskan tugas-tugas yang dapat diselesaikan lebih cepat oleh manusia, tanpa membakar ribuan token. Dalam kasus-kasus tersebut, agen menambah biaya tanpa menambah leverage.

Hal ini mencerminkan masalah yang lebih luas dalam AI saat ini: ketertarikan pada kemampuan sering kali muncul sebelum mengidentifikasi masalah nyata yang perlu dipecahkan.

Mengapa Clawdbot Masih Layak Dipelajari Sebagai Proyek Sumber Terbuka

Bahkan dengan segala kekurangannya, Clawdbot tetaplah penting.

Ini menunjukkan apa yang terjadi ketika otonomi, alat, memori, dan penalaran bertabrakan dalam satu sistem. Garpu, peniru, dan penyempurnaan tidak dapat dihindari. Implementasi saat ini mungkin tidak akan bertahan, tetapi ide-idenya akan bertahan.

Banyak alat yang berpengaruh terlihat kasar pada awalnya. Yang penting adalah arahnya.

Kemana Arah AI Agentic Sebenarnya Menuju

Jalan yang paling menjanjikan ke depan adalah hibrida.

Model lokal atau model yang lebih kecil menangani manajemen konteks dan pemeriksaan rutin. Model yang mahal seperti Claude Opus hanya digunakan untuk penalaran yang kompleks atau keputusan yang berdampak tinggi.

Clawdbot mengisyaratkan masa depan itu, meskipun belum mengimplementasikannya dengan baik.

Keputusan Akhir: Haruskah Anda Menggunakan Clawdbot?

Clawdbot layak digunakan jika:

  • Anda ingin memahami masa depan AI agenik
  • Anda merasa nyaman bereksperimen dengan biaya dan ketidakstabilan
  • Anda memperlakukannya sebagai alat pembelajaran, bukan infrastruktur

Tidak layak digunakan jika:

  • Anda membutuhkan biaya yang dapat diprediksi
  • Anda membutuhkan jaminan keamanan yang kuat
  • Anda sudah memiliki saluran pipa otomatisasi yang bersih

Ketika berhasil, rasanya seperti masa depan.
Jika tidak, hal ini mengingatkan Anda betapa kita masih terlalu dini.

Ketegangan itulah yang membuat Clawdbot sangat menarik - dan mengapa harus didekati dengan mata yang jernih.

Bagikan Postingan:

Postingan Terkait

GlobalGPT