오픈클로 전체 리뷰: 8백만 토큰 실험의 숨겨진 비용

2026-01-28
18:10
클로드 맥켄지
마지막 업데이트 2026-02-03

간단한 답변: 오픈클로(이전의 클로봇/몰트봇)는 현재 가장 설득력 있는 에이전트 AI 경험을 제공하지만, 취약한 아키텍처, 극심한 토큰 소비, 실질적인 보안상의 단점을 가지고 있습니다. 실제 사용 시에는 마치 인공지능 비서와 상호작용하는 것처럼 느껴지지만, 그 환상이 깨지기 시작합니다.

OpenClaw는 강력할 수 있지만 대규모로 운영하기에는 복잡하고 비용이 많이 듭니다. 많은 일상적인 AI 작업에 적합합니다, GlobalGPT 는 더 간단하고 비용 효율적인 대안입니다. 다음과 같은 최고의 AI 모델에 액세스할 수 있습니다. 클로드 오푸스 4.5, GPT 5.2, Gemini 3 Pro 및 당혹감 단일 플랫폼에서 AI를 활용하세요.

다음을 사용하여 이미지를 생성할 수도 있습니다. 나노 바나나 프로 를 사용하여 동영상을 만들거나 소라 2 프로-단일 통합 플랫폼에서 모든 것을 이용할 수 있습니다. 여러 계정이나 설정에 신경 쓰지 않고도 고급 AI 도구를 쉽게 탐색할 수 있습니다.

글쓰기, 이미지 및 동영상 생성을 위한 올인원 AI 플랫폼(GPT-5, Nano Banana 등)

글로벌 GPT에서 100개 이상의 AI 모델 체험하기

클로봇(몰트봇)이란 무엇이며 어떤 문제를 해결한다고 주장하나요?

최근 몰트봇으로 이름이 바뀐 클로봇(Clawdbot), 는 대규모 언어 모델에 실질적인 자율성을 부여하도록 설계된 오픈 소스 에이전트 AI CLI입니다. 프롬프트에 응답하는 대신 스스로 구성하고, 도구를 관리하고, 크론 작업을 실행하고, 리포지토리와 상호 작용하고, 시간이 지남에 따라 다단계 작업을 실행할 수 있습니다.

목표는 더 나은 채팅이 아닙니다. 목표는 다음과 같은 AI입니다. 행위.

실제 테스트 결과, 이러한 약속은 마케팅 과대광고가 아닙니다. Clawdbot을 사용하면 상태 정보가 없는 챗봇이 아닌 영구적인 AI 어시스턴트와 상호작용하는 것처럼 느껴집니다.

클로봇이 챗봇과 근본적으로 다른 이유

대부분의 AI 도구는 여전히 요청-응답 루프에서 작동합니다. 클로봇은 이러한 모델을 깨뜨립니다.

제가 직접 사용해본 결과, Clawdbot은 그렇게 할 수 있었습니다:

API 키와 같은 필수 입력만 요청하세요.
자체 에이전트 및 도구 구성
수동 오케스트레이션 없이 백그라운드 작업 설정하기
세션 전반에서 컨텍스트 유지

“응답'에서 ”운영'으로의 전환은 많은 사용자들이 LLM이 진정한 에이전트 역할을 처음으로 느꼈다고 말하는 이유입니다.

이러한 경험만으로도 대부분의 과대 광고가 설명됩니다.

마법에는 대가가 따릅니다: 아키텍처 취약성의 첫 번째 징후

코드베이스를 검사하지 않더라도 일반적인 사용을 통해 구조적인 문제가 분명해집니다.

구성 및 상태가 여러 위치에 중복되어 있습니다. 예를 들어, 모델 정의와 인증 프로필이 둘 이상의 파일에 존재하여 여러 개의 신뢰할 수 있는 소스가 생성됩니다. 이로 인해 시간이 지남에 따라 구성이 변동되고 예측할 수 없는 동작이 발생합니다.

아키텍처가 깔끔해서가 아니라 매우 강력한 모델이 지속적으로 보정하기 때문에 작동하는 시스템입니다.

실무에서 즉시 발견할 수 있는 모델 구성 문제

가장 명확한 아키텍처 적신호 중 하나는 모델 선택입니다.

사용하는 /모델 명령을 실행할 때 실수로 존재할 수 없는 모델 ID, 즉 문샷 키미 모델과 페어링된 Anthropic 네임스페이스를 입력했습니다. 시스템은 아무 문제 없이 이를 수락하고 사용 가능한 모델 목록에 추가한 후 사용을 시도했습니다.

나중에야 실패가 드러났습니다.

이 동작은 다음과 같이 제안합니다:

공급자 수준 유효성 검사 없음
모델 ID에 대한 스키마 적용 없음
LLM이 자체 수정된다는 설계 가정

자율 에이전트의 경우 이는 위험합니다. 잘못된 구성은 빠르게 실패해야 합니다. 대신 Clawdbot은 정확성을 추론으로 미루기 때문에 토큰 사용량이 증가하고 안정성이 떨어집니다.

다른 모든 것이 고장 났을 때 클로드 오푸스가 “그냥 작동”하는 이유

광범위한 실험을 통해 패턴이 분명해집니다: 클로드 오푸스는 거의 모든 혼란을 무차별적으로 처리할 수 있습니다..

구성이 일관되지 않거나 문서가 불완전하거나 도구 지침이 모호한 경우에도 Opus는 대개 복구합니다. Sonnet은 더 간단한 설정을 처리할 수 있지만 더 엄격한 제약 조건이 필요합니다. 소규모 모델은 훨씬 더 자주 실패합니다.

한 숙련된 사용자는 풀타임 Opus 기반 에이전트의 현실적인 비용을 다음과 같이 추정했습니다. 월 $500 ~ $5,000, 활동량에 따라 다릅니다. 이는 바로 “인간 노동'의 영역에 속합니다.

불편하지만 분명한 점은 Clawdbot의 현재 안정성은 좋은 아키텍처가 아니라 가장 유능한 모델을 문제에 투입한 결과라는 점입니다.

소규모 및 로컬 모델이 클로봇으로 어려움을 겪는 이유

로컬 모델 지원은 존재하지만 실제로는 취약합니다.

로컬 GPU에서 클로봇을 실행하려고 시도하는 여러 사용자가 보고되었습니다:

깨진 도구 호출 흐름
누락되었거나 잘못 이해한 지침
에이전트가 루프에 갇히는 경우

비교적 강력한 30B 모델도 도구, 마크다운 지침 및 UI 출력에 대한 광범위한 수동 정리를 거친 후에야 안정적으로 작동했습니다. 일단 단순화하면 기본적인 워크플로는 처리할 수 있었지만 복잡하고 오래 걸리는 작업은 처리할 수 없었습니다.

핵심 문제는 Clawdbot이 “모델 우선”으로 설계되지 않았다는 점입니다. 강력한 추론, 긴 컨텍스트 창 및 오류 복구를 가정합니다. 작은 모델은 약해서 실패하는 것이 아니라 시스템이 인지적으로 까다롭기 때문에 실패하는 것입니다.

풀타임 AI 에이전트 운영의 실제 비용

풀타임 AI 에이전트의 실제 비용은 “사용'을 중단하고 단순히 실행만 하게 되면 명확해집니다.

한 긴 테스트에서 단일 Clawdbot 인스턴스가 연소되었습니다. 클로드 오푸스의 8백만 개 이상의 토큰. 이는 과도한 프롬프트에서 비롯된 것이 아닙니다. 에이전트가 작업을 계획하고, 확인하고, 자체 상태를 추론하는 동안 대부분의 토큰은 백그라운드에서 소비되었습니다.

이것이 일반적인 채팅 사용과 가장 큰 차이점입니다. 채팅 모델은 사용자가 대화할 때만 비용이 발생합니다. 상담원은 비용이 듭니다. 항상.

토큰이 실제로 사용되는 곳

실제 사용 시 토큰 지출은 대략 다음과 같이 분류됩니다:

활동	에이전트가 하는 일	비용 영향
배경 추론	목표와 현재 상태에 대해 생각하기	높음
심장 박동 확인	“지금 행동해야 하나요?”라고 묻습니다.”	중간에서 높은
Cron 작업 평가	예약된 작업 검토	Medium
도구 계획	사용할 도구 결정하기	높음
오류 복구	실패 후 재시도	매우 높음
사용자 프롬프트	사용자가 직접 지시	낮음

즉, 대부분의 비용은 다음에서 발생합니다. 생각, 하지 않습니다.

실제 월별 비용 범위

실제 설정과 보고서를 기반으로 한 현실적인 수치입니다:

사용 패턴	일반적인 월별 비용
대부분 유휴 에이전트	~$150
가벼운 일상 업무	$300-$500
능동적 자동화	$800-$1,500
헤비 오퍼스 에이전트	$2,000–$5,000

한 사용자가 측정한 결과 하루 $5 하트비트 루프와 예약된 점검으로만 지출됩니다. 이것만으로도 실제 작업이 일어나기 전에도 한 달에 $150 이상을 추가할 수 있습니다.

비용이 빠르게 증가하는 이유

비용이 빠르게 증가하는 데에는 크게 세 가지 이유가 있습니다:

상시 추론
상담원은 아무 일도 일어나지 않을 때에도 계속 생각합니다.
약한 가드레일
도구가 실패하거나 구성이 잘못되면 모델은 멈추지 않고 추론하여 해결 방법을 찾으려고 합니다.
간단한 점검을 수행하는 고가의 모델
클로드 오푸스는 추론에 능숙하지만 “할 일이 없나요?”라고 반복해서 묻는 데 사용하면 비용이 많이 듭니다.

무언가가 중단되면 에이전트는 종종 긴 재시도 루프에 들어갑니다. 재시도할 때마다 진전이 없더라도 더 많은 토큰이 소진됩니다.

에이전트가 재정적으로 합리적일 때

에서 월 $500-$5,000, 풀타임 오퍼스 에이전트는 더 이상 값싼 자동화가 아닙니다. 사람의 노동력과 직접 경쟁합니다.

다음과 같은 경우에만 의미가 있습니다:

에이전트가 실제 엔지니어링 시간을 대체합니다.
작업은 감독 없이 자주 실행됩니다.
인간 컨텍스트 전환은 비용이 많이 듭니다.

에이전트가 주로 탐색, 실험 또는 필러 결과물을 생성하는 경우 비용을 정당화하기 어렵습니다.

결론

풀타임 AI 에이전트를 운영하는 것은 값싼 답변이 아닙니다. 지속적인 추론에 대한 비용을 지불하는 것입니다.

현재로서는 이러한 종류의 인텔리전스는 인상적이지만 비용이 많이 듭니다. 단계, 도구, 토큰 예산에 대한 엄격한 제한이 없으면 비용이 높을 뿐만 아니라 예측할 수 없습니다.

대부분의 사용자에게 진정한 문제는 에이전트를 작동시키지 않는 것입니다.
그것은 그들을 만들고 있습니다 그만한 가치.

하트비트 및 크론 작업에서 숨겨진 토큰 소각

하트비트 작업과 크론 검사는 조용한 예산 킬러입니다.

한 사용자는 대략 다음과 같이 측정했습니다. 하루 $5 는 순전히 심장 박동 추론과 예정된 작업 평가에만 소비됩니다. 한 달이 넘으면 의미 있는 작업이 시작되기도 전에 그 시간이 금세 늘어납니다.

엄격한 제한 없이:

최대 추론 단계
도구 호출 횟수
토큰 예산

를 입력하면 상담원이 계속 반복합니다. 이것은 버그가 아닙니다. 엄격한 경제적 제약 없이 모델에 자율성을 부여하면 자연스럽게 발생하는 결과입니다.

보안 위험과 일회용 환경이 필수인 이유

테스트와 토론 과정에서 보안 문제가 반복적으로 제기되었습니다.

시스템:

셸 명령을 실행합니다.
리포지토리 수정
자격 증명 관리
자체 코드 진화

보안 문제는 실제 테스트 중에 거의 즉시 나타났습니다.

한 통제된 테스트에서는 Clawdbot에게 사서함에 대한 액세스 권한을 부여하고 “이메일 처리”를 도와달라고 요청했습니다. 그런 다음 그 받은 편지함으로 신중하게 작성된 이메일 한 통을 보냈습니다. 이 메시지는 지시와 내용 사이의 경계를 모호하게 만들었습니다. 몇 초 만에 에이전트는 관련 없는 여러 개의 이메일을 읽고 메시지에 포함된 외부 주소로 전달했습니다. 익스플로잇은 사용되지 않았습니다. 멀웨어도 없었습니다. 그냥 평범한 언어였습니다.

이를 통해 한 가지 분명해진 것은 시스템에서 누가 지시를 내리는지 확실하게 알 수 없다는 것입니다. 시스템이 읽는 모든 콘텐츠가 지시가 될 수 있습니다. 이메일, 웹 페이지, 채팅 메시지, 문서가 모두 이 범주에 속합니다. 외부 통신이 활성화되면 데이터 유출은 사소한 일이 됩니다.

시스템에서 허용되는 작업으로 인해 위험은 빠르게 증가합니다. 제 설정에서 Clawdbot은 셸 명령을 실행하고, 리포지토리를 수정하고, 자격 증명을 관리하고, 자체 코드를 업데이트할 수 있었습니다. 잘못된 프롬프트나 잘못된 “정리” 단계 한 번으로 파일이 삭제되거나, 비밀이 유출되거나, 환경이 손상될 수 있습니다. 이는 이론적인 문제가 아닙니다. 몇몇 사용자는 이 도구가 사실상 채팅으로 제어되는 sudo처럼 작동한다는 사실을 깨닫고 완전히 제거했다고 보고했습니다.

또한 다양한 배포 모델을 테스트했습니다. 베어메탈이나 개인용 컴퓨터에서 실행하면 거의 즉시 안전하지 않은 느낌이 들었습니다. 전용 가상 머신이나 저비용 VPS로 옮긴 것이 도움이 되었지만, 폭발 반경이 제한되어 있었기 때문입니다. 악용을 완전히 방지할 수 있는 방법은 없었습니다. 장애 발생 시 비용만 줄일 수 있었을 뿐입니다.

제가 찾은 가장 안전한 패턴은 기본적으로 타협을 가정하는 것이었습니다. 각 인스턴스는 일회용이어야 합니다. 개인 이메일이 없어야 합니다. 실제 자격 증명이 없어야 합니다. 중요한 리포지토리에 대한 액세스 권한이 없습니다. 일부 설정은 아웃바운드 이메일을 완전히 차단하여 모든 메시지가 제어되는 단일 주소로 리디렉션되도록 하는 방식으로 더 나아가기도 했습니다. 다른 설정은 외부 작업 전에 엄격한 화이트리스트 또는 수동 승인 단계를 사용했습니다.

이러한 제약 조건은 에이전트가 할 수 있는 일을 제한하지만 반드시 필요합니다. 엄격한 권한 경계, 샌드박싱 및 격리가 없는 Clawdbot은 신뢰할 수 있는 환경이나 프로덕션 환경에는 적합하지 않습니다. 디지털 직원이 아닌 신뢰할 수 없는 프로세스처럼 취급하세요. 시스템이 고장나거나 누수가 발생하거나 스스로 지워지는 경우, 저렴하고 쉽게 버릴 수 있는 시스템이어야 합니다.

Clawdbot은 단순한 래퍼일까요? n8n 및 크론과 비교하기

순전히 기술적 관점에서 볼 때, Clawdbot이 수행하는 대부분의 작업은 크론 작업, n8n 워크플로 및 메시징 통합과 같은 기존 도구로 복제할 수 있습니다.

차이점은 기능이 아니라 통합 비용.

Clawdbot은 설정 마찰을 제거합니다. 파이프라인을 연결하지 않아도 됩니다. 의도를 설명하면 됩니다. 엔지니어가 아니거나 시간에 쫓기는 사용자에게는 아키텍처의 순수성보다 더 중요한 요소입니다.

실제로 의미가 있는 실제 사용 사례

제가 직접 사용한 한 워크플로에서 Clawdbot의 강점을 확인할 수 있습니다.

기존 홈 오토메이션 구성을 조정하고 싶었습니다. 노트북을 여는 대신 짧은 메시지를 보냈습니다. 상담원입니다:

관련 리포지토리 복제
올바른 자동화 파일 찾기
변경 완료
풀 리퀘스트 열기
사람의 승인을 기다리는 중

수동으로 불가능한 것은 없습니다. 중요한 것은 컨텍스트 전환 없이도 가능하다는 점입니다.

이러한 경우 클로봇은 챗봇이라기보다는 지루한 부분을 처리하는 주니어 엔지니어처럼 행동합니다.

핵심 문제: AI 우선 제품에서 문제 찾기

클로봇에 대한 많은 비판은 타당합니다.

상담원 워크플로우의 상당 부분은 수천 개의 토큰을 소모하지 않고도 사람이 더 빨리 완료할 수 있는 작업을 자동화합니다. 이러한 경우 상담원은 레버리지를 추가하지 않고도 비용을 추가합니다.

이는 현재 AI의 더 광범위한 문제를 반영합니다. 해결해야 할 실제 문제를 파악하기 전에 기능에 매료되는 경우가 많다는 것입니다.

클로봇이 여전히 오픈소스 프로젝트로서 연구할 가치가 있는 이유

모든 결함이 있더라도 클로봇은 중요합니다.

자율성, 도구, 기억, 추론이 하나의 시스템에서 충돌할 때 어떤 일이 일어나는지 보여줍니다. 포크, 모방, 개선은 불가피합니다. 현재의 구현은 살아남지 못할 수도 있지만 아이디어는 살아남을 것입니다.

많은 영향력 있는 도구들이 처음에는 거칠어 보입니다. 중요한 것은 방향성입니다.

에이전트 AI가 실제로 향하고 있는 방향

앞으로 가장 유망한 경로는 하이브리드입니다.

로컬 또는 소규모 모델은 컨텍스트 관리와 일상적인 점검을 처리합니다. 클로드 오푸스 같은 고가의 모델은 복잡한 추론이나 영향력이 큰 의사 결정에 대해서만 호출됩니다.

클로봇은 아직 완벽하게 구현하지는 못했지만 그 미래를 암시하고 있습니다.

최종 결론: 클로봇을 사용해야 할까?

Clawdbot은 다음과 같은 경우에 사용할 가치가 있습니다:

에이전트 AI의 미래를 이해하고 싶으신가요?
비용과 불안정성을 감수하고 실험하는 것이 편합니다.
인프라가 아닌 학습 도구로 취급합니다.

다음과 같은 경우에는 사용할 가치가 없습니다:

예측 가능한 비용이 필요합니다.
강력한 보안 보장이 필요합니다.
이미 깨끗한 자동화 파이프라인을 보유하고 있습니다.

그것이 작동하면 미래처럼 느껴집니다.
그렇지 않을 때는 우리가 아직 얼마나 이른 시기인지 상기시켜 줍니다.

이러한 긴장감이 바로 클로봇이 매력적인 이유이며, 명확한 시각으로 접근해야 하는 이유이기도 합니다.

게시물을 공유하세요: