서브에이전트와 에이전트팀(Agent Teams)의 토큰 비용 차이는 최대 86%입니다. 동일한 Morning Briefing 작업 기준, 서브에이전트는 약 $3.41, 에이전트팀은 약 $0.47이 듭니다. 2026년 2월 현재 Claude Code Agent Teams는 실험적 기능이지만, 토큰 효율성에서 압도적인 차이를 보입니다.

나도 이게 맞는 건가 싶었어요
처음엔 그냥 지나쳤어요. “서브에이전트 쓰면 되지 뭐” 했거든요.
근데 어느 날 morning-briefing 실행하고 토큰 사용량 보니까… 한 번 돌리는데 거의 100만 토큰이 찍히더라고요. “이게 맞나?” 싶었어요.
솔직히 좀 무서웠습니다. Pro 플랜 $20/월 쓰는데, 이 속도면 하루에 몇 번 브리핑 돌리면 끝이잖아요.
그래서 파헤쳐봤어요. 왜 이렇게 토큰을 많이 먹는지.
서브에이전트의 함정: 컨텍스트 누적
서브에이전트(Subagent)란? Claude Code에서 메인 에이전트가 특정 작업을 위임하는 단일 에이전트입니다. 하나의 컨텍스트 윈도우 안에서 모든 작업이 순차적으로 진행됩니다.
여기서 핵심 문제가 뭐냐면요.
서브에이전트는 매 턴마다 이전 컨텍스트 전체를 다시 전송합니다.
턴 1: 시스템 프롬프트 4K + 검색 호출 0.2K = 4.2K 입력 턴 2: 이전 4.2K + 검색결과 1.5K + 다음 검색 0.2K = 5.9K 입력 턴 3: 이전 5.9K + 검색결과 1.5K + 다음 검색 0.2K = 7.6K 입력 ... 턴 20: 이전 ~35K + 검색결과 1.5K + 다음 검색 = ~37K 입력 턴 30: 이전 ~55K + 브리핑 생성 5K = ~60K 입력
최종 컨텍스트는 60K지만, 누적으로 보면 ~960K 토큰을 소비합니다.
근데 진짜 웃긴 게요. 저는 “60K면 괜찮네” 하고 있었거든요. 누적 합계가 거의 백만 토큰인 줄도 모르고요.
실제 비용 계산: 한 번 브리핑에 $3.41
제가 쓰던 morning-briefing 구조를 보면요:
Claude Code (메인)
└── Task subagent: morning-briefing (sonnet)
├── STEP 1: WebSearch x20 (시장 데이터)
├── STEP 2: 뉴스 필터링
├── STEP 3: 파일 읽기 (blog-ideas, coach-log 등)
├── STEP 4: trading-coach 체크
├── STEP 5: 매크로 이벤트 정리
└── STEP 6: 브리핑 생성 + 저장
Sonnet 단일 서브에이전트 비용 (현재)
| 항목 | 값 |
|---|---|
| 모델 | claude-sonnet-4-5 |
| 입력 단가 | $3 / 1M tokens |
| 출력 단가 | $15 / 1M tokens |
| 누적 입력 토큰 | ~960K |
| 총 출력 토큰 | ~35K |
| 입력 비용 | 960K × $3/M = $2.88 |
| 출력 비용 | 35K × $15/M = $0.53 |
| 총 비용 | ~$3.41 |
| 소요 시간 | 3-5분 (순차) |
Pro 플랜 쓴다고 해도 이 토큰 소모 속도가 곧 사용 가능 시간이에요. 한 번에 거의 100만 토큰 쓰면 금방 바닥납니다.
에이전트팀: 같은 일을 86% 저렴하게
에이전트팀(Agent Teams)이란? Claude Code의 실험적 기능으로, 팀 리더가 여러 전문 에이전트에게 작업을 병렬로 위임하는 멀티에이전트 구조입니다. 각 에이전트가 독립된 컨텍스트로 작업합니다.
에이전트팀으로 재구성하면 이렇게 됩니다:
Team Lead (sonnet) ├── market-scanner (haiku) → WebSearch x8, 시장 데이터 ├── crypto-scanner (haiku) → WebSearch x4, 크립토 데이터 ├── news-analyst (haiku) → WebSearch x3, 뉴스 선별 ├── blog-analyst (haiku) → 파일 읽기 + WebSearch x5 ├── trading-coach (haiku) → 파일 읽기, 거래 적합도 └── report-writer (sonnet) → 모든 결과 합성 → 최종 브리핑
왜 이렇게 차이가 나나?
핵심은 이거예요:
서브에이전트: 단일 컨텍스트에 모든 것이 쌓임 → 턴 1: 4K 입력 → 턴 15: 25K 입력 (이전 14턴 누적) → 턴 30: 60K 입력 (이전 29턴 누적) → 누적 합계: ~960K 😱 에이전트팀: 각자 작은 컨텍스트 → market-scanner: 최대 12K → crypto-scanner: 최대 6K → news-analyst: 최대 5K → 각각의 누적이 작음 → 총합이 작음
서브에이전트의 비용은 “최종 컨텍스트 크기”가 아니라 “턴 수 × 평균 컨텍스트”로 결정됩니다. 턴이 많을수록 기하급수적으로 비싸져요.
에이전트팀 세부 비용
| 에이전트 | 모델 | 누적 입력 | 출력 | 비용 |
|---|---|---|---|---|
| Team Lead | sonnet | 48K | 5K | $0.22 |
| market-scanner | haiku | 56K | 5K | $0.02 |
| crypto-scanner | haiku | 16K | 3K | $0.008 |
| news-analyst | haiku | 10.5K | 3K | $0.007 |
| blog-analyst | haiku | 64K | 4K | $0.021 |
| trading-coach | haiku | 15K | 2K | $0.007 |
| report-writer | sonnet | 36K | 5K | $0.19 |
| 합계 | – | 245.5K | 27K | $0.47 |
한 눈에 비교
| 항목 | 서브에이전트 (현재) | 에이전트팀 |
|---|---|---|
| 모델 | sonnet 단일 | sonnet 2 + haiku 5 |
| 누적 입력 토큰 | ~960K | ~245K |
| 출력 토큰 | ~35K | ~27K |
| 총 비용 | ~$3.41 | ~$0.47 |
| 비용 절감 | 기준 | -86% |
| 소요 시간 | 3-5분 (순차) | 1-2분 (병렬) |
| 시간 절감 | 기준 | -50~60% |
| 컨텍스트 압박 | 높음 (60K+ 단일) | 낮음 (분산) |
이거 보고 솔직히 “진작 바꿀걸” 했어요.
내가 느낀 점: 왜 이걸 이제야 알았을까
막연히 “에이전트팀이 더 좋겠지” 정도로 생각했거든요. 근데 숫자로 보니까 충격이었어요.
같은 작업인데 7배 차이라니요.
솔직히 좀 억울하기도 했어요. 그동안 얼마나 토큰을 낭비했을까 싶어서요.
그러면 나는 어떻게 해야 하지?
당장 할 수 있는 최적화
에이전트팀으로 전환하지 않아도 비용을 줄이는 방법이 있어요:
| 방법 | 절감 | 난이도 |
|---|---|---|
| sonnet → haiku로 변경 | -80% ($3.41→$0.68) | 쉬움 |
| WebSearch 20개 → 10개로 줄이기 | -30% | 중간 |
| 파일 읽기 최소화 | -10% | 쉬움 |
가장 쉬운 첫 번째 스텝: morning-briefing의 model: sonnet → model: haiku 변경. 이것만으로 $3.41 → $0.68 (80% 절감).
단계별 전환 로드맵
단계 1 (즉시): morning-briefing 모델을 haiku로 변경 → 비용 ~$0.68, 품질 약간 하락 → 리스크: 낮음 단계 2 (단기): WebSearch 쿼리 통합 (20→12개) → 관련 검색을 하나로 묶기 → "BTC ETH SOL price" 하나로 3개 검색 대체 → 비용 ~$0.50 단계 3 (중기): Agent Teams 전환 → haiku 5 + sonnet 2 에이전트 → 비용 ~$0.47, 속도 2배 → 리스크: Agent Teams가 아직 실험적 단계 4 (장기): SDK 기반 프로덕션 → Python/TypeScript SDK로 워크플로우 고정 → 스케줄러 연동 (cron → 매일 7시 실행) → 비용 ~$0.30 (최적화 후)
3단계 모델 전략: haiku / sonnet / opus
에이전트팀의 핵심은 작업 단계별로 모델을 다르게 쓰는 것이에요.
수집 (haiku) → 분석 (sonnet) → 판단 (opus) $0.25/M $3/M $15/M WebSearch 요약, 구조화 전략, 매매 결정
모델별 적합 작업
| 단계 | 모델 | 단가 (입력/출력) | 적합한 작업 |
|---|---|---|---|
| 수집 | haiku | $0.25 / $1.25 | WebSearch, 파일 읽기, 데이터 추출 |
| 분석 | sonnet | $3 / $15 | 요약, 필터링, 패턴 인식, 브리핑 합성 |
| 판단 | opus | $15 / $75 | 매매 결정, 전략 수립, 복잡한 추론 |
💬 개인적으로 이 구분이 가장 도움이 됐어요. 대부분의 작업에 Opus가 필요 없다는 걸 깨달았거든요.
Opus가 진짜 필요한 3가지 순간
- 돈이 걸린 최종 판단 — 매수/매도 결정, 포트폴리오 리밸런싱
- 복잡한 멀티스텝 추론 — 여러 분석 결과 종합 → 하나의 결론
- 창의적 전략 수립 — 새로운 에이전트 아키텍처, 비즈니스 전략
나머지? haiku랑 sonnet으로 충분해요.
에이전트팀 구성 시 주의점
1. report-writer가 핵심
모든 워커의 결과를 합쳐서 브리핑을 만드는 report-writer가 가장 비용이 많이 드는 에이전트예요 ($0.19 = 전체의 40%). 여기만큼은 sonnet 유지 권장.
2. 워커 간 의존성 없게
✅ 좋은 설계: market-scanner ──┐ crypto-scanner ──├── 병렬 → report-writer news-analyst ────┤ blog-analyst ────┤ trading-coach ───┘ ❌ 나쁜 설계: market-scanner → crypto-scanner → news-analyst (순차)
3. 결과 파일 규격 통일
각 워커가 동일한 마크다운 템플릿으로 결과를 저장하면 report-writer의 파싱이 쉬워지고 토큰도 줄어요.
# {섹션명}
## 데이터
| 항목 | 값 | 변화 | 메모 |
...
## 핵심 인사이트
1. ...
2. ...
🎯 핵심 메시지: 서브에이전트 길게 쓰고 계시다면 팀으로 쪼개세요
결론은 간단해요. 서브에이전트를 길게 쓰고 계신 분이라면, 지금 당장 팀으로 쪼개서 쓰는 게 좋습니다.
왜냐면요:
- 턴이 많을수록 손해 — 서브에이전트는 턴마다 컨텍스트가 누적되는 구조예요. 20턴, 30턴 넘어가면 토큰 비용이 기하급수적으로 올라갑니다.
- 팀으로 쪼개면 각자 작은 컨텍스트 — 5명이 각자 10턴씩 해도 총 누적은 서브에이전트 1명이 30턴 하는 것보다 훨씬 작아요.
- 병렬 실행이라 시간도 절약 — 순차로 3-5분 걸리던 게 1-2분으로 줄어듭니다.
판단 기준:
- 서브에이전트가 15턴 이상 돌아간다면 → 팀으로 쪼개는 게 이득
- 서브에이전트가 10턴 이하라면 → 그냥 써도 괜찮음
솔직한 마음: 불안하지만 방향은 찾았습니다
에이전트팀이 아직 실험적 기능이라서 불안한 건 사실이에요. 언제 인터페이스가 바뀔지, 버그가 터질지 모르잖아요.
근데 숫자가 너무 명확해서요. 86% 절감. 이건 무시할 수 없어요.
글을 다 정리하고 나니까 방향이 보였어요:
- 당장 haiku로 전환 (80% 절감)
- 에이전트팀 정식 출시되면 바로 전환
- 장기적으로 SDK 기반으로 워크플로우 고정
앞으로 내가 할 것들
- [ ] morning-briefing
model: sonnet→model: haiku변경 - [ ] WebSearch 쿼리 20개 → 12개로 통합
- [ ]
@morning-briefing-team에이전트팀 버전 실험 - [ ] 토큰 사용량 모니터링해서 실제 절감 확인
여러분도 서브에이전트 쓰고 계시다면, 한번 토큰 사용량 체크해보세요. 생각보다 훨씬 많이 쓰고 계실 수도 있어요.
FAQ
Q: 에이전트팀은 지금 당장 쓸 수 있나요?
A: 2026년 2월 현재 Claude Code에서 실험적 기능으로 제공됩니다. 정식 출시는 아직이지만 테스트는 가능해요.
Q: haiku로 바꾸면 품질이 많이 떨어지나요?
A: 데이터 수집, 웹 검색 같은 단순 작업에서는 거의 차이 없어요. 복잡한 분석이나 글쓰기는 sonnet 유지 권장.
Q: Pro 플랜에서도 이 비용 차이가 적용되나요?
A: Pro 플랜($20/월)은 토큰 비용이 아니라 사용량 제한 방식이지만, 토큰 소모 속도가 곧 사용 가능 시간이에요. 서브에이전트 쓰면 빨리 바닥나고, 에이전트팀 쓰면 3배 더 오래 써요.