서브에이전트 vs 에이전트팀, 똑같은 작업에 왜 비용이 7배 차이 날까

서브에이전트와 에이전트팀(Agent Teams)의 토큰 비용 차이는 최대 86%입니다. 동일한 Morning Briefing 작업 기준, 서브에이전트는 약 $3.41, 에이전트팀은 약 $0.47이 듭니다. 2026년 2월 현재 Claude Code Agent Teams는 실험적 기능이지만, 토큰 효율성에서 압도적인 차이를 보입니다.

서브에이전트 vs 에이전트팀, 똑같은 작업에 왜 비용이 7배 차이 날까

나도 이게 맞는 건가 싶었어요

처음엔 그냥 지나쳤어요. “서브에이전트 쓰면 되지 뭐” 했거든요.

근데 어느 날 morning-briefing 실행하고 토큰 사용량 보니까… 한 번 돌리는데 거의 100만 토큰이 찍히더라고요. “이게 맞나?” 싶었어요.

솔직히 좀 무서웠습니다. Pro 플랜 $20/월 쓰는데, 이 속도면 하루에 몇 번 브리핑 돌리면 끝이잖아요.

그래서 파헤쳐봤어요. 왜 이렇게 토큰을 많이 먹는지.


서브에이전트의 함정: 컨텍스트 누적

서브에이전트(Subagent)란? Claude Code에서 메인 에이전트가 특정 작업을 위임하는 단일 에이전트입니다. 하나의 컨텍스트 윈도우 안에서 모든 작업이 순차적으로 진행됩니다.

여기서 핵심 문제가 뭐냐면요.

서브에이전트는 매 턴마다 이전 컨텍스트 전체를 다시 전송합니다.

턴 1:  시스템 프롬프트 4K + 검색 호출 0.2K = 4.2K 입력
턴 2:  이전 4.2K + 검색결과 1.5K + 다음 검색 0.2K = 5.9K 입력
턴 3:  이전 5.9K + 검색결과 1.5K + 다음 검색 0.2K = 7.6K 입력
...
턴 20: 이전 ~35K + 검색결과 1.5K + 다음 검색 = ~37K 입력
턴 30: 이전 ~55K + 브리핑 생성 5K = ~60K 입력

최종 컨텍스트는 60K지만, 누적으로 보면 ~960K 토큰을 소비합니다.

근데 진짜 웃긴 게요. 저는 “60K면 괜찮네” 하고 있었거든요. 누적 합계가 거의 백만 토큰인 줄도 모르고요.


실제 비용 계산: 한 번 브리핑에 $3.41

제가 쓰던 morning-briefing 구조를 보면요:

Claude Code (메인)
  └── Task subagent: morning-briefing (sonnet)
      ├── STEP 1: WebSearch x20 (시장 데이터)
      ├── STEP 2: 뉴스 필터링
      ├── STEP 3: 파일 읽기 (blog-ideas, coach-log 등)
      ├── STEP 4: trading-coach 체크
      ├── STEP 5: 매크로 이벤트 정리
      └── STEP 6: 브리핑 생성 + 저장

Sonnet 단일 서브에이전트 비용 (현재)

항목
모델claude-sonnet-4-5
입력 단가$3 / 1M tokens
출력 단가$15 / 1M tokens
누적 입력 토큰~960K
총 출력 토큰~35K
입력 비용960K × $3/M = $2.88
출력 비용35K × $15/M = $0.53
총 비용~$3.41
소요 시간3-5분 (순차)

Pro 플랜 쓴다고 해도 이 토큰 소모 속도가 곧 사용 가능 시간이에요. 한 번에 거의 100만 토큰 쓰면 금방 바닥납니다.


에이전트팀: 같은 일을 86% 저렴하게

에이전트팀(Agent Teams)이란? Claude Code의 실험적 기능으로, 팀 리더가 여러 전문 에이전트에게 작업을 병렬로 위임하는 멀티에이전트 구조입니다. 각 에이전트가 독립된 컨텍스트로 작업합니다.

에이전트팀으로 재구성하면 이렇게 됩니다:

Team Lead (sonnet)
├── market-scanner (haiku)    → WebSearch x8, 시장 데이터
├── crypto-scanner (haiku)    → WebSearch x4, 크립토 데이터
├── news-analyst (haiku)      → WebSearch x3, 뉴스 선별
├── blog-analyst (haiku)      → 파일 읽기 + WebSearch x5
├── trading-coach (haiku)     → 파일 읽기, 거래 적합도
└── report-writer (sonnet)    → 모든 결과 합성 → 최종 브리핑

왜 이렇게 차이가 나나?

핵심은 이거예요:

서브에이전트: 단일 컨텍스트에 모든 것이 쌓임
  → 턴 1: 4K 입력
  → 턴 15: 25K 입력 (이전 14턴 누적)
  → 턴 30: 60K 입력 (이전 29턴 누적)
  → 누적 합계: ~960K 😱

에이전트팀: 각자 작은 컨텍스트
  → market-scanner: 최대 12K
  → crypto-scanner: 최대 6K
  → news-analyst: 최대 5K
  → 각각의 누적이 작음 → 총합이 작음

서브에이전트의 비용은 “최종 컨텍스트 크기”가 아니라 “턴 수 × 평균 컨텍스트”로 결정됩니다. 턴이 많을수록 기하급수적으로 비싸져요.

에이전트팀 세부 비용

에이전트모델누적 입력출력비용
Team Leadsonnet48K5K$0.22
market-scannerhaiku56K5K$0.02
crypto-scannerhaiku16K3K$0.008
news-analysthaiku10.5K3K$0.007
blog-analysthaiku64K4K$0.021
trading-coachhaiku15K2K$0.007
report-writersonnet36K5K$0.19
합계245.5K27K$0.47

한 눈에 비교

항목서브에이전트 (현재)에이전트팀
모델sonnet 단일sonnet 2 + haiku 5
누적 입력 토큰~960K~245K
출력 토큰~35K~27K
총 비용~$3.41~$0.47
비용 절감기준-86%
소요 시간3-5분 (순차)1-2분 (병렬)
시간 절감기준-50~60%
컨텍스트 압박높음 (60K+ 단일)낮음 (분산)

이거 보고 솔직히 “진작 바꿀걸” 했어요.


내가 느낀 점: 왜 이걸 이제야 알았을까

막연히 “에이전트팀이 더 좋겠지” 정도로 생각했거든요. 근데 숫자로 보니까 충격이었어요.

같은 작업인데 7배 차이라니요.

솔직히 좀 억울하기도 했어요. 그동안 얼마나 토큰을 낭비했을까 싶어서요.

그러면 나는 어떻게 해야 하지?


당장 할 수 있는 최적화

에이전트팀으로 전환하지 않아도 비용을 줄이는 방법이 있어요:

방법절감난이도
sonnet → haiku로 변경-80% ($3.41→$0.68)쉬움
WebSearch 20개 → 10개로 줄이기-30%중간
파일 읽기 최소화-10%쉬움

가장 쉬운 첫 번째 스텝: morning-briefing의 model: sonnet → model: haiku 변경. 이것만으로 $3.41 → $0.68 (80% 절감).


단계별 전환 로드맵

단계 1 (즉시): morning-briefing 모델을 haiku로 변경
  → 비용 ~$0.68, 품질 약간 하락
  → 리스크: 낮음

단계 2 (단기): WebSearch 쿼리 통합 (20→12개)
  → 관련 검색을 하나로 묶기
  → "BTC ETH SOL price" 하나로 3개 검색 대체
  → 비용 ~$0.50

단계 3 (중기): Agent Teams 전환
  → haiku 5 + sonnet 2 에이전트
  → 비용 ~$0.47, 속도 2배
  → 리스크: Agent Teams가 아직 실험적

단계 4 (장기): SDK 기반 프로덕션
  → Python/TypeScript SDK로 워크플로우 고정
  → 스케줄러 연동 (cron → 매일 7시 실행)
  → 비용 ~$0.30 (최적화 후)

3단계 모델 전략: haiku / sonnet / opus

에이전트팀의 핵심은 작업 단계별로 모델을 다르게 쓰는 것이에요.

수집 (haiku)  → 분석 (sonnet) → 판단 (opus)
$0.25/M         $3/M             $15/M
WebSearch       요약, 구조화      전략, 매매 결정

모델별 적합 작업

단계모델단가 (입력/출력)적합한 작업
수집haiku$0.25 / $1.25WebSearch, 파일 읽기, 데이터 추출
분석sonnet$3 / $15요약, 필터링, 패턴 인식, 브리핑 합성
판단opus$15 / $75매매 결정, 전략 수립, 복잡한 추론

💬 개인적으로 이 구분이 가장 도움이 됐어요. 대부분의 작업에 Opus가 필요 없다는 걸 깨달았거든요.

Opus가 진짜 필요한 3가지 순간

  1. 돈이 걸린 최종 판단 — 매수/매도 결정, 포트폴리오 리밸런싱
  2. 복잡한 멀티스텝 추론 — 여러 분석 결과 종합 → 하나의 결론
  3. 창의적 전략 수립 — 새로운 에이전트 아키텍처, 비즈니스 전략

나머지? haiku랑 sonnet으로 충분해요.


에이전트팀 구성 시 주의점

1. report-writer가 핵심

모든 워커의 결과를 합쳐서 브리핑을 만드는 report-writer가 가장 비용이 많이 드는 에이전트예요 ($0.19 = 전체의 40%). 여기만큼은 sonnet 유지 권장.

2. 워커 간 의존성 없게

✅ 좋은 설계:
  market-scanner ──┐
  crypto-scanner ──├── 병렬 → report-writer
  news-analyst ────┤
  blog-analyst ────┤
  trading-coach ───┘

❌ 나쁜 설계:
  market-scanner → crypto-scanner → news-analyst (순차)

3. 결과 파일 규격 통일

각 워커가 동일한 마크다운 템플릿으로 결과를 저장하면 report-writer의 파싱이 쉬워지고 토큰도 줄어요.

# {섹션명}
## 데이터
| 항목 | 값 | 변화 | 메모 |
...
## 핵심 인사이트
1. ...
2. ...


🎯 핵심 메시지: 서브에이전트 길게 쓰고 계시다면 팀으로 쪼개세요

결론은 간단해요. 서브에이전트를 길게 쓰고 계신 분이라면, 지금 당장 팀으로 쪼개서 쓰는 게 좋습니다.

왜냐면요:

  1. 턴이 많을수록 손해 — 서브에이전트는 턴마다 컨텍스트가 누적되는 구조예요. 20턴, 30턴 넘어가면 토큰 비용이 기하급수적으로 올라갑니다.
  2. 팀으로 쪼개면 각자 작은 컨텍스트 — 5명이 각자 10턴씩 해도 총 누적은 서브에이전트 1명이 30턴 하는 것보다 훨씬 작아요.
  3. 병렬 실행이라 시간도 절약 — 순차로 3-5분 걸리던 게 1-2분으로 줄어듭니다.

판단 기준:

  • 서브에이전트가 15턴 이상 돌아간다면 → 팀으로 쪼개는 게 이득
  • 서브에이전트가 10턴 이하라면 → 그냥 써도 괜찮음

솔직한 마음: 불안하지만 방향은 찾았습니다

에이전트팀이 아직 실험적 기능이라서 불안한 건 사실이에요. 언제 인터페이스가 바뀔지, 버그가 터질지 모르잖아요.

근데 숫자가 너무 명확해서요. 86% 절감. 이건 무시할 수 없어요.

글을 다 정리하고 나니까 방향이 보였어요:

  1. 당장 haiku로 전환 (80% 절감)
  2. 에이전트팀 정식 출시되면 바로 전환
  3. 장기적으로 SDK 기반으로 워크플로우 고정

앞으로 내가 할 것들

  • [ ] morning-briefing model: sonnet → model: haiku 변경
  • [ ] WebSearch 쿼리 20개 → 12개로 통합
  • [ ] @morning-briefing-team 에이전트팀 버전 실험
  • [ ] 토큰 사용량 모니터링해서 실제 절감 확인

여러분도 서브에이전트 쓰고 계시다면, 한번 토큰 사용량 체크해보세요. 생각보다 훨씬 많이 쓰고 계실 수도 있어요.


FAQ

Q: 에이전트팀은 지금 당장 쓸 수 있나요?

A: 2026년 2월 현재 Claude Code에서 실험적 기능으로 제공됩니다. 정식 출시는 아직이지만 테스트는 가능해요.

Q: haiku로 바꾸면 품질이 많이 떨어지나요?

A: 데이터 수집, 웹 검색 같은 단순 작업에서는 거의 차이 없어요. 복잡한 분석이나 글쓰기는 sonnet 유지 권장.

Q: Pro 플랜에서도 이 비용 차이가 적용되나요?

A: Pro 플랜($20/월)은 토큰 비용이 아니라 사용량 제한 방식이지만, 토큰 소모 속도가 곧 사용 가능 시간이에요. 서브에이전트 쓰면 빨리 바닥나고, 에이전트팀 쓰면 3배 더 오래 써요.


참고 자료