Claude Code Agent Teams Pro로 돌렸더니 토큰이 5분 만에 증발했다 – Haiku로 바꾸고 달라진 것들

2026년 2월 6일 기준, Anthropic이 Claude Code Agent Teams를 연구 프리뷰(Research Preview)로 공식 출시했습니다. settings.json에 한 줄 추가하면 여러 Claude Code 인스턴스가 팀으로 병렬 작업하는 기능으로, 팀메이트별 모델 선택이 가능하며 Haiku 4.5 기준 Sonnet 대비 3배 비용 절감이 가능합니다.

Claude Code Agent Teams Pro로 돌렸더니 토큰이 5분 만에 증발했다 - Haiku로 바꾸고 달라진 것들

10배 스마트해진다길래 기대했거든요.

코드팩토리님 영상 보고 “이거다!” 싶어서 바로 켰어요. settings.json에 한 줄 추가하니까 진짜 팀메이트가 생기더라고요.

근데요.

Opus로 팀 3명 스폰하고 5분 지나니까 토큰이 바닥났어요.

Pro 플랜 $20짜리로요. 5시간 쿨다운 동안 멍하니 앉아있었습니다.

“아니, 이 기능 쓰려면 Max $200 끊어야 하나?”

결론부터 말하면 아닙니다. Haiku로 바꾸면 됩니다.

Haiku 4.5가 Sonnet 4.5의 90% 성능이라는 거 알고 계셨어요? 근데 가격은 3분의 1이에요. 속도는 2배 빠르고.

이 글에서 제가 직접 겪은 토큰 지옥과, 거기서 빠져나온 방법을 공유할게요.

코드팩토리님 영상 내용 + 공식 문서 팩트체크 + 제 실사용 경험을 합쳤습니다.


그래서 Agent Teams가 뭔데?

Agent Teams… 이름은 많이 들어봤는데 뭔 소린지 모르겠죠?

쉽게 말할게요.

“Claude Code 인스턴스 여러 개를 팀처럼 굴리는 기능”

끝. 이게 전부예요.

혼자 코딩하던 AI가 팀플을 시작한 거예요. 팀장(Team Lead)이 팀원(Teammates)한테 일을 나눠주고, 팀원들끼리 메시지도 주고받고, 공유 태스크 리스트에서 알아서 할 일을 가져가요.

Subagent랑 뭐가 다른데?

이거 헷갈리는 분들 많더라고요. 저도 처음엔 “그냥 서브에이전트 아니야?” 했거든요.

SubagentAgent Teams
비유심부름꾼프로젝트 팀
소통결과만 보고팀원끼리 토론
컨텍스트독립 (결과만 리턴)독립 (서로 메시지)
조율메인이 전부 관리공유 태스크 리스트로 자율
토큰낮음높음 (각자 컨텍스트)
최적 사례간단한 리서치, 검증병렬 리뷰, 디버깅, 크로스 레이어

Subagent는 “이것 좀 알아보고 결과만 알려줘”예요. 심부름 갔다 오는 거.

Agent Teams는 “우리 셋이서 이 프로젝트 같이 하자. 너는 프론트, 너는 백엔드, 나는 테스트.”

진짜 팀플이에요. 좋은 점도, 나쁜 점도 다.


활성화 방법 — 딱 1분

솔직히 이건 너무 쉬워요. settings.json에 한 줄 추가하면 끝.

{
  "env": {
    "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
  }
}

이거 하나면 활성화 끝이에요.

근데 주의할 점 하나. 이름에 “EXPERIMENTAL”이 들어있잖아요? 아직 연구 프리뷰(Research Preview)예요. 공식 문서에도 이렇게 써 있어요:

“Agent teams are experimental and disabled by default. Agent teams have known limitations around session resumption, task coordination, and shutdown behavior.”

실험적 기능이라는 거. 세션 재개, 태스크 조율, 종료 동작에 알려진 제한이 있다는 거.

이거 무시하면 안 돼요. 저도 한 번 세션 끊겼다가 팀메이트가 좀비처럼 살아있는 거 봤거든요. tmux 세션 수동으로 죽여야 했어요.


두 가지 모드 — 어떤 걸 써야 할까?

코드팩토리님 영상에서 이 부분을 자세히 다뤘는데, 핵심만 정리할게요.

In-Process Mode (기본값, 추천)

모든 팀메이트가 하나의 터미널 안에서 돌아가는 모드.

{
  "teammateMode": "in-process"
}

또는 터미널에서:

claude --teammate-mode in-process

장점:

  • 별도 설치 필요 없음. 어떤 터미널에서든 작동
  • Shift+Up/Down으로 팀메이트 전환
  • Shift+Tab으로 Delegate Mode 진입
  • Ctrl+T로 태스크 리스트 토글

단점:

  • 한 번에 한 팀메이트만 볼 수 있음
  • 세션 재개 시 In-Process 팀메이트 복원 안 됨

솔직히 저는 이걸로 충분했어요. 팀메이트 3명 정도면 Shift+Up/Down으로 충분히 돌아가거든요.

Split Pane Mode (시각적으로는 최고)

각 팀메이트가 별도 패널에서 실행되는 모드.

{
  "teammateMode": "tmux"
}

장점:

  • 모든 팀메이트 출력을 동시에 볼 수 있음
  • 패널 클릭으로 직접 상호작용
  • 시각적으로 “팀이 일하는 느낌”이 확실히 남

단점:

  • tmux 또는 iTerm2 필요 (brew install tmux)
  • VS Code 통합 터미널, Windows Terminal, Ghostty에서 미지원
  • macOS에서 가장 잘 작동

솔직히 Split Pane은 데모할 때 멋있어요. “와, AI 5명이 동시에 코딩하고 있다!” 하는 느낌. 근데 실용적으로는 In-Process가 더 편했어요. tmux 세션 관리하는 것 자체가 일이 되더라고요.

근데 뭘 선택해야 해?

상황추천 모드
처음 써보는 중In-Process
팀메이트 2-3명In-Process
팀메이트 5명 이상Split Pane
VS Code에서 쓸 때In-Process (Split 미지원)
데모/발표용Split Pane
macOS iTerm2 유저Split Pane

제 추천은? 처음엔 무조건 In-Process. Split Pane은 tmux에 익숙해진 다음에.


내가 느낀 점 — Pro 플랜의 현실

여기서부터가 진짜 중요한 얘기예요.

Opus로 팀 돌린 5분의 기록

제가 Pro 플랜($20/월) 쓰고 있거든요. Agent Teams 활성화하고, 이런 프롬프트를 날렸어요:

이 프로젝트의 인증 모듈을 리팩토링해줘. 
3명 팀 만들어서 병렬로 작업해.
보안 리뷰, 성능 최적화, 테스트 커버리지.

기본 모델이 Opus 4.6이었어요.

결과?

팀메이트 3명이 각자 독립 컨텍스트 윈도우를 가지고 돌아가니까, 토큰이 4배 속도로 줄어들더라고요. 리드 + 팀메이트 3명 = 컨텍스트 윈도우 4개가 동시에 돌아가는 거예요.

Pro 플랜이 5시간에 45 메시지인데, 코딩 프롬프트는 토큰을 많이 먹으니까 실질적으로 10-40 프롬프트.

Agent Teams 켜면? 5-10 프롬프트면 끝.

5분 만에 “rate limit exceeded” 떴어요.

솔직히 멘붕이었어요. “이 기능 Max $200 안 끊으면 못 쓰는 거 아니야?”

Haiku로 바꾸고 달라진 것들

그래서 이렇게 프롬프트를 바꿨어요:

이 프로젝트의 인증 모듈을 리팩토링해줘. 
3명 팀 만들어서 병렬로 작업해.
각 팀메이트는 Haiku 모델을 사용해.
보안 리뷰, 성능 최적화, 테스트 커버리지.

“각 팀메이트는 Haiku 모델을 사용해.” 이 한 줄이 게임 체인저였어요.

결과 비교:

Opus 팀Haiku 팀
속도느림 (깊은 추론)2x 빠름
토큰 비용$5-15/MTok$0.25-1/MTok
Pro 플랜 지속시간~5분~20-30분
코드 품질최상90% 수준
리뷰 정확도100%~90%

Haiku 4.5가 Sonnet 4.5의 90% 성능이라는 건 Anthropic 공식 발표예요. 근데 가격은 3분의 1.

90% 품질에 3배 오래 쓸 수 있으면, 그게 이기는 거 아닌가요?

진짜 이거 깨닫고 나서 생각이 바뀌었어요.

모델 조합 전략 — 이게 핵심이에요

실제로 쓰면서 찾은 최적 조합:

팀을 만들어줘.
- 리드: Sonnet (조율 + 종합)
- 리뷰어 2명: Haiku (코드 리뷰, 테스트)
- 아키텍트 1명: Opus (복잡한 설계 판단)
역할모델이유
리드 (조율자)Sonnet 4.5균형 잡힌 성능, 팀 관리
워커 (리뷰/테스트)Haiku 4.590% 성능, 3x 절약, 2x 빠름
아키텍트 (설계)Opus 4.6복잡한 추론이 필요할 때만

이렇게 하면:

  • 리뷰/테스트처럼 반복적인 작업은 Haiku가 빠르게 처리
  • 아키텍처 결정 같은 중요한 판단만 Opus가 담당
  • 전체 토큰 비용 50-70% 절감

회사에서 인턴한테 문서 정리 시키고, 시니어한테 코드 리뷰 시키는 것과 똑같은 원리예요.


실전에서 써보고 알게 된 것들

1. Delegate Mode는 필수

Shift+Tab을 누르면 리드가 직접 코딩을 안 하고 조율만 해요.

이거 안 켜면 리드가 갑자기 코드를 짜기 시작해요. “야, 너는 지시만 해!” 하고 싶은데 AI가 참을성이 없더라고요.

공식 문서에도 이렇게 쓰여 있어요:

“Without delegate mode, the lead sometimes starts implementing tasks itself instead of waiting for teammates.”

Delegate Mode 켜면 리드는 스폰, 메시징, 셧다운, 태스크 관리만 가능해져요. PM이 직접 코딩 안 하고 관리만 하는 것처럼.

2. Plan Approval로 품질 관리

팀메이트가 바로 구현하지 않고, 먼저 계획을 제출하게 할 수 있어요:

보안 리뷰어 팀메이트를 만들어줘.
인증 모듈을 리뷰하고, 구현 전에 계획 승인을 받아야 해.

팀메이트가 계획을 세우면 → 리드가 검토 → 승인/거절 → 승인 후 구현 시작.

이게 왜 좋냐면요. Haiku로 워커를 돌리면 가끔 방향이 좀 빗나갈 때가 있거든요. Plan Approval 걸어두면 잘못된 방향으로 달려가기 전에 잡을 수 있어요.

3. 같은 파일 건드리지 마

이건 진짜 뼈아프게 배웠어요.

팀메이트 두 명이 같은 파일을 수정하면? 덮어쓰기가 일어나요.

공식 문서:

“Two teammates editing the same file leads to overwrites. Break the work so each teammate owns a different set of files.”

경험상 최적 구성:

프론트엔드 팀메이트 → src/components/
백엔드 팀메이트 → src/api/
테스트 팀메이트 → tests/

각 팀메이트가 자기 영역만 건드리게 프롬프트에 명확하게 써줘야 해요.

4. 팀메이트당 5-6개 태스크가 적정

너무 적으면 조율 오버헤드가 손해. 너무 많으면 팀메이트가 방향을 잃어요.

공식 문서에서도 “Having 5-6 tasks per teammate keeps everyone productive”라고 명시하고 있어요.

저는 처음에 태스크 2개만 줬다가 팀메이트가 5초 만에 끝내고 놀고 있더라고요. Self-Claim 기능이 있어서 다 끝나면 알아서 다음 태스크를 가져가는데, 가져갈 태스크가 없으면 그냥 멈춰요.

5. 처음엔 리서치/리뷰부터

공식 문서 권장사항:

“If you’re new to agent teams, start with tasks that have clear boundaries and don’t require writing code: reviewing a PR, researching a library, or investigating a bug.”

저도 이걸 따라서 먼저 코드 리뷰에 Agent Teams를 썼어요.

PR #142 리뷰해줘. 3명 팀:
- 보안 취약점 체크
- 성능 영향 분석
- 테스트 커버리지 검증
각 팀메이트는 Haiku 사용.

이건 진짜 좋았어요. 혼자 리뷰하면 한 관점에만 집중하게 되는데, 3명이 동시에 다른 관점으로 보니까 놓치는 게 확 줄었어요.


솔직한 마음 — 불안과 방향

이 기능 쓰면서 솔직히 불안했던 것들이 있어요.

첫째, 토큰 비용. Pro $20으로 Agent Teams를 제대로 쓸 수 있을까? 결론은 “Haiku로 바꾸면 가능하다.” 근데 Opus 수준의 품질을 기대하면 Max $200이 필요해요. 이건 현실이에요.

둘째, 이 기능이 정말 필요한가? 솔직히 혼자서도 충분한 작업에 Agent Teams를 쓰면 오히려 손해예요. 토큰만 많이 먹고, 조율 오버헤드가 생기고. 공식 문서에서도 “For sequential tasks, same-file edits, or work with many dependencies, a single session or subagents are more effective”라고 분명히 쓰고 있어요.

셋째, 아직 실험적 기능. 세션 재개하면 In-Process 팀메이트가 사라져요. 태스크 상태가 지연될 수 있어요. 팀메이트 셧다운이 느릴 수 있어요. 이런 제한사항들이 실무에서 꽤 거슬려요.

근데요.

방향은 보여요.

이 기능이 안정화되면, 진짜 “AI 팀”이 가능해지는 거예요. 지금은 5명 팀인데, 앞으로 20명, 50명 팀이 되면? 혼자서 스타트업 하나 돌릴 수 있는 거 아닌가요.


앞으로 내가 할 것들

이 기능을 계속 쓰면서 정리한 액션 플랜:

  1. 리뷰/리서치에 먼저 적용 — 코드 리뷰에 Haiku 3명 팀 = 가성비 최고
  2. 모델 믹스 전략 고정 — 리드 Sonnet + 워커 Haiku + 아키텍트 Opus (필요시만)
  3. Pro 플랜 유지 — Max 안 끊어도 Haiku 팀이면 충분
  4. Split Pane 도전 — tmux 익숙해지면 5명+ 팀에서 시도
  5. 프롬프트 레시피 축적 — 어떤 프롬프트가 팀 효율을 높이는지 기록

제한사항 정리 — 이건 알고 써야 해요

제한영향대응
세션 재개 시 In-Process 팀메이트 복원 불가팀 전체 재시작 필요중요 작업은 자주 커밋
태스크 상태 지연의존 태스크가 블록됨수동으로 상태 업데이트
세션당 1팀만동시 여러 프로젝트 불가순차 작업
중첩 팀 불가팀메이트가 자체 팀 생성 못 함서브에이전트로 대체
Split Pane: VS Code/Windows Terminal/Ghostty 미지원터미널 선택 제한In-Process 사용
모든 팀메이트가 리드의 권한 설정 상속개별 권한 설정 불가스폰 후 개별 변경

Pro 플랜 유저를 위한 토큰 절약 체크리스트

✅ 팀메이트 모델을 Haiku로 지정했나?
✅ Delegate Mode 켰나? (리드가 직접 코딩 방지)
✅ 각 팀메이트의 파일 영역을 분리했나?
✅ 태스크를 5-6개로 적절히 나눴나?
✅ 처음이면 리뷰/리서치로 시작했나?
✅ 팀메이트 3명 이하로 시작했나?
✅ 불필요한 broadcast 사용 안 했나?

이 체크리스트만 따라도 Pro 플랜에서 Agent Teams를 현실적으로 쓸 수 있어요.


FAQ

Q: Pro 플랜으로 Agent Teams 쓸 수 있나요?

A: 네, 가능합니다. 하지만 Opus로 팀을 돌리면 토큰이 5분 만에 바닥납니다. 팀메이트 모델을 Haiku로 지정하면 Pro 플랜에서도 20-30분 정도 사용 가능합니다.

Q: Subagent랑 Agent Teams 뭘 써야 하나요?

A: 결과만 받으면 되는 작업은 Subagent (토큰 절약). 팀원끼리 소통하며 복잡한 작업을 해야 하면 Agent Teams.

Q: Split Pane Mode를 VS Code에서 쓸 수 있나요?

A: 아니요. VS Code 통합 터미널, Windows Terminal, Ghostty에서는 미지원입니다. In-Process 모드를 사용하세요.

Q: 팀메이트가 같은 파일을 수정하면 어떻게 되나요?

A: 덮어쓰기가 발생합니다. 프롬프트에서 각 팀메이트의 파일 영역을 명확히 분리해야 합니다.

Q: Delegate Mode가 뭔가요?

A: Shift+Tab으로 리드를 조율 전용 모드로 전환합니다. 리드가 직접 코딩하지 않고 팀 관리만 하게 됩니다. 토큰 절약에도 도움이 됩니다.

Q: Agent Teams 기능이 안정적인가요?

A: 아직 실험적(Research Preview)입니다. 세션 재개, 태스크 상태, 셧다운에 알려진 제한이 있습니다. 중요 작업은 자주 커밋하면서 사용하세요.


참고 자료


🏷️ 태그: #ClaudeCode #AgentTeams #토큰비용 #Haiku #AI개발 #Anthropic #Pro플랜