AI 에이전트 팀(Agent Team)이란? Claude Code에서 여러 AI 에이전트를 하나의 팀으로 구성해 작업을 병렬 처리하는 기능입니다. 2026년 2월 5일 Anthropic이 Opus 4.6과 함께 공개한 실험적 기능으로, 환경변수
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1로 활성화합니다. 리드 에이전트가 팀원에게 작업을 분배하고, 팀원끼리 직접 메시지도 주고받으며, 최종 결과를 종합합니다.

저 사실 고백할 게 있어요. 에이전트 팀 글을 4편이나 쓰면서, 비용은 한 번도 제대로 안 따져봤어요.
커뮤니티에 올라온 8명짜리, 10명짜리 템플릿 보고 “와, 멋있다” 하면서 그대로 따라 만들었거든요. 근데 Pro 플랜 리밋에 금방 걸리더라고요. 5명 팀 한 번 돌렸을 뿐인데.
그때 깨달았어요. 에이전트 팀은 “어떻게 만드느냐”보다 “얼마에 돌리느냐”가 먼저라는 걸.
출시 5일 만에 팀 3개를 갈아치우면서 찾은 짠돌이 운영법이에요. Pro 유저 기준으로 쓰되, 마지막에 Max 유저가 더 유연하게 쓸 수 있는 방법도 알려드릴게요.
핵심 먼저: 짠돌이 에이전트 팀의 황금 비율
리드 1 (sonnet) ─── 판단 + 조율 + 합성 ├── 워커 A (haiku) ─── 독립 태스크 1 ├── 워커 B (haiku) ─── 독립 태스크 2 └── 워커 C (haiku) ─── 독립 태스크 3
이게 끝이에요. 리드 sonnet 1명 + haiku 워커 3명 = 총 4명.
비용이요? 1회 실행 $0.15~0.35. haiku 3명 합쳐서 $0.03도 안 들어요.
단일 sonnet 에이전트가 같은 일을 하면 $1.50~3.50 드는데, 4명 팀이 5~10배 저렴하면서 2배 빠릅니다.
왜 이게 되는지, 그리고 왜 8명이 아니라 4명인지 실험 데이터로 보여드릴게요.
비용의 비밀: haiku가 이렇게 싸다고?
짠돌이 전략의 핵심은 모델 가격 차이를 이용하는 것이에요.
2026년 2월 기준 Claude 모델별 가격:
| 모델 | 입력 ($/M 토큰) | 출력 ($/M 토큰) | SWE-bench | 가격 대비 성능 |
|---|---|---|---|---|
| Haiku 4.5 | $1 | $5 | 73% | 가성비 왕 |
| Sonnet 4.5 | $3 | $15 | 77.2% | 균형형 |
| Opus 4.6 | $15 | $75 | 최고 | 판단 전용 |
Haiku가 Sonnet의 1/3 가격인데, SWE-bench 차이는 4%p밖에 안 돼요. OSWorld(컴퓨터 사용 벤치마크)에서는 둘 다 61%로 동일하고요.
웹 검색, 파일 읽기, 데이터 추출 같은 “수집/정리” 작업에서 haiku와 sonnet의 품질 차이는 솔직히 거의 못 느껴요. 근데 비용은 3배 차이.
그래서 짠돌이 공식: 판단은 sonnet, 수집은 haiku.
비싼 모델이 뭘 할지 결정하고, 싼 모델이 실제로 뛰는 구조. 이게 학술적으로도 맞아요.
2025년 arxiv 논문(2503.13577)에서:
“에이전트 간에 성능이나 비용 차이가 의미 있을 때만 오케스트레이션이 효과적이다.”
전부 sonnet으로 팀 짜면? 비싼 모델 7개가 동시에 돌아가니까 비용만 7배. 의미 없어요.
실전: 7명짜리 팀 3개를 돌려봤습니다
같은 7명인데 결과가 이렇게 달랐어요.
케이스 1: 모닝 브리핑 팀 — 짠돌이의 승리
매일 아침 시장, 크립토, 뉴스, 글감, 트레이딩 현황을 수집하는 팀.
Team Lead (sonnet) ─── 태스크 분배 + 조율 ├── market-scanner (haiku) ─── 주식/환율/지수 ├── crypto-scanner (haiku) ─── BTC/ETH/김프/펀딩비 ├── news-analyst (haiku) ─── IT/AI/매크로 뉴스 ├── blog-analyst (haiku) ─── 블로그 글감 발굴 ├── trading-coach (haiku) ─── 트레이딩 적합도 └── report-writer (sonnet) ─── 최종 브리핑 합성
| 항목 | 기존 (단일 sonnet) | 짠돌이 팀 (7명) | 변화 |
|---|---|---|---|
| 비용 | $3.41 | $0.47 | -86% |
| 시간 | 3-5분 | 1-2분 | -60% |
| 토큰 | ~960K | ~245K | -74% |
왜 이렇게 차이가 나느냐.
단일 에이전트일 때는 sonnet 하나가 시장 검색 → 크립토 검색 → 뉴스 검색 → 글감 찾기 → 트레이딩 확인을 순서대로 했어요. 매번 검색 결과가 컨텍스트에 쌓이니까 마지막 태스크할 때 960K 토큰 가까이 차 있었어요. 비싼 sonnet이 960K 토큰을 처리하는 거예요.
짠돌이 팀으로 바꾸니까요. 싸디싼 haiku 5명이 동시에 각자 검색을 돌려요. 각 워커의 컨텍스트는 자기 도메인 데이터만 담고 있으니까 토큰도 가볍고요. 5명 합쳐서 $0.03도 안 들어요.
핵심: 5명이 동시에 독립적으로 일했기 때문에 (병렬화율 80%) 성공한 거예요.
케이스 2: 블로그 파이프라인 팀 — 짠돌이도 못 살린 구조
Team Lead (sonnet) ─── 라우팅 + 조율 ├── researcher (haiku) ─── 웹 검색 ├── note-scanner (haiku) ─── 기존 노트 검색 ├── pattern-checker (haiku) ─── 도입부 패턴 확인 ├── ⭐ blog-writer (opus) ─── 글 작성 (핵심 엔진) ├── sns-generator (haiku) ─── SNS 변환 └── post-processor (haiku) ─── 후처리/저장
| 항목 | 기존 (단일 opus) | 팀 (7명) | 변화 |
|---|---|---|---|
| 비용 | $2.72 | $1.96 | -28% |
| 시간 | 5-8분 | 4-6분 | -20% |
haiku 워커를 5명이나 붙여봤자 소용없었어요.
왜? blog-writer(opus) 한 명이 전체 비용의 82%($1.61)를 잡아먹거든요.
글쓰기는 순차적인 작업이에요. 도입부 → 본문 → 결론이 하나의 맥락에서 나와야 해요. 이걸 병렬로 쪼갤 수 없어요. haiku 5명이 리서치를 아무리 싸게 해줘도, 핵심인 글쓰기를 opus가 혼자 하는 동안 나머지 6명은 관객이에요.
교훈: 짠돌이 전략이 통하려면 “비싼 작업이 병렬로 쪼개질 수 있어야” 해요.
케이스 3: 리서치 팀 — 극한의 가성비
Lead (sonnet) + 4 Researcher (haiku) + Data Analyst (sonnet) + Report Writer (sonnet)
| 항목 | 값 |
|---|---|
| 총 비용 | $0.05~0.10 |
| 총 시간 | 7분 54초 |
| 도구 호출 | 82회 (WebSearch 46회) |
| 산출물 | 리서치 98KB + 차트 485KB + PDF 615KB |
$0.10 이하. 이게 가능한 이유는 haiku 4명이 46번의 웹 검색을 병렬로 돌렸기 때문이에요. 4명 합쳐서 $0.03도 안 들어요.
세 팀을 비교하면 패턴이 보여요
| 팀 | 비용 절감 | 병렬화율 | 짠돌이 효과 |
|---|---|---|---|
| 모닝 브리핑 | -86% | 80% | 대성공 |
| 블로그 파이프라인 | -28% | 15% | 실패 |
| 리서치 | 극한 가성비 | 60% | 대성공 |
짠돌이 전략이 통하는 조건 = “병렬화율”이 높은 작업.
haiku를 아무리 많이 투입해도, 비싼 모델 하나가 순차적으로 일하는 구조면 비용이 안 줄어요.
왜 8명이 아니라 4명인가
커뮤니티 템플릿은 평균 6.6명이에요. 22개 분석해봤는데 8명짜리 Agile 팀, 10명짜리 Product 팀이 즐비하더라고요.
근데 이건 사람 조직도를 AI에 옮긴 것이지, 실전 최적화 결과가 아니에요.
AI 에이전트는 사람과 3가지가 달라요.
첫째, 매 턴마다 컨텍스트 전체를 다시 읽어요. 팀원이 8명이면 리드의 컨텍스트에 “A한테 이거 시켰고, B 결과 받았고, C는 아직 대기 중…” 같은 관리 정보가 쌓여요. 그게 전부 토큰 비용. Pro 유저에게는 이게 리밋을 까먹는 주범이에요.
둘째, 대기 중인 워커도 리드의 비용을 만들어요. 워커가 일 끝나고 보고하면, 리드가 그 결과를 읽고 다음 지시를 내리잖아요. 5명이면 5번, 8명이면 8번. 리드 비용이 워커 수에 비례해요.
셋째, 7명 팀을 돌려봤는데 실제 동시에 일하는 건 3~4명이었어요. 나머지는 순차 실행되면서 토큰만 잡아먹었어요.
적정 인원 공식
적정 인원 = 동시에 독립적으로 돌릴 수 있는 태스크 수 + 1(리드) + 1(리포터, 선택)
대부분의 작업에서 독립 병렬 태스크는 3~4개. 그래서 4~5명이 스위트스팟.
리포터 없이 리드가 합성을 겸하면 4명. 합성이 복잡하면 리포터 추가해서 5명.
Pro 유저를 위한 짠돌이 5계명
1계명: 워커는 무조건 haiku
sonnet 워커 3명 = haiku 워커 9명과 같은 비용이에요. 수집/검색 같은 단순 작업에서 품질 차이는 거의 없으면서 비용은 3배. Pro의 리밋을 아끼려면 워커는 haiku가 답.
2계명: 팀원은 4명을 넘기지 마라
Pro 플랜은 5시간마다 메시지 리밋이 리셋돼요. 5명 팀이 10턴 돌면 50+ 메시지. 하루에 팀을 1~2번밖에 못 돌릴 수도 있어요.
4명(리드 1 + haiku 3)이면 한 번에 30~40 메시지 정도. 하루 2~3번은 돌릴 여유가 생겨요.
3계명: 리포터를 없애라 — 리드가 겸임
리포터를 별도로 두면 sonnet 1명분 비용($0.15~0.20)이 추가돼요. 합성이 “워커 3명 결과 합쳐서 정리” 수준이면 리드가 충분히 겸임할 수 있어요.
절약 전: 리드(sonnet) + 워커3(haiku) + 리포터(sonnet) = 5명, $0.25~0.50 절약 후: 리드(sonnet, 합성 겸임) + 워커3(haiku) = 4명, $0.15~0.35
매일 돌리는 작업이면 연간 $50+ 차이가 나요.
4계명: 글쓰기/코딩은 팀으로 만들지 마라
순차적인 작업(글쓰기, 복잡한 코딩, 추론)은 병렬화가 안 돼요. 7명 팀을 만들어봤자 핵심 에이전트 1명이 비용의 80%+를 차지하고 나머지는 장식.
2025년 arxiv 논문(2503.13577)에서도 확인:
“순차적 추론 작업은 멀티에이전트 시 성능이 39~70% 하락”
작가는 팀이 아니라 개인이에요. 글쓰기는 단일 opus로 쓰세요.
5계명: “동시에 일할 수 있는 수”로 세라
8명을 만들어봤자 동시에 일하는 건 3~4명이에요. 나머지는 대기하면서 리드의 토큰만 잡아먹어요.
팀 구성 전에 이 질문 하나만 던지세요:
“이 작업에서 진짜 동시에 독립적으로 돌릴 수 있는 게 몇 개야?”
그 답 + 1(리드)이 적정 인원이에요.
작업별 짠돌이 구성 가이드
데이터 수집/리서치 → 4명 (짠돌이 최적)
리드(sonnet) + haiku 3 예: 모닝 브리핑, 시장 분석, 경쟁사 조사, 기술 리서치 1회 비용: $0.15~0.35 병렬화율: 60~80%
이게 짠돌이의 킬러 유스케이스. 제 모닝 브리핑이 $3.41 → $0.47로 떨어진 케이스.
개발/프로토타입 → 5~6명 (Phase 기반)
Phase 1 (순차): 리서처 + 아키텍트 Phase 2 (병렬): 개발자 2~3명 (각각 다른 파일 담당) Phase 3 (순차): QA → 동시 활성: 최대 3명
Phase 2에서만 병렬이니까 전체 효율은 중간. Pro 유저는 Phase 2 워커만 haiku로 돌리면 비용 절약.
창작/글쓰기 → 단일 유지 (팀 비추천)
팀으로 만들면 비용만 올라가고 품질은 떨어져요. 리서치만 서브에이전트(haiku)로 분리하고, 글 본체는 opus 단일.
리뷰/검증 → 3명
보안/성능/품질 관점에서 동시 검토. haiku 3명이면 충분하고 비용은 $0.03 미만.
Max 유저라면? 더 유연하게 쓰세요
여기까지는 Pro($20/월) 기준이었어요. Max 유저는 사정이 다릅니다.
| 플랜 | 월 가격 | 5시간당 메시지 | 에이전트 팀 운영 |
|---|---|---|---|
| Pro | $20 | 기본량 | 하루 1~2회, 4명 이하 권장 |
| Max 5x | $100 | 최소 225회 | 하루 3~4회, 5명 여유 |
| Max 20x | $200 | 최소 900회 | 하루 종일 실험 가능, 7~8명도 OK |
Max 5x ($100/월) — 스위트스팟 확장
4~5명 팀을 하루에 3~4번 편하게 돌릴 수 있어요. Pro에서 하루 1~2번이 한계였던 것과 비교하면 자유도가 확 올라요.
이 플랜이라면:
- 워커를 4명으로 늘려서 더 다양한 도메인 커버
- 리포터를 별도로 둬서 합성 품질 높이기
- 여러 팀을 번갈아 실험하며 최적 구성 찾기
Max 20x ($200/월) — 비용보다 시간이 중요한 사람
리밋이 900메시지/5시간이니까 사실상 무제한에 가까워요.
이 플랜이라면 짠돌이 전략을 완전히 뒤집을 수 있어요:
- 워커를 haiku 대신 sonnet으로 — 어차피 월정액이니까 품질 극대화
- 7~8명 팀도 부담 없이 — 리밋 걱정 없으니 병렬화율에만 집중
- 여러 팀을 동시에 실험 — 아침에 모닝 브리핑 팀, 낮에 리서치 팀, 저녁에 분석 팀
Pro 유저에게 사치인 게 Max 유저에게는 합리적인 선택이에요.
월정액 플랜에서는 토큰 비용이 아니라 **”리밋 안에서 얼마나 많은 가치를 뽑아내느냐”**가 핵심이에요. haiku로 아끼는 것보다 sonnet으로 품질 올리는 게 더 이득일 수 있어요.
내가 느낀 점
출시 5일 만에 팀 3개를 갈아치우면서 가장 크게 깨진 직관은 이거였어요.
“에이전트를 늘리면 성능이 올라간다”는 건 완전히 틀린 생각.
정확하게는, “동시에 독립적으로 일할 수 있는 수”를 늘리면 성능이 올라가고, 나머지 인원은 오히려 비용만 올린다가 맞아요.
8명짜리 화려한 팀 만들어놓고 비용 리포트 보는 순간 현타 온 거 인정합니다.
지금은 이렇게 운영하고 있어요:
| 팀 | 구성 | 비용 |
|---|---|---|
| 모닝 브리핑 | 리드(sonnet) + haiku 3, 리드가 합성 겸임 | ~$0.30/회 |
| 글감 수집 | 리드(sonnet) + haiku 3 | ~$0.20/회 |
| 블로그 글쓰기 | 단일 opus (팀 안 만듦) | ~$2.50/회 |
| 트레이딩 분석 | 리드(sonnet) + haiku 3 | ~$0.25/회 |
매일 돌리는 모닝 브리핑 기준 월 $9. 단일 에이전트로 돌리면 월 $102였을 거예요.
팀 만들기 전 체크리스트
✅ 짠돌이 팀을 만들어라: □ 독립적인 WebSearch/Read 태스크가 3개 이상인가? □ 각 워커가 서로 다른 도메인/파일을 담당하는가? □ haiku로 충분한 수집/정리 작업이 워커의 대부분인가? ❌ 단일 에이전트를 유지해라: □ 핵심 작업이 순차적인가? (글쓰기, 코딩, 추론) □ 비싼 모델(opus) 하나가 대부분의 비용을 차지하는가? □ 워커 간 의존성이 있는가? (A 결과 → B 입력) □ 같은 파일을 여러 에이전트가 수정하는가?
FAQ
Q: Pro 플랜으로 에이전트 팀 현실적으로 쓸 만한가요?
A: 짠돌이 전략을 쓰면 충분히 쓸 만해요. 핵심은 4명 이하(리드 sonnet 1 + haiku 3)로 유지하고, 하루 1~2회 정도 돌리는 거예요. 8명짜리 화려한 팀은 Pro에서는 현실적이지 않아요. 본격적으로 활용하려면 Max 5x($100/월)부터 여유가 생겨요.
Q: Max 플랜이면 haiku 대신 sonnet 워커를 써도 되나요?
A: Max 20x($200/월)라면 가능해요. 월정액이니까 토큰 비용을 안 따져도 되거든요. 리밋만 안 넘으면 되니까 워커를 sonnet으로 올려서 품질을 높이는 게 합리적이에요. Max 5x도 여유는 있지만 하루 3~4번 돌릴 거라면 haiku 워커가 안전해요.
Q: Haiku로 충분한 작업과 Sonnet이 필요한 작업은 어떻게 구분하나요?
A: 경험칙: “판단”이 필요하면 sonnet, “실행”만 하면 haiku. 웹 검색, 파일 읽기, 데이터 추출, 형식 변환은 haiku로 충분. 설계 결정, 글 구조, 코드 아키텍처, 복잡한 분석은 sonnet 이상. Haiku 4.5와 Sonnet 4.5는 SWE-bench에서 73% vs 77.2%로 4%p 차이.
Q: Opus는 언제 써야 하나요?
A: Opus 4.6은 Sonnet의 5배 가격(입력 $15/M, 출력 $75/M). 저는 딱 3가지에만 씁니다: 블로그 본문 작성(톤과 깊이가 체감 차이), 돈이 걸린 판단(투자 결정), 아키텍처 설계. 수집 작업에 opus 쓰는 건 페라리로 장보기예요.
Q: 에이전트 팀이 서브에이전트보다 항상 좋은가요?
A: 아니에요. 서브에이전트(Task 도구)는 단순하고 안정적이에요. 에이전트 팀은 실험 기능이라 세션 복원 불가, 팀 1개 제한, 중첩 불가 등 제한이 있어요. Pro 유저라면 서브에이전트가 더 안전한 선택일 수 있어요. 팀은 병렬 독립 태스크 3개+ 있을 때만.
Q: Agent Teams가 아직 실험 기능인데 프로덕션에 써도 되나요?
A: 2026년 2월 현재 실험 기능. 제 권장: 실패해도 괜찮은 작업(모닝 브리핑, 리서치)에만 팀 쓰고, 품질이 생명인 작업(블로그 글쓰기)은 단일 에이전트 유지.
핵심 정리
짠돌이 에이전트 팀 = sonnet 리드 1 + haiku 워커 3 = 4명
비용: 1회 $0.15~0.35. 단일 에이전트 대비 5~10배 저렴, 2배 빠름.
조건: 동시에 독립적으로 돌릴 수 있는 태스크가 3개 이상일 때만.
Pro 유저: 4명 이하, 하루 1~2회. 글쓰기는 팀으로 만들지 마라. Max 유저: 5~7명도 가능. 워커를 sonnet으로 올려 품질 극대화 전략도 유효.
“만들 수 있는 수”가 아니라 “동시에 일할 수 있는 수”로 세세요.
참고 자료
- Building multi-agent systems (Anthropic 공식)
- Claude Plans & Pricing
- Towards a Science of Scaling Agent Systems (arxiv:2512.08296)
- When Should We Orchestrate Multiple Agents? (arxiv:2503.13577)
- Claude Haiku 4.5 vs Sonnet 4.5 Tradeoffs (mashblog.com)
- About Claude’s Max Plan Usage
🏷️ 태그: #ClaudeCode #AgentTeams #에이전트팀 #비용최적화 #짠돌이 #ClaudePro #ClaudeMax #haiku