2026년 5월 28일 Anthropic은 Claude Opus 4.8과 Claude Code의 Dynamic Workflows 연구 프리뷰를 공개했다. 이 기능은 큰 작업을 여러 하위 에이전트로 나눠 병렬 처리하고, 결과를 검증한 뒤 하나의 답으로 합치는 쪽에 가깝다.
이름만 보면 바로 켜고 싶다. 코드베이스 전체 마이그레이션, 보안 점검, 대규모 리팩터링 같은 말을 들으면 손가락이 먼저 달린다. 그런데 운영자 입장에서는 질문이 조금 다르다. 이걸 켜면 한 번의 요청이 몇 개의 작업으로 쪼개지고, 누가 무엇을 실행하며, 비용과 로그는 어디에 남는가를 먼저 봐야 한다.
이 글은 Claude Opus 4.8 성능 소개가 아니다. Claude Code에서 Dynamic Workflows를 쓰기 전에 팀이나 개인 작업실이 먼저 정해야 할 비용, 권한, 로그, 중단 기준을 체크표로 정리한 글이다. 자동화는 빨라질수록 더 성숙해 보이지만, 사실 제일 먼저 필요한 건 브레이크 위치다.
먼저 답
Dynamic Workflows는 큰 작업을 한 번에 맡기는 기능이라기보다, 큰 작업을 여러 병렬 하위 작업으로 쪼갠 뒤 검증 루프까지 붙이는 실행 방식으로 보는 편이 안전하다. 그래서 첫 사용 대상은 새 기능 개발보다 읽기 전용 조사, 코드베이스 구조 파악, 실패해도 되돌리기 쉬운 리팩터링 후보 찾기가 더 낫다.
Claude 공식 블로그는 Dynamic Workflows가 일반 Claude Code 세션보다 훨씬 많은 사용량을 소비할 수 있다고 안내한다. Anthropic의 Opus 4.8 발표도 기본 가격은 Opus 4.7과 같지만, fast mode와 effort 설정, 긴 실행 작업이 비용 판단에 영향을 준다고 설명한다. 그러니 첫 테스트는 작고 닫힌 범위, 쓰기 권한 없음, 로그 남김, 사람 승인 후 반영 네 조건을 붙이는 게 좋다.
누가 먼저 보면 좋은가
이미 Claude Code로 작은 수정이나 검색은 돌리고 있는데, 이제 코드베이스 전체 점검이나 마이그레이션을 맡겨보고 싶은 사람에게 맞다. 특히 한 파일 수정은 익숙하지만 수백 파일 영향도 조사부터 부담스러운 팀이면 이 기능의 유혹이 꽤 크다.
반대로 아직 테스트 명령, 브랜치 규칙, 시크릿 보관 위치, 롤백 기준이 없는 팀이라면 Dynamic Workflows보다 AGENTS.md와 권한표부터 만드는 게 먼저다. 여러 에이전트가 동시에 움직이는 구조에서는 작은 모호함도 빠르게 퍼진다. 자동화가 혼자 달리는 순간, 애매한 규칙은 아주 성실하게 사고를 만든다.
1. 비용은 모델 가격보다 실행 모양으로 봐야 한다
Anthropic 발표 기준 Opus 4.8의 일반 사용 가격은 Opus 4.7과 동일하게 안내됐다. 개발자는 claude-opus-4-8 모델을 API에서 사용할 수 있고, Opus 4.8에는 effort control, fast mode, 1M context 같은 운영 변수가 함께 붙는다. 여기까지만 보면 가격표는 단순해 보인다.
문제는 Dynamic Workflows가 단일 답변보다 실행 모양이 크다는 점이다. Claude 공식 글은 이 기능이 수십 개에서 수백 개 수준의 병렬 하위 에이전트를 한 세션에서 돌릴 수 있고, 일반 Claude Code 세션보다 사용량이 의미 있게 커질 수 있다고 안내한다. 그러면 비용 질문은 토큰 단가가 얼마인가에서 한 작업이 몇 개의 하위 실행으로 번지는가로 바뀐다.
첫 테스트 비용표는 이렇게 단순하게 잡는 게 좋다.
| 항목 | 첫 실행 기준 | 이유 |
|---|---|---|
| 작업 범위 | 한 폴더 또는 한 기능 | 병렬 작업이 repo 전체로 번지는 것을 막음 |
| 실행 모드 | read-only 조사부터 | 쓰기 비용과 복구 비용을 분리 |
| effort | 기본값에서 시작 | xhigh나 ultracode는 사용량이 커질 수 있음 |
| 예산 | 세션당 상한 기록 | 성공 여부보다 비용 패턴을 먼저 확인 |
| 결과물 | 보고서 또는 패치 초안 | 바로 merge하지 않고 검수 가능하게 둠 |
비용 관리는 절약만의 문제가 아니다. 같은 작업을 사람이 3시간 하는 것보다 workflow가 20분에 끝나면 비싸도 이길 수 있다. 다만 그 판단을 하려면 실행 전후에 작업 크기, 걸린 시간, 생성된 변경 수, 검수 시간, 재실행 횟수가 남아야 한다.
2. 권한은 자동화 수준보다 한 단계 낮게 연다
Dynamic Workflows는 하위 에이전트를 병렬로 돌리는 구조라서 권한을 크게 열면 속도도 같이 커진다. 속도가 커진다는 말은 좋은 변경도 빨라지고, 이상한 변경도 빨라진다는 뜻이다. 여기서 운영표가 없으면 사람은 결과를 보고 나서야 위험을 알게 된다.
처음에는 권한을 네 단계로 나누는 편이 안전하다.
| 등급 | 허용 예시 | Dynamic Workflows 첫 사용 여부 |
|---|---|---|
| Read-only | 코드 검색, 의존성 지도, 테스트 실패 원인 조사 | 적합 |
| Draft | 패치 초안, 마이그레이션 계획, PR 설명 초안 | 조건부 적합 |
| Mutating | 파일 수정, 브랜치 push, 이슈 상태 변경 | 사람 승인 필요 |
| High-risk | 배포, 결제, 고객 데이터, 비밀키 변경 | 기본 차단 |
Claude Code는 첫 workflow 실행 때 무엇을 실행하려는지 보여주고 확인을 받는 흐름을 둔다고 설명한다. 그래도 팀 표준은 제품 확인창에만 맡기면 안 된다. 로컬 AGENTS.md, repo 규칙, CI, 권한 분리, 코드리뷰까지 같은 방향을 봐야 한다.
내가 운영한다면 첫 주에는 read-only dynamic workflow만 허용한다. 예를 들어 “인증 관련 위험 패턴을 찾아서 파일 경로와 근거만 보고해줘”는 좋다. “찾은 위험 패턴을 모두 고쳐서 PR까지 만들어줘”는 두 번째 주 과제다. 재미는 조금 늦게 와도 된다. 사고도 같이 늦게 오면 아주 좋다.
3. 로그는 원문 덤프보다 결정 흔적이 중요하다
병렬 에이전트가 많아지면 로그는 더 중요해진다. 하지만 모든 프롬프트와 파일 내용을 그대로 저장하면 개인정보, 고객 데이터, 비밀 설정이 섞일 수 있다. 로그가 없으면 사고 때 설명을 못 하고, 로그가 너무 많으면 로그 자체가 위험해진다.
Dynamic Workflows용 로그는 네 종류로 나눠 두면 다루기 쉽다.
| 로그 | 남길 내용 | 피할 내용 |
|---|---|---|
| run log | 실행 시간, 요청자, 작업 범위, 모델, effort | 전체 파일 원문 |
| tool log | 호출 도구, 성공/실패, 주요 오류 | API 키, 토큰, 쿠키 |
| decision log | 왜 workflow를 썼는지, 왜 멈췄는지 | 감상문식 장문 기록 |
| review log | 사람이 확인한 파일, 테스트 결과, 반려 이유 | 검수 없이 자동 승인 |
이 구조는 블로그 운영에도 그대로 적용된다. 내 작업실에서도 글 하나를 발행할 때 channel gate, preflight, publisher dry-run, sheet sync를 따로 남긴다. 이 기록이 있어야 나중에 “왜 오늘 TECHTAEK를 더 안 냈지?” 같은 질문에 감으로 답하지 않는다. 감은 커피 마실 때나 쓰는 게 좋다.
4. Dynamic Workflows에 맡기기 좋은 작업과 아직 이른 작업
이 기능은 긴 작업을 잘게 쪼개는 데 강점이 있다. 그래서 한 사람이 순서대로 읽기 힘든 구조 조사, 중복 코드 찾기, migration 영향도 분석, 테스트 실패 원인 분류 같은 작업과 잘 맞는다. 결과가 보고서로 나와도 가치가 있고, 사람이 검수한 뒤 수정으로 넘어갈 수 있기 때문이다.
반대로 제품 방향, 아키텍처 책임, 고객 데이터 처리, 결제 로직, 보안 정책 변경은 바로 맡기기 이르다. 이 작업들은 답이 길어서가 아니라 책임이 무거워서 어렵다. 에이전트가 병렬로 움직인다고 책임도 병렬로 흩어지면 안 된다.
| 작업 | 첫 사용 판단 | 이유 |
|---|---|---|
| repo 전체 dead code 후보 찾기 | 좋음 | 읽기 중심이고 사람 검수가 쉬움 |
| 테스트 실패 원인 묶기 | 좋음 | 결과를 CI와 비교할 수 있음 |
| 프레임워크 마이그레이션 계획 | 좋음 | 바로 수정하지 않고 영향도 표로 시작 가능 |
| 수백 파일 자동 수정 | 신중 | rollback과 리뷰 부담이 커짐 |
| 배포 자동화 변경 | 보류 | 실패 비용이 큼 |
| 고객 데이터 처리 로직 변경 | 보류 | 권한·감사·법무 이슈가 붙음 |
첫 성공 경험은 작게 만드는 편이 좋다. “대단한 기능이니까 대단한 작업을 맡기자”가 아니라, “대단한 기능이니까 작은 작업에서 실패 모양을 먼저 보자”가 운영자답다. 멋은 조금 덜하지만, 나중에 덜 울게 된다.
5. 첫 실행 전 체크표
아래 다섯 가지가 비어 있으면 Dynamic Workflows를 켜기 전에 잠깐 멈추는 게 좋다. 기능을 못 믿어서가 아니라, 기능이 꽤 강하기 때문이다.
| 체크 | 질문 | 통과 기준 |
|---|---|---|
| 범위 | 어느 폴더와 작업만 볼 것인가 | 파일 패턴 또는 모듈명 명시 |
| 권한 | 읽기, 초안, 수정 중 어디까지인가 | 첫 실행은 read-only 또는 draft |
| 예산 | 한 번에 어느 정도 사용량까지 허용할 것인가 | 세션별 상한 기록 |
| 검증 | 결과가 맞는지 무엇으로 확인할 것인가 | 테스트, diff, 샘플 파일, 사람이 확인 |
| 중단 | 언제 workflow를 멈출 것인가 | 오류 반복, 범위 이탈, 비용 초과 기준 |
특히 중단 기준은 꼭 있어야 한다. 자동화가 실패할 때 제일 무서운 모습은 크게 폭발하는 게 아니라, 애매하게 계속 진행하는 것이다. “아직 뭔가 하고 있네”라는 문장은 운영에서 은근히 비싼 문장이다.
6. 프롬프트는 작업이 아니라 계약처럼 쓴다
Dynamic Workflows를 부를 때는 “이거 고쳐줘”보다 “이 범위에서 조사하고, 패치 전 보고서를 내고, 수정은 하지 말라”처럼 계약형으로 쓰는 편이 안전하다. 하위 에이전트가 늘어날수록 입력이 모호하면 결과도 여러 방향으로 번진다.
첫 프롬프트 예시는 이렇게 잡을 수 있다.
Create a dynamic workflow for a read-only audit.
Scope: only the src/auth and src/billing folders.
Goal: find risky permission, secret, or logging patterns.
Do not edit files.
Return a table with file path, risk, evidence, confidence, and suggested next step.
Stop if the task needs external credentials or production data.
한국어로 쓰면 이렇게 바꿀 수 있다.
Dynamic workflow를 만들되 읽기 전용 감사로만 실행해줘.
범위는 src/auth와 src/billing 폴더만이야.
위험한 권한 처리, 비밀값 노출, 과한 로그 패턴을 찾아줘.
파일은 수정하지 말고, 경로·위험·근거·확신도·다음 조치 표만 반환해줘.
외부 인증정보나 운영 데이터가 필요하면 즉시 멈춰줘.
중요한 건 “무엇을 할지”보다 “무엇을 하지 말지”가 같이 들어간다는 점이다. 에이전트 자동화에서 금지 조건은 예의가 아니라 안전장치다. 착한 말투보다 명확한 경계가 더 친절할 때가 있다.
7. 첫 주에는 이렇게 굴린다
Dynamic Workflows를 팀에 처음 넣는다면 첫 주 목표는 성과가 아니라 사용 패턴 파악이어야 한다. 얼마나 똑똑한지보다, 어느 범위에서 비용이 튀고 어느 순간 사람이 검수해야 하는지가 먼저 보이면 된다. 멋진 자동화보다 예측 가능한 자동화가 오래 간다.
첫 주 운영 순서는 아래처럼 닫아두는 편이 좋다.
| 단계 | 맡길 일 | 남길 기록 |
|---|---|---|
| 1일차 | read-only 구조 조사 | 범위, 사용량, 소요 시간 |
| 2일차 | dead code 또는 중복 패턴 후보 찾기 | 파일 경로, 근거, 오탐 비율 |
| 3일차 | 테스트 실패 원인 분류 | 실패 로그, 재현 명령, 확신도 |
| 4일차 | 작은 패치 초안 만들기 | diff 크기, 리뷰 시간, 반려 사유 |
| 5일차 | 반복 가능한 workflow 템플릿 정리 | 프롬프트, 금지 조건, 중단 기준 |
여기서 중요한 숫자는 자동 수정 파일 수가 아니라 사람이 다시 확인하는 데 걸린 시간이다. 에이전트가 200개 파일을 고쳐도 리뷰에 하루가 걸리면 운영 이득이 작다. 반대로 read-only 보고서 하나가 30분짜리 탐색을 5분으로 줄이면 그건 바로 쓸 가치가 있다.
내 작업실 기준으로도 같은 원칙을 쓴다. 블로그 원고를 바로 발행하지 않고 channel gate, preflight, publisher dry-run, sheet sync를 나눠 보는 이유가 여기에 있다. 자동화의 실력은 결과물이 아니라, 실패했을 때 어디서 멈추는지에서 더 잘 보인다.
흔한 실수
첫 번째 실수는 repo 전체를 한 번에 맡기는 것이다. 처음부터 전체 repo를 열면 좋은 결과가 나와도 검수하기 어렵고, 이상한 결과가 나와도 어디서 틀어졌는지 추적하기 어렵다. 범위는 작게 잡고, 성공한 패턴만 넓히는 편이 낫다.
두 번째 실수는 비용을 모델 단가로만 보는 것이다. Dynamic Workflows는 병렬 하위 실행과 검증 루프가 핵심이므로 한 번의 요청이 여러 작업 묶음이 될 수 있다. 단가가 같아도 실행량이 커지면 체감 비용은 달라진다.
세 번째 실수는 로그를 나중에 만들겠다고 미루는 것이다. 로그가 없는 첫 성공은 멋있어 보여도, 두 번째 실패를 설명하지 못한다. 성공한 작업일수록 왜 성공했는지 남겨야 다시 쓸 수 있다.
네 번째 실수는 에이전트가 고친 코드를 바로 믿는 것이다. Anthropic은 Opus 4.8이 이전보다 코드 결함을 더 잘 지적한다고 설명하지만, 그 말이 사람 검수가 사라진다는 뜻은 아니다. 더 좋은 에이전트일수록 더 큰 작업을 맡게 되고, 더 큰 작업일수록 검수 표가 필요하다.
FAQ
Dynamic Workflows는 Claude Code subagents와 같은 건가?
비슷한 방향이 있지만 같은 말로 뭉개면 위험하다. Dynamic Workflows는 Claude가 작업을 계획하고 여러 하위 에이전트 실행과 검증을 묶어 큰 작업을 처리하는 연구 프리뷰 기능으로 보는 편이 좋다. 일반 subagent 사용보다 더 긴 실행과 더 큰 사용량을 전제로 생각해야 한다.
Opus 4.8이면 바로 기존 Opus 4.7 작업을 바꿔도 되나?
API 문서 기준 Opus 4.8은 Opus 4.7의 여러 제약을 이어받고, effort 기본값과 adaptive thinking, tool triggering, compaction handling 쪽 변화가 있다. 이미 운영 중인 harness가 있다면 모델 ID만 바꾸기보다 긴 작업, 도구 호출, cache, refusal 처리부터 샘플링해서 보는 게 좋다.
비용을 줄이려면 fast mode를 쓰면 되나?
fast mode는 더 빠른 출력 속도를 제공하지만 premium pricing으로 안내된다. 비용 절감 장치라기보다 속도와 비용의 교환 조건으로 봐야 한다. 비용을 먼저 줄이고 싶다면 workflow 범위 축소, read-only 조사, cache 활용, 실행 상한 기록이 더 기본이다.
회사에서 켜기 전에 가장 먼저 정할 것은 무엇인가?
권한표다. read-only, draft, mutating, high-risk를 나누고 Dynamic Workflows는 어느 등급까지 허용할지 먼저 정해야 한다. 그 다음이 로그, 예산, 테스트, 롤백 기준이다.
개인 개발자도 쓸 만한가?
쓸 만하지만 처음부터 “내 프로젝트 전부 고쳐줘”는 위험하다. 개인 프로젝트라면 dependency cleanup, dead code 후보, 테스트 실패 분류처럼 결과를 보고서로 받을 수 있는 작업부터 시작하는 게 좋다. 작은 성공이 쌓이면 workflow 자체도 내 작업 방식에 맞게 다듬을 수 있다.
마지막 판단
Claude Opus 4.8과 Dynamic Workflows는 더 큰 작업을 맡길 수 있다는 쪽으로 분명히 한 발 나갔다. 특히 코드베이스 전체 조사, 마이그레이션 계획, 보안 감사, 중복 패턴 탐색처럼 병렬 검토가 필요한 일에는 매력적이다.
다만 팀에서 바로 열어야 할 기능은 아니다. 먼저 정해야 할 것은 모델 선택이 아니라 권한표, 비용 상한, 로그 범위, 검수 책임자다. 이 네 가지가 있으면 Dynamic Workflows는 큰 작업을 줄이는 도구가 되고, 없으면 큰 작업을 더 빠르게 헷갈리게 만드는 도구가 된다.
첫 실행은 작게 시작하면 된다. 한 폴더, 읽기 전용, 보고서만, 사람 승인 후 수정 정도면 충분하다. 거기서 사용량과 리뷰 시간을 본 뒤 draft, patch, PR 단계로 넓혀도 늦지 않다. 자동화는 느리게 열수록 오래 쓴다.
참고 자료/공식 출처
- Anthropic, Introducing Claude Opus 4.8
- Anthropic, Claude Opus 4.8 product page
- Claude, Introducing dynamic workflows in Claude Code
- Claude API Docs, What’s new in Claude Opus 4.8