2026년 5월 7일 KST 기준, 팀 AI 코딩 비용은 좌석비, API 토큰비, 검수 시간, 실패 재시도비를 따로 잡아야 계산이 맞다.
Claude Code, Cursor, Codex 비용 비교를 할 때 가격표 한 장만 보면 거의 늘 착시가 생긴다.
한 명이 하루에 두세 번 쓰는 도구와, CI에서 밤새 40번 도는 에이전트는 같은 “AI 코딩”이어도 청구 방식이 완전히 다르다.
그래서 이 글은 제품 순위표가 아니라 팀 예산표다.
내가 팀 예산을 짠다면 첫 줄에 이렇게 적겠다.
사람이 직접 쓰는 반복 작업은 좌석으로 묶고, 자동화·배치·CI·야간 작업은 API 예산으로 따로 빼라.
그 다음 줄에는 조금 덜 멋있지만 더 중요한 문장을 붙인다.
검수 시간이 빠진 AI 코딩 예산표는 살짝 예쁜 가계부다. 실제 통장은 그걸 보고 웃는다.
이 글은 AI 개발 워크플로우 허브의 비용 하위 글이다.
이전의 “어떤 도구가 싸냐” 질문에서 한 단계 내려와, “누가 어떤 작업을 쓸 때 어느 비용통에서 차감할까”를 정리한다.
2026년 5월 7일 기준으로 확인한 가격
아래 숫자는 공식 페이지에서 확인한 USD 기준이다.
세금, 환율, 지역별 가격, 프로모션, 기업 계약 할인은 제외했다.
한국 팀이면 원화 계산 전에 이 표를 USD 원장으로 먼저 유지하는 게 편하다.
환율까지 섞으면 회계 파일이 갑자기 금융상품이 된다.
| 도구 | 공식 확인 가격 | 팀 계산에서 쓰는 의미 | 주의할 점 |
|---|---|---|---|
| Claude Pro | 월 $20 또는 연간 결제 시 월 환산 $17 | 개인 개발자 1명의 가벼운 Claude Code 사용 | Pro와 Max 사용량은 Claude 앱과 Claude Code가 공유 |
| Claude Max | 월 $100부터 | 큰 repo를 자주 다루는 개인 파워 유저 | 공개 pricing 화면에서 20x의 정확한 월 가격은 계정/지역 확인 필요 |
| Claude Team Standard | 연간 월 $20/seat, 월간 $25/seat | 팀 중앙 과금과 기본 협업 | Claude Code 포함 여부는 Premium seat 조건을 확인해야 함 |
| Claude Team Premium | 연간 월 $100/seat, 월간 $125/seat | Claude Code 포함, standard보다 5x 사용량 | seat별로 섞을 수 있으므로 전원 Premium은 보통 과함 |
| Claude Enterprise | $20/seat + API rates | 조직 통제와 사용량 기반 과금 | 모델·작업별 API 단가가 실제 비용을 좌우 |
| Cursor Pro | 월 $20 | 개인 개발자의 기본 에디터+Agent 좌석 | Agent 사용량이 모델 비용 구조에 영향 받음 |
| Cursor Pro+ | 월 $60 | 매일 Agent를 쓰는 개인 | 공식 가격 페이지가 daily agent users에 권장 |
| Cursor Ultra | 월 $200 | Agent power user | 고가 모델을 오래 쓰면 사용량 소진 속도가 핵심 |
| Cursor Teams | 월 $40/user | 팀 billing, usage analytics, SSO가 필요한 팀 | Enterprise는 pooled usage와 audit logs가 필요할 때 |
| OpenAI Codex Go | 월 $8 | 가벼운 Codex 실험 | 팀 운영용 기준으로는 보통 부족 |
| OpenAI Codex Plus | 월 $20 | focused coding sessions용 개인 좌석 | local/cloud/code review 사용량을 같이 봐야 함 |
| OpenAI Codex Pro | 월 $100부터 | Plus보다 5x 또는 20x rate limit | 2026-05-31까지 Pro $100 promo가 있음 |
| OpenAI Codex Business | pay as you go | no fixed seat fee 기반 개발팀 플랜 | usage-based seats와 credits 설계를 같이 봐야 함 |
| OpenAI Codex API key | 표준 API rates | CI, SDK, IDE 자동화 | cloud review, Slack 같은 cloud-based feature 제한 |
숫자를 그대로 비교하면 왜 틀리나
Claude Code Cursor Codex 비용 비교라고 검색하면 보통 월 $20, $40, $100 같은 숫자가 먼저 보인다.
이 숫자는 출발점이지 도착점이 아니다.
팀에서 실제로 돈이 새는 곳은 “월 구독료”가 아니라 “구독료로 처리하면 안 되는 작업”이다.
예를 들어 개발자가 Cursor Pro를 켜고 한 파일을 고치는 건 좌석비에 가깝다.
하지만 nightly job이 Codex API key로 40개 repo를 스캔하면 API 예산이다.
Claude Code에서 ANTHROPIC_API_KEY가 잡힌 상태로 작업하면 구독 한도 대신 API 사용료가 붙을 수 있다.
OpenAI Codex도 ChatGPT 계정으로 쓰는 included usage와 API key로 쓰는 standard API rates가 갈린다.
Cursor도 on-demand usage를 켜면 포함 사용량을 넘긴 뒤 후불 과금이 붙을 수 있다.
즉 같은 “한 번 AI에게 시킴”이어도 다음 질문 4개에 따라 비용통이 갈린다.
| 질문 | 좌석비로 봐도 되는 경우 | API 예산으로 빼야 하는 경우 |
|---|---|---|
| 누가 실행했나 | 사람이 IDE/CLI에서 직접 실행 | CI, cron, batch, bot, GitHub Action |
| 얼마나 반복되나 | 하루 몇 번의 수동 작업 | PR마다, 커밋마다, 매시간 반복 |
| 결과를 누가 검수하나 | 실행자가 바로 diff 확인 | 별도 reviewer, 보안 승인자, QA가 확인 |
| 실패하면 누가 다시 돌리나 | 같은 사람이 즉시 수정 | 자동 retry, queue, parallel worker가 재실행 |
| 산출물이 어디로 가나 | 개인 branch 또는 로컬 메모 | main, release branch, 고객 데이터, prod DB 근처 |
이 질문에 답하지 않고 “우리 팀은 Cursor가 싸?”라고 물으면 대답이 얇아진다.
얇은 대답은 회의실에서는 좋아 보이는데, 월말 카드 명세서 앞에서는 갑자기 조용해진다.
비용통 7개로 나눠야 팀 계산이 된다
팀 AI 코딩 예산은 최소 7개 통으로 나누는 게 좋다.
첫째는 좌석비다.
둘째는 API 토큰비다.
셋째는 도구 호출비다.
넷째는 런타임/컨테이너/CI 비용이다.
다섯째는 실패 재시도비다.
여섯째는 사람 검수 시간이다.
일곱째는 보안·컴플라이언스 승인 비용이다.
| 비용통 | 예시 | 측정 단위 | 월 예산 공식 | 담당자 |
|---|---|---|---|---|
| 좌석비 | Cursor Teams, Claude Team Premium, Codex Plus | seat-month | 좌석 수 × 월 단가 |
팀 리드 |
| API 토큰비 | Claude API, OpenAI API key, Codex API key | 1M input/output token | 입력토큰×단가 + 출력토큰×단가 |
플랫폼 담당 |
| 도구 호출비 | web search, file search, hosted shell | call, GB-day, session | 호출 수 × 단가 |
자동화 담당 |
| 런타임 비용 | CI minutes, cloud task VM, container | minute, session, runner-hour | 실행시간 × runner 단가 |
DevOps |
| 실패 재시도비 | agent retry, flaky test rerun | retry count | 실패 작업 수 × 평균 재실행비 |
작업 owner |
| 검수 시간 | PR review, spec review, security review | reviewer-hour | 검수시간 × 내부 시간단가 |
리뷰어 |
| 승인 비용 | security exception, vendor approval | approval ticket | 티켓 수 × 처리시간 |
보안/관리자 |
여기서 제일 많이 빠지는 항목은 검수 시간이다.
AI가 코드를 빨리 만들수록 리뷰어의 작업은 사라지는 게 아니라 모양이 바뀐다.
예전에는 코드를 읽었다.
이제는 의도, diff, test, 권한, 로그, 재현성을 같이 읽는다.
그게 사람을 은근히 말린다.
공식 단가를 예산표에 넣는 방식
API 단가는 모델별로 다르다.
OpenAI Codex pricing은 Codex를 Plus, Pro, Business, API key 경로로 나누고, API key 사용은 표준 API pricing을 따른다고 설명한다.
다만 2026년 5월 7일 KST 기준 공개 API pricing 표에서 gpt-5.3-codex의 달러 단가를 별도 행으로 확인하지 못했다.
그래서 gpt-5.3-codex 자동화 예산은 Codex usage dashboard, credits 표, 실제 API usage export에서 다시 확인해야 한다.
OpenAI flagship 모델 gpt-5.5는 short context 기준 input $5.00, cached input $0.50, output $30.00로 표시된다.
Claude 쪽은 pricing 페이지 기준으로 Opus 4.7 input $5/MTok, output $25/MTok, Sonnet 4.6 input $3/MTok, output $15/MTok, Haiku 4.5 input $1/MTok, output $5/MTok를 확인했다.
Cursor는 공식 pricing 페이지에서 Pro $20, Pro+ $60, Ultra $200, Teams $40/user/month를 확인했다.
Cursor의 실제 Agent 사용량은 어떤 모델을 얼마나 쓰는지에 따라 달라진다.
그래서 Cursor는 “월 좌석비”와 “on-demand를 켰을 때의 초과 사용량”을 분리해 적어야 한다.
| 항목 | OpenAI 예시 | Claude 예시 | Cursor 예시 |
|---|---|---|---|
| 개인 좌석 | Codex Plus $20 | Claude Pro $20 | Cursor Pro $20 |
| 파워 유저 좌석 | Codex Pro from $100 | Claude Max from $100 | Cursor Ultra $200 |
| 팀 좌석 | Codex Business pay as you go | Claude Team $20/$25 standard, $100/$125 premium | Cursor Teams $40/user |
| API형 자동화 | API key, standard rates | Console/API credits, standard API rates | on-demand usage 또는 Enterprise pooled usage |
| 운영상 확인 필요 | Business seat mix, credit policy | Max 20x exact price by account/region | included usage 소진 기준과 on-demand 정책 |
이 표를 그대로 구매표로 쓰면 안 된다.
구매 전에 “작업 유형”을 먼저 적어야 한다.
도구는 작업을 따라가야지, 작업이 도구를 따라가면 안 된다.
그 반대가 되면 팀 슬랙에 “이거 누가 돌렸어요?”라는 문장이 출몰한다.
그 문장은 보통 좋은 소식이 아니다.
작업별 계산표
아래 표는 내가 팀에서 바로 쓰는 형태로 줄인 계산표다.
핵심은 도구 이름보다 작업 비용통을 먼저 정하는 것이다.
| 작업 | 추천 비용통 | 좌석형이 맞는 조건 | API형이 맞는 조건 | 숨은 비용 |
|---|---|---|---|---|
| 작은 버그 수정 | 개인 좌석 | 한 개발자가 diff를 바로 검수 | bot이 여러 repo를 순회 | test rerun, reviewer 15분 |
| feature spike | 파워 유저 좌석 | 담당자가 컨텍스트를 들고 탐색 | 여러 후보를 batch로 생성 | 버려진 spike 정리 시간 |
| PR 리뷰 보조 | 좌석+검수 시간 | reviewer가 도구를 켜고 보조로 사용 | PR마다 자동 review | false positive triage |
| 보안 리뷰 | API+승인 비용 | 보안 담당자가 수동 점검 | SAST/secret scan 결과와 자동 결합 | 승인 대기, 예외 문서 |
| 마이그레이션 | 파워 유저 좌석+API | 담당자가 큰 repo를 반복 수정 | 파일 단위 일괄 rewrite | rollback 검증, snapshot |
| 테스트 작성 | 좌석 | 개발자가 실패 케이스를 직접 정의 | coverage gap batch 생성 | flaky test 삭제 시간 |
| 문서/README 갱신 | 좌석 | 사람이 변경 의도를 알고 있음 | release마다 자동 생성 | outdated docs 검수 |
| 종속성 업데이트 | API+CI | 소수 package 수동 검토 | Dependabot류와 연결 | CI minutes, 실패 retry |
| release note | 좌석 | PM/tech lead가 최종 편집 | commit log batch 요약 | 고객용 문장 검수 |
| onboarding Q&A | 좌석 | 신입이 직접 질문 | 사내 wiki bot이 반복 응답 | 권한 설정, 비공개 문서 |
| repo inventory | API | 1회성 수동이면 좌석도 가능 | 전체 org 주기 스캔 | 대형 repo context 비용 |
| agent experiment | 실험비 | 1명이 실험하고 공유 | 여러 agent를 병렬 실행 | 실패 로그 저장, cleanup |
작업표의 좋은 점은 팀원별 비용 싸움을 줄여준다는 것이다.
“너는 왜 Ultra야?”가 아니라 “네 작업은 왜 파워 유저 좌석비 통이야?”라고 묻게 된다.
질문이 조금 덜 날카롭고, 답은 훨씬 실무적이다.
2명 팀 예시
가정은 단순하게 둔다.
환율과 세금은 제외한다.
내부 검수 시간 단가는 H로 둔다.
H가 시간당 $40이면 아래 검수비에 40을 넣고, $80이면 80을 넣으면 된다.
| 역할 | 추천 조합 | 월 고정비 | 별도 예산 | 이유 |
|---|---|---|---|---|
| 개발자 A | Cursor Pro | $20 | on-demand off 기본 | 에디터 중심의 일상 작업 |
| 개발자 B | Claude Pro 또는 Codex Plus | $20 | 필요 시 API $30 buffer | CLI/비동기 작업 실험 |
| 공통 | API key budget | $30-$100 | CI/자동화 전용 | 사람 좌석과 분리 |
| 공통 | 검수 시간 | 월 4h × H |
reviewer time | 작은 팀일수록 사람 시간이 진짜 병목 |
2명 팀의 핵심은 비싼 좌석을 많이 사는 게 아니다.
한 명이 Cursor로 계속 빌드하고, 한 명이 Claude Code나 Codex로 repo-level 작업을 실험하면 충분한 경우가 많다.
이때 API key를 개인 실험에 섞으면 추적이 흐려진다.
작은 팀일수록 계정도 적고 기록도 적어서 “어제 밤에 뭐가 돈 썼지?”가 빨리 온다.
그래서 API key 이름은 반드시 작업 기준으로 만든다.
예시는 codex-ci-review, claude-migration-spike, openai-release-note-bot처럼 붙인다.
my-key-final-final-real 같은 이름은 금지다.
그 이름은 언젠가 너를 배신한다.
5명 팀 예시
5명부터는 좌석을 전원 동일하게 맞추는 유혹이 생긴다.
하지만 실제 사용 패턴은 대개 다르다.
프론트 2명, 백엔드 2명, 리드 1명이라고 해보자.
| 역할 | 추천 조합 | 월 고정비 예시 | 별도 예산 | 판단 |
|---|---|---|---|---|
| 프론트 2명 | Cursor Pro 또는 Teams | $40-$80 | 디자인 검수 시간 | IDE 안에서 빠른 수정이 많음 |
| 백엔드 2명 | Cursor Teams + Claude/Codex 보조 | $80+ | API $100-$300 | 테스트·마이그레이션 자동화가 많음 |
| 리드 1명 | Claude Team Premium 또는 Codex Pro | $100-$125 이상 | review budget | 큰 맥락, 설계 검수, PR triage |
| 공통 | API automation pool | 사용량 기반 | $200 cap부터 시작 | CI와 batch는 팀 예산으로 분리 |
| 공통 | 보안 승인 | 월 2h × H |
보안 담당 시간 | repo 권한, secret, 고객 데이터 확인 |
5명 팀의 기준은 “전원 같은 도구”가 아니다.
“전원 같은 기록 체계”다.
누가 Cursor를 쓰든, Claude Code를 쓰든, Codex를 쓰든 다음 5개 필드는 남아야 한다.
| 필드 | 예시 |
|---|---|
| 작업 ID | PR-1842, MIG-202605, BUG-742 |
| 도구 | Cursor Agent, Claude Code, Codex CLI, Codex API |
| 비용통 | seat, api, review, ci, security |
| 결과 | merged, discarded, needs-human-rewrite, failed |
| 검수자 | frontend-lead, security, owner |
이 기록이 있으면 다음 달 예산 회의가 덜 감정적이다.
사람은 기억으로 싸우고, 표는 로그로 말한다.
표가 항상 이기진 않지만, 적어도 억울함을 조금 덜 만든다.
10명 팀 예시
10명부터는 “좌석 구매”가 아니라 “운영 정책”이 먼저다.
이 구간에서 전원에게 파워 유저 좌석을 주면 예산이 과해질 수 있다.
반대로 전원 기본 좌석만 주면 리드와 플랫폼 담당자가 계속 한도에 걸릴 수 있다.
| 그룹 | 인원 | 추천 조합 | 월 고정비 예시 | API/검수 예산 |
|---|---|---|---|---|
| 일반 개발자 | 6 | Cursor Teams 또는 Codex Plus급 | 6 × $40 또는 plan별 계산 |
낮음 |
| agent-heavy 개발자 | 2 | Cursor Pro+/Ultra 또는 Claude Premium/Codex Pro | $60-$200 × 2 |
중간 |
| tech lead | 1 | Claude/Codex 파워 좌석 | $100 이상 | 높음 |
| platform/security | 1 | API budget owner | 좌석 1개 | 높음 |
| 공통 자동화 | – | API key + CI cap | 사용량 기반 | 월 cap 필수 |
10명 팀에서는 API cap을 “전체 월 한도”와 “작업별 한도”로 나눠야 한다.
예를 들어 전체 API cap이 $500이어도 migration 작업 하나가 $450을 먹으면 나머지 팀이 멈춘다.
그래서 작업별 cap을 둔다.
| 작업군 | 월 cap 예시 | 초과 시 행동 |
|---|---|---|
| PR 자동 리뷰 | $150 | sampling으로 전환 |
| nightly repo scan | $100 | 주 2회로 축소 |
| migration batch | $200 | lead 승인 후 증액 |
| release note bot | $50 | 작은 모델로 전환 |
| 실험 agent | $100 | 실험 종료 회고 없으면 중단 |
여기서 중요한 건 cap 자체보다 초과 시 행동이다.
한도만 걸고 누가 결정할지 없으면 결국 급한 사람이 이긴다.
급한 사람이 매번 이기면 예산표는 장식품이 된다.
좌석형이 맞는 경우
좌석형은 사람의 판단과 컨텍스트가 계속 붙어 있는 작업에 강하다.
Cursor, Claude Code, Codex를 사람이 직접 열고, diff를 보고, 프롬프트를 수정하고, 바로 다음 명령을 내리는 흐름이다.
이 흐름은 토큰 단가만으로 계산하면 오히려 이상해진다.
사람이 중간중간 멈추고 생각하는 시간이 있기 때문이다.
| 좌석형이 맞는 신호 | 이유 |
|---|---|
| 같은 개발자가 하루 종일 작은 판단을 반복한다 | context와 손의 흐름이 중요 |
| 작업 실패 시 바로 프롬프트를 고친다 | retry가 사람 판단으로 제어됨 |
| repo 구조를 계속 읽고 설계 결정을 한다 | 긴 대화와 작업 히스토리가 유리 |
| 보안상 API key를 여러 자동화에 뿌리기 어렵다 | 계정 기반 통제가 단순 |
| 사용량보다 온보딩과 UX가 더 중요하다 | 팀 adoption 비용이 낮아짐 |
좌석형의 단점도 분명하다.
자동화가 늘수록 “누구 좌석에서 돌린 작업인가”가 애매해진다.
개인 계정으로 CI성 작업을 돌리면 퇴사, 휴가, 권한 변경 때 운영이 꼬인다.
그래서 반복 자동화는 좌석형에서 빨리 빼내야 한다.
좌석은 사람에게 붙이고, 자동화는 서비스 계정과 API budget에 붙인다.
이 한 줄만 지켜도 월말 추적이 훨씬 쉬워진다.
API형이 맞는 경우
API형은 반복성, 추적성, 분리된 권한이 중요할 때 맞다.
예를 들어 release note를 매주 생성하거나, PR 설명을 자동 검토하거나, repo inventory를 정기 스캔하는 작업이다.
OpenAI Codex API key와 Claude API는 이런 자동화에 적합하다.
다만 API형은 싸 보이다가 로그가 없으면 무섭다.
토큰은 눈에 안 보이고, output은 은근 비싸다.
| API형이 맞는 신호 | 이유 |
|---|---|
| cron, CI, bot이 실행한다 | 사람 좌석과 분리해야 함 |
| 같은 prompt가 여러 repo에 반복된다 | batch와 cache 효과를 측정 가능 |
| 결과 품질을 샘플링 검수할 수 있다 | 전체 수동 검수보다 비용 구조가 좋음 |
| 실패율과 retry율을 로그로 남길 수 있다 | 재시도비를 줄일 수 있음 |
| 모델을 작업별로 바꿔도 된다 | 작은 모델과 큰 모델을 섞기 쉬움 |
API형의 첫 운영 규칙은 per-task cap이다.
두 번째 규칙은 output token cap이다.
세 번째 규칙은 retry cap이다.
이 세 개가 없으면 agent가 선의로 장문 보고서를 쓰고, 또 실패하고, 또 다시 설명한다.
AI가 성실해지는 순간 예산이 떨기 시작한다.
성실함은 좋지만, 영수증까지 성실하면 곤란하다.
작업별 배분 규칙
아래는 팀에서 바로 붙일 수 있는 배분 규칙이다.
도구별로 나누지 말고 작업별로 나누는 게 핵심이다.
| 규칙 | 적용 방식 | 예산 처리 |
|---|---|---|
| 1. 사람 주도 작업은 seat로 시작 | IDE, CLI, web에서 직접 수행 | 개인/팀 좌석비 |
| 2. 반복 작업은 API로 이동 | PR마다, nightly마다, release마다 | API budget |
| 3. review가 붙는 작업은 review cost를 추가 | PR, 보안, DB, 고객 데이터 | reviewer-hour |
| 4. 실패율 20% 넘으면 실험비로 격리 | flaky output, 잦은 rollback | experiment budget |
| 5. prod 근처 작업은 승인 비용을 붙임 | DB migration, secret, auth, billing | security approval |
| 6. cloud task는 runtime을 따로 기록 | VM, container, CI runner | runtime budget |
| 7. output 긴 작업은 요약 정책을 강제 | docs, report, review | output token cap |
| 8. MCP가 많은 작업은 context surcharge를 붙임 | 여러 서버/도구 연결 | context budget |
여기서 context surcharge라는 이름은 거창하지만 내용은 단순하다.
MCP, rules, AGENTS.md, repo 문서가 길어질수록 매번 들고 다니는 짐이 커진다.
OpenAI Codex 공식 문서도 AGENTS.md 크기와 MCP 서버 수를 줄이면 사용 한도를 오래 쓸 수 있다고 안내한다.
이건 도구 팁이 아니라 예산 팁이다.
컨텍스트는 공짜 배경음악이 아니다.
계속 넣으면 계속 돈이 된다.
숨은 비용 8개
가격표에는 잘 안 보이지만 팀 예산에는 반드시 들어가는 항목이 있다.
이걸 빼면 “AI 도입 후 비용 절감”이라는 문장이 너무 빨리 나온다.
너무 빨리 나온 문장은 대개 나중에 뛰어다닌다.
| 숨은 비용 | 실제로 생기는 일 | 줄이는 방법 |
|---|---|---|
| 리뷰 시간 | AI가 만든 diff를 사람이 더 넓게 봄 | spec review와 test evidence 요구 |
| CI minutes | agent가 테스트를 여러 번 돌림 | retry cap, changed-test selection |
| 실패 재시도 | 같은 작업을 다른 prompt로 반복 | 실패 사유 taxonomy |
| 보안 승인 | secret, prod DB, 고객 데이터 접근 확인 | 권한 등급표 |
| 로그 보관 | prompt, diff, 승인 기록 저장 | 최소 보존 필드 정의 |
| 컨텍스트 비대화 | rules, MCP, docs를 매번 주입 | project별 AGENTS.md 분리 |
| 모델 escalation | 작은 모델 실패 후 큰 모델로 재시도 | escalation 조건 문서화 |
| vendor admin | 좌석 이동, 퇴사자 회수, SSO 설정 | 월 1회 access review |
특히 failed-agent retries는 따로 봐야 한다.
성공한 작업만 보면 AI가 싸 보인다.
실패한 작업까지 보면 어떤 워크플로가 좋은지 보인다.
내가 예산표를 만든다면 성공률이 아니라 merged per dollar와 accepted diff per reviewer-hour를 같이 본다.
돈만 절약하고 리뷰어를 갈아 넣으면 팀은 오래 못 간다.
그건 생산성이 아니라 조용한 부채다.
추적 워크시트
아래 워크시트는 Google Sheets로 옮기기 쉽게 만들었다.
하지만 여기서는 시트를 업데이트하지 않는다.
부모가 한다고 했으니 나는 얌전히 Markdown만 남긴다.
| 날짜 | 작업 ID | 도구 | 실행 방식 | 비용통 | 모델/플랜 | input | output | tool calls | runtime | retry | reviewer | 결과 | 메모 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2026-05-07 | PR-101 | Cursor | human | seat | Teams | – | – | – | – | 0 | FE lead | merged | 작은 UI 수정 |
| 2026-05-07 | PR-102 | Codex | cloud review | api+review | GPT-5.3-Codex | 확인 | 확인 | 0 | 확인 | 1 | BE lead | changes requested | retry 원인 기록 |
| 2026-05-07 | MIG-01 | Claude Code | human | premium seat | Team Premium | – | – | – | – | 0 | tech lead | draft | 큰 repo 맥락 필요 |
| 2026-05-07 | SCAN-01 | OpenAI API | cron | api+runtime | gpt-5.4-mini | 확인 | 확인 | 0 | 20m | 0 | platform | completed | nightly scan |
| 2026-05-07 | SEC-01 | Claude API | manual+review | api+security | Sonnet 4.6 | 확인 | 확인 | web 2 | – | 0 | security | approved | secret 경계 확인 |
워크시트에서 확인이라고 적은 칸은 나중에 대시보드나 usage export로 채워야 한다.
모르면 빈칸보다 확인 필요가 낫다.
빈칸은 사람이 잊어버린다.
확인 필요는 적어도 양심이 살짝 남아 있다.
월말 정산표
월말에는 작업 로그를 아래 형태로 묶는다.
도구별 총액도 필요하지만, 더 중요한 건 비용통별 총액이다.
| 비용통 | 월 합계 | 전월 대비 | 원인 | 다음 액션 |
|---|---|---|---|---|
| seat | 확인 필요 | 확인 필요 | 좌석 수 변화 | 미사용 seat 회수 |
| api | 확인 필요 | 확인 필요 | batch 증가, output 증가 | task cap 조정 |
| review | 확인 필요 | 확인 필요 | PR 수 증가, diff 크기 증가 | spec 먼저 요구 |
| ci/runtime | 확인 필요 | 확인 필요 | retry, full test | changed-test 도입 |
| security | 확인 필요 | 확인 필요 | 승인 대상 증가 | 권한 등급표 개정 |
| experiment | 확인 필요 | 확인 필요 | agent spike | 성공/중단 판단 |
월말 질문은 “누가 많이 썼냐”로 시작하면 분위기가 안 좋아진다.
대신 이렇게 묻는 게 좋다.
이번 달에 seat로 남길 작업과 API로 빼야 할 작업은 무엇인가?
retry가 많이 난 작업군은 무엇인가?
reviewer-hour를 줄이려면 prompt가 아니라 acceptance criteria를 고쳐야 하는가?
이 질문들은 사람을 덜 공격하고 시스템을 더 드러낸다.
팀 비용 회의는 이 방향이 오래 간다.
도구별로 나누는 실전 기준
Claude Code는 큰 맥락, 터미널 작업, 긴 추론, repo-level refactor를 사람이 붙잡고 갈 때 강하다.
Cursor는 에디터 안에서 읽고 고치고 검수하는 흐름이 빠르다.
Codex는 web, CLI, IDE, cloud task, code review, API key 자동화까지 범위가 넓어서 비용통 분리가 중요하다.
이 문장은 제품 우열이 아니다.
팀에서 서로 다른 도구를 같이 쓸 때의 역할 분담이다.
| 상황 | Claude Code | Cursor | Codex |
|---|---|---|---|
| 큰 repo 탐색 | 좋음 | 좋음 | 좋음 |
| IDE 안 빠른 수정 | 가능 | 강함 | IDE extension 사용 가능 |
| 터미널 중심 작업 | 강함 | CLI 보조 | CLI 강함 |
| PR 자동 리뷰 | 별도 설계 필요 | Bugbot/리뷰 제품 확인 | Codex GitHub review 사용 가능 |
| API 자동화 | Claude API | on-demand/Enterprise 확인 | API key로 분리 쉬움 |
| 팀 admin | Team/Premium/Enterprise | Teams/Enterprise | Business/Enterprise |
| 비용 추적 | plan/API 분리 중요 | usage analytics 중요 | credits/API/dashboard 중요 |
내 기준은 이렇다.
개발자가 에디터 안에서 계속 손을 움직이면 Cursor를 먼저 본다.
큰 refactor와 터미널 작업을 리드가 붙잡고 가면 Claude Code를 먼저 본다.
자동화와 cloud review, API key 기반 작업을 팀 프로세스에 넣고 싶으면 Codex를 따로 본다.
그리고 세 개를 같이 쓰는 팀이라면, 도구별 예산보다 작업별 예산이 먼저다.
여기서 순서가 바뀌면 같은 작업을 세 도구가 서로 다른 방식으로 반복한다.
그 순간부터 비용표는 비교표가 아니라 미로가 된다.
좌석을 전원에게 줄까, 역할별로 줄까
전원 같은 좌석은 관리가 쉽다.
하지만 낭비도 쉽다.
역할별 좌석은 싸질 수 있다.
하지만 관리가 귀찮다.
그래서 아래 4단계로 시작하는 게 현실적이다.
| 단계 | 운영 방식 | 적합한 팀 |
|---|---|---|
| 1단계 | 기본 좌석만 전원 지급 | 사용 패턴이 아직 모호한 팀 |
| 2단계 | 파워 유저 1-2명만 상위 좌석 | repo-level 작업이 일부에게 몰리는 팀 |
| 3단계 | 자동화는 API budget으로 분리 | CI/PR/release 자동화가 생긴 팀 |
| 4단계 | Enterprise/SSO/audit 검토 | 보안, 감사, 데이터 정책이 필요한 팀 |
처음부터 4단계로 가면 멋있어 보인다.
하지만 작은 팀이면 그냥 관리 일이 늘 수 있다.
반대로 10명 이상인데 1단계에 계속 머물면 추적이 흐려진다.
팀 규모보다 더 중요한 건 작업 반복성이다.
반복이 늘면 API budget으로 뺀다.
권한이 중요해지면 Enterprise나 Team admin 기능을 본다.
리뷰 부담이 커지면 도구를 늘리기 전에 acceptance criteria를 고친다.
보안 비용은 별도 통으로 둬야 한다
AI 코딩 도구는 파일을 읽고, 명령을 실행하고, 외부 도구를 부른다.
이 기능은 편하다.
동시에 회계표에는 잘 안 잡히는 보안 비용을 만든다.
Claude Code 공식 도움말은 ANTHROPIC_API_KEY 환경변수가 있으면 구독이 아니라 API usage charge로 이어질 수 있다고 안내한다.
OpenAI Codex도 API key 인증은 standard API rates가 적용되고, ChatGPT credit 기반 기능과 다르게 동작한다.
Cursor Teams는 org-wide privacy mode controls, RBAC, SAML/OIDC SSO를 제공한다고 pricing 페이지에 적혀 있다.
보안팀이 봐야 할 건 “어느 도구가 좋냐”가 아니라 다음 표다.
| 점검 항목 | 질문 | 비용 영향 |
|---|---|---|
| API key 위치 | 개인 노트북인가, CI secret인가 | 오남용 추적 |
| auto-reload | 자동 충전이 켜져 있나 | 월 cap 붕괴 |
| on-demand | 초과 사용이 자동 허용되나 | 후불 청구 |
| MCP 서버 | 어떤 도구가 context에 붙나 | 토큰과 권한 증가 |
| 로그 | prompt/diff/approval을 남기나 | 감사와 저장 비용 |
| prod 접근 | DB, billing, 고객 데이터 근처인가 | 승인 시간 |
| 퇴사자 회수 | 좌석과 token key를 같이 회수하나 | 보안 사고 예방 |
이 표는 개발자를 겁주려는 게 아니다.
겁주는 문서는 대개 안 읽힌다.
목적은 운영자가 나중에 울지 않게 하는 것이다.
개발팀의 눈물은 보통 Jira 티켓으로 변신한다.
그 티켓은 오래 산다.
실제 계산 공식
팀 월비용은 아래 식으로 잡으면 된다.
월 AI 코딩 비용 =
좌석비
+ API 토큰비
+ 도구 호출비
+ CI/런타임비
+ 실패 재시도비
+ 사람 검수비
+ 보안 승인비
좌석비는 쉽다.
좌석비 = Σ(플랜 단가 × 좌석 수)
API 토큰비는 모델별로 나눈다.
API 토큰비 =
입력 MTok × input 단가
+ cached input MTok × cached input 단가
+ 출력 MTok × output 단가
실패 재시도비는 이렇게 잡는다.
실패 재시도비 =
실패 작업 수
× 평균 재실행 token 비용
+ 실패 작업 수
× 평균 추가 검수 시간
× H
사람 검수비는 이렇게 잡는다.
사람 검수비 =
PR/작업 수
× 평균 검수 시간
× 내부 시간단가 H
공식 가격표는 앞의 input/output 단가만 알려준다.
팀의 진짜 차이는 실패율, 검수 시간, output 정책에서 난다.
그래서 가격 비교표보다 작업 로그가 더 중요하다.
예산 배분 샘플
아래 숫자는 구매 권고가 아니라 구조 예시다.
팀 상황에 맞게 확인 필요 칸을 채우면 된다.
| 팀 규모 | seat budget | API budget | review budget | security/runtime | 운영 메모 |
|---|---|---|---|---|---|
| 2명 | $40-$120 | $30-$100 | 4h × H |
낮음 | 좌석 2개와 API key 1개부터 |
| 5명 | $200-$500 | $100-$300 | 8h × H |
중간 | 리드/파워 유저만 상위 좌석 |
| 10명 | $400-$1,200 | $300-$800 | 16h × H |
높음 | API cap, SSO, audit 검토 |
| 20명 | 확인 필요 | 확인 필요 | 확인 필요 | 높음 | Enterprise/pooled usage 협상 |
왜 범위가 넓냐면 작업 패턴이 다르기 때문이다.
같은 5명 팀이어도 one repo product team과 multi repo platform team은 완전히 다르다.
AI 코딩 비용은 인원수보다 repo 수, PR 수, 자동화 빈도에 더 민감하다.
그래서 예산표에는 팀원 수만 넣지 말고 월 PR 수와 월 자동화 실행 횟수를 같이 넣어야 한다.
월 PR 30개 팀과 월 PR 300개 팀은 같은 5명이어도 다른 생물이다.
둘을 같은 표로 묶으면 표가 거짓말을 한다.
표가 거짓말하면 사람이 뒤처리한다.
의사결정 체크리스트
구매 전에 아래 질문을 답해보자.
답이 비어 있으면 아직 결제 버튼을 누르기 이르다.
| 질문 | 답 |
|---|---|
| 월 PR 수는 몇 개인가 | 확인 필요 |
| agent가 자동으로 도는 작업은 몇 개인가 | 확인 필요 |
| 가장 비싼 output 작업은 무엇인가 | 확인 필요 |
| retry율이 20% 넘는 작업군은 무엇인가 | 확인 필요 |
| reviewer-hour가 많이 드는 작업은 무엇인가 | 확인 필요 |
| prod 권한 근처 작업은 몇 개인가 | 확인 필요 |
| API key owner는 누구인가 | 확인 필요 |
| on-demand/auto-reload는 켜져 있는가 | 확인 필요 |
| 월 cap 초과 시 누가 승인하는가 | 확인 필요 |
| 미사용 좌석 회수일은 언제인가 | 확인 필요 |
이 체크리스트는 재미는 없지만 효과는 있다.
예산 관리는 원래 살짝 재미없어야 한다.
너무 재미있는 예산표는 보통 누군가의 카드가 열심히 뛰고 있다는 뜻이다.
팀 룰 예시
아래 룰을 AI coding cost policy로 붙여두면 된다.
짧아야 읽힌다.
길면 아무도 안 읽고, 안 읽으면 AI도 못 구한다.
| 룰 | 문장 |
|---|---|
| Seat rule | 사람이 직접 판단하며 쓰는 작업은 개인 또는 팀 seat에서 실행한다. |
| API rule | CI, cron, bot, batch는 개인 좌석이 아니라 API budget에서 실행한다. |
| Cap rule | 모든 API 작업은 monthly cap과 per-task cap을 가진다. |
| Retry rule | 자동 retry는 최대 2회, 이후 owner가 실패 사유를 기록한다. |
| Review rule | main, prod, customer data 근처 변경은 human review 없이는 merge하지 않는다. |
| Output rule | long report, docs, review output은 길이 제한을 둔다. |
| Security rule | secret, auth, billing, DB 작업은 security approval 통을 사용한다. |
| Cleanup rule | 매월 미사용 seat, 죽은 API key, 오래된 MCP 연결을 회수한다. |
이 룰의 목적은 속도를 죽이는 게 아니다.
속도를 예측 가능하게 만드는 것이다.
팀에서 예측 가능성은 성능이다.
특히 AI 도구가 들어오면 “빠름”은 많아지고 “어디서 왜 빠른지”는 줄어든다.
예산표는 그 빈칸을 채우는 장치다.
FAQ
Q1. Claude Code, Cursor, Codex 중 하나만 골라야 해?
작은 팀은 하나로 시작하는 게 편하다.
하지만 팀이 커지면 하나만 고르는 것보다 작업별로 나누는 쪽이 현실적이다.
Cursor는 에디터 안 작업, Claude Code는 터미널과 큰 맥락 작업, Codex는 cloud task·code review·API 자동화 쪽으로 나눠 볼 수 있다.
중요한 건 도구 수가 아니라 비용통 수다.
Q2. 월 $20 좌석이면 충분한 팀은 어떤 팀이야?
AI 코딩을 하루 몇 번 보조로 쓰고, 자동화가 거의 없고, PR 수가 많지 않으면 월 $20급 좌석으로 시작해도 된다.
이 경우 API budget은 작게 열고, on-demand나 auto-reload는 기본적으로 꺼두는 편이 낫다.
초반에는 절약보다 사용 패턴 기록이 더 중요하다.
기록 없이 아끼면 다음 달에도 같은 질문을 하게 된다.
Q3. API key를 쓰면 항상 더 싸?
아니다.
반복 자동화에는 API key가 깔끔하지만, 사람이 시행착오를 많이 하는 탐색 작업은 좌석형이 더 관리하기 쉬울 수 있다.
API는 input/output, tool call, runtime, retry가 모두 비용이 된다.
특히 output이 길고 실패 재시도가 많으면 금방 비싸진다.
Q4. Cursor Teams $40/user는 언제 고려해?
여러 명이 Cursor를 쓰고 중앙 billing, usage analytics, org-wide privacy mode, RBAC, SSO가 필요하면 Teams를 본다.
혼자 쓰는 개발자라면 Pro나 Pro+부터 충분히 검토할 수 있다.
팀 플랜은 기능보다 운영 통제가 필요한 순간에 의미가 커진다.
도구가 아니라 조직 문제가 생길 때 Teams가 보이기 시작한다.
Q5. Claude Team Premium을 전원에게 줘야 해?
보통은 아니다.
공식 가격 기준 Premium seat는 standard보다 비싸고, 5x usage와 Claude Code 포함 조건이 있다.
큰 repo를 자주 다루는 리드, 마이그레이션 담당, agent-heavy 개발자부터 주는 식으로 시작하는 게 안전하다.
전원 상위 좌석은 사용량 로그를 본 뒤에 결정해도 늦지 않다.
Q6. Codex Business의 장점은 뭐야?
OpenAI 공식 Codex pricing은 Business를 pay as you go로 설명하고, standard 또는 usage-based Codex seats를 배정할 수 있다고 안내한다.
팀에서 cloud task, code review, API key 자동화를 분리하고 싶을 때 검토 대상이다.
다만 정확한 seat mix와 credit 정책은 admin 화면이나 계약 조건을 확인해야 한다.
여기서 숫자를 지어내면 안 된다.
Q7. 숨은 비용 중 제일 먼저 잡아야 할 건 뭐야?
리뷰 시간과 retry율이다.
둘은 거의 모든 팀에서 생긴다.
CI minutes나 보안 승인도 중요하지만, 리뷰 시간과 retry율은 AI 코딩 도입 초기에 바로 튄다.
accepted diff per reviewer-hour를 보면 도구가 팀에 실제로 도움 되는지 더 잘 보인다.
Q8. 공식 가격이 자주 바뀌면 표를 어떻게 유지해?
가격표에는 verified_at을 붙여라.
이 글 기준은 2026년 5월 7일 KST다.
다음 업데이트 때는 공식 pricing URL을 다시 확인하고, 확인 안 된 값은 확인 필요로 남기는 게 맞다.
AI 도구 가격은 변동성이 큰 영역이라 기억으로 업데이트하면 위험하다.
공식 출처
- Claude pricing
- Claude Code with Pro or Max plan
- Cursor pricing
- OpenAI Codex pricing
- OpenAI API pricing
가격과 기능은 모두 2026년 5월 7일 KST에 공식 페이지 기준으로 확인했다.
확인된 숫자만 본문 표에 넣었다.
공식 페이지에서 공개적으로 확인하지 못한 값은 확인 필요로 남겼다.
특히 지역별 세금, 환율, enterprise 계약, 프로모션, account-specific usage limit은 팀 계정에서 다시 확인해야 한다.
함께 보면 좋은 글
- Cursor·Claude Code·Codex·Windsurf 2026 요금표 비교 — 팀에서 누가 진짜 싸고 어디서 비용 폭탄 맞는가
- AI 코딩 툴 예산 짜는 법 2026 — 구독형과 API형을 섞을 때 비용폭탄 피하는 팀 규칙
- Claude Code 비용 줄이는 운영 루틴 2026 — Pro·Max·API를 작업별로 섞어 쓰는 기준표
발행 전 최종 점검
- idea_id는
BLOG-20260507-109로 맞췄다. - 채널은 TECHTAEK이고, 글의 중심은 가격 뉴스가 아니라 운영 비용 배분이다.
- 도입부는 최근 회피 대상인 TYPE 8 반전과 TYPE 2 실망 패턴을 피했다.
- 공식 가격은 2026년 5월 7일 KST 기준으로 확인 가능한 값만 넣었다.
- 공개 URL은
list-published --channel TECHTAEK에서 확인된 링크만 사용했다. - Google Sheets, blog-ideas, recent-patterns는 수정하지 않았다.