Codex를 오래 쓰다 보면 이상한 순간이 온다.
작업은 별로 안 한 것 같은데 사용량이 빨리 줄어든다.
코드 한 줄 고치자고 불렀는데, Codex가 프로젝트 규칙, AGENTS.md, MCP 서버 설명, 도구 목록, 이전 맥락까지 한 보따리 들고 들어온다.
일은 고작 버튼 색 바꾸기인데 입장료가 콘퍼런스급이다.
OpenAI의 Codex pricing 문서는 사용량을 오래 쓰는 방법을 꽤 직접적으로 말한다.
핵심은 네 가지다.
프롬프트 크기를 통제하고, AGENTS.md를 줄이고, 필요 없는 MCP 서버를 끄고, 루틴 작업은 작은 모델로 내리는 것이다.
이 글은 그 네 가지를 TECHTAEK식 운영표로 바꾼 글이다.
한 줄 결론
MCP 서버를 줄이면 Codex 사용량은 실제로 오래 갈 수 있다.
다만 MCP만 줄인다고 끝나지는 않는다.
Codex 사용량은 대체로 사용자 프롬프트 + AGENTS.md + MCP 서버 컨텍스트 + 도구 설명 + 작업 중 생성되는 대화가 합쳐져 줄어든다.
그래서 절약은 한 가지 스위치가 아니라 네 가지 레버다.
| 절약 레버 | 효과 | 먼저 할 일 |
|---|---|---|
| 프롬프트 크기 줄이기 | 매 요청의 기본 입력량 감소 | 불필요한 배경 설명 삭제 |
| AGENTS.md 경량화 | 매 세션에 주입되는 규칙 감소 | 루트는 공통 규칙만 남기기 |
| MCP 서버 제한 | 도구/서버 설명 컨텍스트 감소 | 작업별 MCP만 켜기 |
| 작은 모델 사용 | 로컬 메시지 한도 보존 가능 | 루틴 작업은 GPT-5.4 또는 GPT-5.4-mini |
OpenAI 문서는 특히 MCP에 대해 “추가한 MCP마다 더 많은 컨텍스트가 메시지에 들어가고 한도를 더 쓴다”는 취지로 안내한다.
즉 MCP는 공짜 플러그인이 아니다.
잘 쓰면 능력이 늘고, 막 켜두면 기본 체중이 늘어난다.
Codex 사용량은 어디서 새나
사용자는 보통 “내가 보낸 메시지”만 사용량이라고 생각한다.
하지만 Codex 같은 코딩 에이전트는 눈에 보이지 않는 맥락을 같이 읽는다.
| 사용량을 먹는 요소 | 예시 | 왜 커지나 |
|---|---|---|
| 사용자 프롬프트 | “이 버그 고쳐줘” 뒤에 붙인 긴 배경 | 매 요청마다 직접 들어감 |
| AGENTS.md | 프로젝트 규칙, 실행법, 금지사항 | 세션 시작과 작업 범위에 따라 로드 |
| MCP 서버 | 브라우저, 문서, Figma, Sentry, GitHub 등 | 서버/도구 설명이 컨텍스트에 포함 |
| 도구 결과 | rg, 테스트 로그, 빌드 에러 |
작업 중 계속 누적 |
| 대화 기록 | 이전 지시, 중간 설명, 재시도 | 장기 작업일수록 증가 |
이 중 사용자가 가장 빨리 줄일 수 있는 것은 세 가지다.
프롬프트를 짧게 쓰기.
AGENTS.md를 작게 만들기.
필요 없는 MCP 서버를 끄기.
모델 선택은 그다음이다.
입력 맥락이 비대한 상태에서 모델만 바꾸면, 가벼운 차에 짐을 더 싣는 꼴이 된다.
1. 프롬프트는 짧게가 아니라 정확하게 줄인다
OpenAI는 사용량을 오래 쓰려면 프롬프트 크기를 통제하라고 안내한다.
여기서 핵심은 “대충 짧게”가 아니다.
필요한 제약은 남기고, 불필요한 배경을 제거하는 것이다.
| 나쁜 축소 | 좋은 축소 |
|---|---|
| “고쳐줘”만 남긴다 | 목표, 파일, 성공 기준만 남긴다 |
| 모든 배경을 지운다 | 현재 문제와 재현 절차만 남긴다 |
| 테스트 기준을 생략한다 | 실행할 검증 명령만 남긴다 |
| 원하는 스타일을 감으로 맡긴다 | 기존 패턴을 따르라고 지시한다 |
실무 프롬프트는 이렇게 쓰면 충분하다.
목표: 로그인 버튼 로딩 상태가 두 번 깜빡이는 버그 수정
범위: src/components/LoginButton.tsx와 관련 테스트만
성공 기준: npm test -- LoginButton 통과
주의: 스타일 리팩터링 금지, 기존 API 변경 금지
이 정도면 긴 설명 없이도 Codex가 움직일 수 있다.
반대로 “우리 서비스는 이런 역사와 이런 고객이 있고 지난번에 이런 일이 있었고…”로 시작하면 작업 전부터 컨텍스트가 무거워진다.
인간에게도 길다.
AI에게도 길다.
컴퓨터는 참아주지만 사용량은 참아주지 않는다.
2. AGENTS.md는 루트에 다 넣으면 점점 비싸진다
AGENTS.md는 Codex에게 프로젝트 규칙을 알려주는 좋은 장치다.
하지만 루트 AGENTS.md에 모든 팀 규칙, 모든 실행법, 모든 예외, 모든 말투, 모든 배포 절차를 다 넣으면 기본 컨텍스트가 무거워진다.
OpenAI의 AGENTS.md 가이드는 큰 프로젝트에서 중첩된 파일로 지시를 나눌 수 있다고 설명한다.
루트에는 공통 규칙을 두고, 특정 영역에는 더 가까운 위치에 세부 규칙을 두는 방식이다.
| 위치 | 넣을 내용 | 빼야 할 내용 |
|---|---|---|
| 루트 AGENTS.md | 공통 빌드, 공통 테스트, 보안 금지선 | 특정 팀만 쓰는 긴 절차 |
frontend/AGENTS.md |
UI 규칙, 테스트 명령, 디자인 시스템 | 백엔드 배포법 |
backend/AGENTS.md |
API 규칙, DB 마이그레이션, 서버 테스트 | 프론트 컴포넌트 스타일 |
docs/AGENTS.md |
문서 톤, 링크 규칙, 린트 | 제품 코드 테스트 명령 |
나쁜 구조는 이렇다.
AGENTS.md
- 전체 회사 규칙
- 프론트 규칙
- 백엔드 규칙
- 데이터 규칙
- 문서 규칙
- 배포 규칙
- 개인 취향 43개
- 예외 규칙 29개
좋은 구조는 이렇게 나뉜다.
AGENTS.md
frontend/AGENTS.md
backend/AGENTS.md
docs/AGENTS.md
scripts/AGENTS.md
Codex를 작업 디렉터리에 맞게 시작하면, 그 범위에 가까운 지시를 더 잘 활용할 수 있다.
핵심은 모든 지시를 한 문서에 넣는 게 아니라, 필요한 지시가 필요한 작업에만 들어오게 하는 것이다.
3. MCP 서버는 능력이고 동시에 컨텍스트 비용이다
MCP는 Codex를 훨씬 강하게 만든다.
OpenAI 문서 MCP, Context7, Figma, Playwright, Chrome DevTools, Sentry, GitHub 같은 서버를 붙이면 Codex가 외부 도구와 문서에 접근할 수 있다.
문제는 이 능력이 공짜가 아니라는 점이다.
OpenAI의 Codex MCP 문서는 MCP가 모델을 도구와 컨텍스트에 연결한다고 설명한다.
Pricing 문서에서는 MCP 서버를 많이 붙이면 메시지에 더 많은 컨텍스트가 들어가고 사용량을 더 쓴다고 안내한다.
즉 MCP는 “필요할 때 켜는 작업 장비”에 가깝다.
항상 켜두는 장식장이 아니다.
| 작업 | 켤 MCP | 꺼도 되는 MCP |
|---|---|---|
| OpenAI API 글 작성 | OpenAI Docs MCP | Figma, Sentry, 브라우저 자동화 |
| UI 버그 재현 | Playwright/Browser, Chrome DevTools | OpenAI Docs, Sentry |
| 디자인 구현 | Figma, Browser | GitHub 이슈, Sentry |
| 장애 로그 분석 | Sentry, GitHub | Figma, 문서 검색 |
| 단순 파일 수정 | 대부분 불필요 | 거의 전부 |
Codex에서 MCP 서버를 줄이는 기준은 단순하다.
이번 작업에서 실제로 도구 호출을 할 가능성이 30% 미만이면 꺼두는 편이 낫다.
“혹시 모르니까 켜두자”는 편하지만, 그 혹시가 매 요청마다 컨텍스트 비용으로 붙을 수 있다.
혹시 비용은 생각보다 성실하다.
매번 출근한다.
4. 모델 선택은 작업 난도보다 실패 비용으로 나눈다
OpenAI는 사용량을 오래 쓰는 방법으로 루틴 작업에는 GPT-5.4나 GPT-5.4-mini 같은 작은 모델로 전환하는 방법을 제시한다.
여기서 중요한 기준은 “어려워 보이냐”가 아니다.
실패했을 때 사람 시간이 얼마나 새느냐다.
| 작업 | 추천 모델 방향 | 이유 |
|---|---|---|
| 오탈자 수정 | GPT-5.4-mini | 고급 추론 불필요 |
| 단일 파일 스타일 수정 | GPT-5.4-mini 또는 GPT-5.4 | 범위가 좁음 |
| 테스트 메시지 해석 | GPT-5.4 | 맥락은 필요하지만 위험 낮음 |
| 여러 파일 리팩터링 | 큰 모델 | 실패 시 복구 비용 큼 |
| 보안/권한 설계 | 큰 모델 | 놓치면 위험 큼 |
| 애매한 버그 추적 | 큰 모델 | 가정과 반례 검토 필요 |
모든 작업을 가장 큰 모델로 돌리면 편하다.
하지만 Codex 사용량을 오래 가져가려면 큰 모델은 보험처럼 써야 한다.
작은 작업은 작은 모델, 실패 비용 큰 작업은 큰 모델.
이 기준이 잡히면 비용 절약이 감정싸움이 아니라 운영 규칙이 된다.
절약 우선순위 표
실제로는 아래 순서로 손대는 게 좋다.
| 순서 | 할 일 | 기대 효과 | 난이도 |
|---|---|---|---|
| 1 | 작업 프롬프트를 목표/범위/성공 기준으로 압축 | 즉시 효과 | 낮음 |
| 2 | 루트 AGENTS.md에서 특정 팀 규칙 빼기 | 반복 효과 큼 | 중간 |
| 3 | 작업별 MCP 프로필 만들기 | 컨텍스트 절약 | 중간 |
| 4 | 루틴 작업 모델을 GPT-5.4/mini로 내리기 | 메시지 한도 보존 | 낮음 |
| 5 | 긴 작업은 중간 요약 후 새 세션으로 분리 | 대화 누적 감소 | 중간 |
처음부터 완벽한 구조를 만들 필요는 없다.
오늘 당장 할 수 있는 것은 두 가지다.
AGENTS.md에서 “이번 작업과 상관없는 긴 설명”을 빼기.
MCP 서버 목록에서 오늘 안 쓸 서버를 끄기.
이 두 개만 해도 체감이 생길 수 있다.
AGENTS.md 경량화 체크리스트
AGENTS.md를 줄일 때는 규칙을 무작정 삭제하면 안 된다.
중요한 안전 규칙까지 날아가면 사용량은 아끼고 사고를 살 수 있다.
아주 가성비 나쁜 쇼핑이다.
아래 순서로 나누면 좋다.
| 체크 | 질문 | 처리 |
|---|---|---|
| 공통성 | 모든 작업에 필요한가 | 아니면 하위 폴더로 이동 |
| 빈도 | 매일 쓰는 규칙인가 | 드물면 문서 링크로 대체 |
| 길이 | 예시가 너무 긴가 | 짧은 예시 1개만 남김 |
| 중복 | 다른 문서와 반복되나 | 한 곳만 남김 |
| 안전 | 보안/데이터/삭제 금지선인가 | 루트에 유지 |
루트 AGENTS.md에 남길 만한 것은 이런 것들이다.
- 테스트와 린트 기본 명령
- 보안상 절대 하면 안 되는 일
- 파일 수정 원칙
- 사용자 변경을 되돌리지 말라는 규칙
- 프로젝트 전체에서 통하는 명명 규칙
하위 AGENTS.md로 내려야 할 것은 이런 것들이다.
- 특정 앱의 디자인 규칙
- 특정 서비스의 배포 절차
- 특정 폴더의 테스트 명령
- 특정 데이터셋 처리 방식
- 특정 팀의 말투나 문서 템플릿
MCP 서버 운영표
MCP 서버는 “많을수록 좋다”가 아니라 “작업에 맞을수록 좋다”다.
아래처럼 프로필을 나눠두면 편하다.
| 프로필 | 켜는 서버 | 쓰는 작업 |
|---|---|---|
| docs | OpenAI Docs, Context7 | API 문서 확인, 기술 글 작성 |
| browser | Browser/Playwright, Chrome DevTools | UI 확인, 스크린샷, 로컬 앱 테스트 |
| design | Figma, Browser | 디자인 구현, 컴포넌트 제작 |
| ops | Sentry, GitHub | 장애 로그, 이슈, PR 운영 |
| lean | 없음 또는 최소 | 단순 수정, 문서 정리, 리팩터링 준비 |
Codex 설정에서 MCP 서버는 config.toml에 둘 수 있고, 서버별로 enabled = false처럼 꺼둘 수 있다.
작업 전에 켜고 끄는 습관을 만들면 좋다.
MCP를 삭제할 필요는 없다.
자주 쓰는 장비는 창고에 두고, 오늘 쓸 장비만 작업대 위에 올리면 된다.
작업대가 넓어지면 손도 덜 꼬인다.
긴 작업에서는 세션을 나누는 것도 절약이다
Codex 장기 작업은 중간 대화가 계속 쌓인다.
처음에는 필요한 맥락이지만, 어느 순간부터는 짐이 된다.
이때는 새 세션으로 갈아타는 게 절약이 될 수 있다.
단, 그냥 새로 시작하면 맥락을 잃는다.
그래서 중간 요약을 남겨야 한다.
현재까지 완료:
- 파일 A 수정
- 테스트 B 통과
- 남은 문제 C
다음 세션 목표:
- C만 해결
- 파일 D/E는 건드리지 않기
- 검증 명령: npm test -- C
이런 요약은 긴 대화 전체보다 훨씬 싸다.
그리고 사람에게도 좋다.
AI만 컨텍스트 창이 있는 게 아니다.
사람 머리에도 창이 있고, 탭이 너무 많으면 팬이 돈다.
절약 전후 예시
아래는 같은 작업을 맡기는 두 방식이다.
| 항목 | 비싼 방식 | 가벼운 방식 |
|---|---|---|
| 프롬프트 | 프로젝트 역사와 전체 목표를 길게 설명 | 목표/범위/검증만 작성 |
| AGENTS.md | 루트에 모든 팀 규칙 포함 | 폴더별로 규칙 분리 |
| MCP | 모든 서버 상시 활성화 | docs 또는 browser 프로필만 사용 |
| 모델 | 항상 가장 큰 모델 | 루틴은 GPT-5.4-mini, 복잡한 작업만 상위 모델 |
| 세션 | 한 세션에 계속 누적 | 완료 단위로 요약 후 분리 |
절약은 품질을 낮추는 일이 아니다.
필요 없는 맥락을 제거해서 모델이 실제 문제에 집중하게 만드는 일이다.
잘 줄인 프롬프트는 인색한 프롬프트가 아니라 선명한 프롬프트다.
바로 적용할 10분 루틴
오늘 바로 할 수 있는 루틴은 아래 순서다.
| 시간 | 작업 |
|---|---|
| 1분 | 지금 켜진 MCP 서버 목록 확인 |
| 2분 | 오늘 안 쓸 서버 비활성화 |
| 3분 | 루트 AGENTS.md에서 특정 폴더 규칙 표시 |
| 2분 | 긴 예시나 중복 규칙을 하위 문서로 옮길 후보 표시 |
| 2분 | 자주 쓰는 작업 프롬프트 템플릿 3개 저장 |
프롬프트 템플릿은 이렇게 만들면 된다.
목표:
범위:
수정 금지:
성공 기준:
검증 명령:
이 다섯 줄은 생각보다 강하다.
Codex에게 필요한 건 장문의 사연이 아니라 작업의 경계다.
경계가 선명하면 결과도 덜 흔들린다.
결론
Codex에서 MCP 서버를 줄이면 사용량은 실제로 오래 갈 수 있다.
하지만 핵심은 MCP만이 아니다.
프롬프트, AGENTS.md, MCP, 모델 선택, 세션 분리까지 같이 봐야 한다.
OpenAI 공식 문서가 말하는 절약 팁도 결국 같은 방향이다.
불필요한 컨텍스트를 줄이고, 필요한 도구만 켜고, 루틴 작업은 작은 모델로 처리하라는 것이다.
Codex는 많이 연결할수록 강해진다.
하지만 많이 연결할수록 무거워질 수도 있다.
2026년에 Codex를 오래 쓰고 싶다면 새 요금제만 기다리지 말고, 내 작업 환경의 기본 컨텍스트부터 다이어트시키는 편이 빠르다.
AI도 가끔은 가볍게 출근해야 일을 오래 한다.
FAQ
MCP 서버를 많이 켜두면 왜 사용량이 줄어드나요?
OpenAI Codex 문서는 MCP 서버를 추가할수록 메시지에 더 많은 컨텍스트가 들어가고 사용량 한도를 더 쓸 수 있다고 안내합니다. 도구가 많아지면 Codex가 알아야 할 서버와 도구 설명도 늘어나기 때문입니다.
AGENTS.md를 줄이면 품질이 떨어지지 않나요?
중요한 공통 규칙을 삭제하면 품질이 떨어질 수 있습니다. 하지만 특정 폴더나 특정 팀에만 필요한 규칙을 하위 AGENTS.md로 옮기면, 필요한 작업에만 해당 규칙이 적용되어 컨텍스트를 더 효율적으로 쓸 수 있습니다.
GPT-5.4-mini만 쓰면 충분한가요?
아닙니다. 오탈자, 단일 파일 수정, 간단한 문서 정리 같은 루틴 작업에는 유리할 수 있지만, 여러 파일 리팩터링, 보안 설계, 애매한 버그 추적처럼 실패 비용이 큰 작업은 더 강한 모델을 쓰는 편이 낫습니다.
Codex 사용량 절약에서 제일 먼저 할 일은 무엇인가요?
작업 프롬프트를 목표, 범위, 수정 금지, 성공 기준, 검증 명령으로 압축하는 것입니다. 그다음 AGENTS.md와 MCP 서버를 정리하면 반복 효과가 커집니다.
MCP 서버는 삭제해야 하나요?
삭제보다 비활성화가 더 현실적입니다. OpenAI Codex MCP 문서에는 서버별 설정과 enabled 옵션이 안내되어 있습니다. 자주 쓰는 서버는 남겨두되, 작업별로 필요한 서버만 켜는 방식이 좋습니다.
관련 글
출처
- OpenAI Developers,
Codex pricing - What can I do to make my usage limits last longer?, 2026-04-25 확인 - OpenAI Developers,
AGENTS.md - Layer project instructions, 2026-04-25 확인 - OpenAI Developers,
Codex Model Context Protocol, 2026-04-25 확인
SNS 포스트
Codex 사용량이 빨리 줄어드는 이유가 꼭 모델 때문만은 아니다.
OpenAI 공식 문서 기준으로 줄일 수 있는 레버는 네 가지다.
- 프롬프트 크기 줄이기
- AGENTS.md 경량화
- 필요 없는 MCP 서버 끄기
- 루틴 작업은 GPT-5.4/GPT-5.4-mini로 내리기
MCP는 능력이다.
하지만 동시에 컨텍스트 비용이다.
이번 글에서는 Codex에서 MCP 서버와 AGENTS.md를 어떻게 운영해야 사용량을 오래 가져갈 수 있는지 표로 정리했다.