프롬프트 엔지니어링이 AI 시대의 핵심 스킬이라고요?
틀렸습니다.
아니, 반만 맞습니다. 프롬프트는 AI에게 “뭘 해”라고 말하는 겁니다. 하네스는 AI가 “어떻게 살아갈지”를 설계하는 겁니다. 이 차이를 모르면 2026년 AI 시대에서 영원히 “쓰는 사람”으로 남습니다.
AI 하네스(Harness)란? AI 모델을 감싸서 장기 실행 작업을 안정적으로 관리하는 시스템이다. 모델이 엔진이라면 하네스는 완성된 자동차에 해당한다. 컨텍스트 관리, 도구 호출, 에러 복구, 세션 상태 유지를 담당하며, OpenAI는 이를 ‘Harness Engineering’이라는 이름으로 공식화했다.

I. AI를 “쓰는 사람”은 많습니다. “실행하는 사람”은 거의 없습니다.
ChatGPT 유료 결제합니다. Claude Pro 씁니다. Cursor 설치했습니다.
그래서요?
솔직히 저도 처음엔 이게 다인 줄 알았습니다. 좋은 프롬프트 쓰면 되는 거 아닌가? “역할을 줘라”, “맥락을 넣어라”, “예시를 보여줘라” — 이런 프롬프트 엔지니어링 팁을 열심히 모았습니다. 그런데 어느 순간 깨달았습니다. 진짜 차이는 거기서 나오는 게 아니었습니다.
Threads에서 본 한 문장이 머리를 때렸습니다.
“AI를 쓰는 사람과 AI를 실행하는 사람은 다릅니다. 진짜 차이는 하네스를 가진 사람에서 나옵니다.”
하네스? 그게 뭔데? 마구(馬具)? 등산 장비?
아닙니다. AI 세계에서 하네스는 모델을 갈아끼우고, 프롬프트를 구조화하고, 세션을 통제하고, 자동화로 연결하는 실행 레이어입니다. 모델 자체가 아니라, 모델을 운영하는 시스템 전체를 뜻합니다.
II. 왜 지금 하네스인가 — OpenAI가 증명한 것
2025년 8월, OpenAI 내부에서 실험이 시작됐습니다.
소수의 엔지니어가 Codex라는 AI 에이전트를 활용해서 프로젝트를 진행했습니다. 결과는 충격적이었습니다.
- 5개월 만에 100만 줄의 코드를 출하했습니다
- 인간이 직접 작성한 소스코드는 0줄이었습니다
- 애플리케이션 로직, 문서, CI 설정, 모니터링 셋업, 도구까지 전부 AI가 썼습니다
이걸 가능하게 한 게 바로 **하네스 엔지니어링(Harness Engineering)**입니다.
엔지니어들이 한 일은 코드를 타이핑하는 게 아니었습니다. 환경을 설계하고, 의도를 선언하고, AI에게 구조화된 피드백을 줬습니다. Codex 에이전트는 버그를 재현하고, 수정안을 제안하고, 검증까지 자율적으로 반복했습니다.
이게 프롬프트 엔지니어링으로 가능했을까요?
절대 아닙니다.
프롬프트는 한 번의 대화에서 좋은 답을 얻는 기술입니다. 하네스는 AI가 며칠, 몇 주에 걸쳐 일관되게 작업을 수행할 수 있는 시스템을 짓는 것입니다.
| 구분 | 프롬프트 엔지니어링 | 하네스 엔지니어링 |
|---|---|---|
| 초점 | “뭘 물어볼까” | “어떻게 일하게 할까” |
| 범위 | 단일 대화/세션 | 장기 프로젝트/멀티 세션 |
| 관리 대상 | 입력 텍스트 | 컨텍스트 + 도구 + 메모리 + 에러 |
| 인간의 역할 | 질문자 | 설계자/아키텍트 |
| 결과물 | 좋은 답변 | 자율 실행 시스템 |
III. 하네스의 4가지 핵심 요소 — 이걸 모르면 AI를 반만 쓰는 겁니다
저도 처음엔 하네스가 뭔지 감이 안 잡혔습니다. 그래서 실제로 제가 쓰는 환경 기준으로 분해해봤습니다.
1. 컨텍스트 관리 (Context Management)
AI 모델은 기본적으로 금붕어입니다. 대화가 길어지면 앞에서 한 얘기를 까먹습니다.
하네스는 이걸 해결합니다. 오래된 대화를 요약하고, 필요한 정보만 선택적으로 불러오고, AI가 항상 “지금 뭘 하고 있는지”를 알게 만듭니다.
저는 Claude Code에서 CLAUDE.md 파일을 만들어서 프로젝트의 규칙, 구조, 스타일 가이드를 넣어둡니다. 세션이 바뀌어도 AI가 맥락을 잃지 않습니다. 이게 바로 컨텍스트 관리의 실전입니다.
2. 도구 오케스트레이션 (Tool Orchestration)
AI가 “파일을 읽어라”, “웹을 검색해라”, “코드를 실행해라”고 할 때 — 실제로 실행하는 건 하네스입니다.
하네스가 AI의 도구 호출 요청을 가로채서, 권한을 확인하고, 안전한 환경에서 실행하고, 결과를 정제해서 돌려줍니다. AI 혼자서는 파일 하나 못 만듭니다. 하네스가 없으면요.
Cursor의 에이전트 모드가 터미널 명령을 실행하고, 멀티 파일을 수정하고, 에러를 잡아서 자동으로 고치는 것 — 다 하네스가 뒤에서 돌아가고 있기 때문입니다.
3. 에러 복구 (Error Recovery)
API 응답이 늦으면? 요청이 실패하면? 토큰이 초과하면?
프롬프트만으로는 대처할 수 없습니다. 하네스는 이런 상황을 감지하고, 재시도하고, 대안을 찾고, 필요하면 다른 모델로 전환합니다.
제가 블로그 파이프라인에서 writer가 실패하면 재시도하고, reviewer가 3번 리젝하면 사용자에게 보고하는 로직을 넣어둔 것도 하네스의 일부입니다.
4. 상태 지속성 (State Persistence)
오늘 작업하다 멈추고, 내일 이어서 하는 것.
프롬프트로는 불가능합니다. 하네스가 에이전트의 진행 상황, 완료한 작업, 남은 할 일을 저장하고 복원합니다. 며칠에 걸친 프로젝트를 AI에게 맡길 수 있는 이유입니다.
IV. 실전 — 하네스를 가진 사람은 이렇게 일합니다
개인적으로 제가 구축해놓은 시스템을 예로 들어보겠습니다.
블로그 하나를 쓸 때 저는 이렇게 합니다:
- 리서처 에이전트가 웹을 검색하고 팩트를 수집합니다
- 라이터 에이전트가 리서치 패키지를 받아서 글을 씁니다
- 리뷰어 에이전트가 AI 냄새, 팩트 오류, 분량을 검증합니다
- 검증 실패하면 자동으로 수정 루프가 돌아갑니다
- 통과하면 썸네일 생성, SNS 포스트, 파일 저장까지 자동입니다
이 전체 흐름이 하네스입니다. 저는 “이 주제로 글 써줘”라고 한 마디만 합니다. 나머지는 시스템이 돌아갑니다.
프롬프트 엔지니어링만으로 이게 가능했을까요?
아무리 좋은 프롬프트를 써도, 리서치→작성→검증→발행이라는 워크플로우를 자동화하는 건 프롬프트의 영역이 아닙니다. 하네스의 영역입니다.
V. 대표적인 하네스 도구들 — 2026년 2월 현재
실행하는 사람들이 쓰는 도구는 이미 공개되어 있습니다.
| 도구 | 하네스 특징 | 주요 강점 |
|---|---|---|
| Claude Code | CLAUDE.md 퍼시스턴트 컨텍스트, 멀티 에이전트 스폰, Git 통합 | 대규모 코드베이스 이해, 아키텍처 변경 |
| Cursor | @Codebase 전체 프로젝트 인덱싱, 에이전트 모드, 멀티 모델 선택 | 복잡한 멀티 파일 작업, 자율 실행 |
| GitHub Copilot | IDE 딥 통합, PR 요약, 커스텀 지식 베이스 | 인라인 코드 완성, GitHub 생태계 |
| OpenAI Codex | Agent Harness 아키텍처, 선언적 프롬프트 | 대규모 자율 개발 (OpenAI 내부 검증) |
여기서 핵심은 “어떤 모델이 좋은가”가 아닙니다. **”어떤 하네스를 구축했는가”**입니다. 모델은 GPT든 Claude든 Gemini든 교체 가능합니다. 하네스는 교체 불가능합니다. 그게 여러분만의 경쟁력입니다.
VI. 내가 느낀 점 — 코드를 치던 손이 설계를 하기 시작했습니다
솔직히 무서웠습니다.
Andrej Karpathy가 “하네스를 만들어주는 아키텍처, Rules 등의 셋팅을 지속적으로 업데이트해야 한다”고 했을 때, 저는 이미 그렇게 하고 있었습니다. CLAUDE.md 만들고, .claude/rules/ 폴더에 규칙 넣고, 에이전트별로 역할을 나누고 있었습니다.
그런데 “이게 하네스였구나”라는 걸 깨닫는 순간, 뭔가가 정리됐습니다.
제가 하고 있던 건 코딩이 아니라 시스템 설계였던 거죠. 프롬프트를 잘 쓰는 게 아니라, AI가 자율적으로 돌아가는 실행 환경을 짓고 있었던 겁니다.
VII. 솔직한 마음 — 대부분이 이 변화를 무시하고 있습니다
불안합니다.
주변에서 “ChatGPT 유료 쓰면 충분하지 않아?” 하는 사람이 아직도 많습니다. 프롬프트 공유하면서 “이거 쓰면 완벽!” 하는 글이 바이럴 됩니다.
틀렸다고 비판하는 건 아닙니다. 좋은 프롬프트는 여전히 중요합니다. 하지만 프롬프트는 하네스의 일부일 뿐입니다. 전부가 아닙니다.
놀라운 건 이 사실을 아는 사람이 아직 적다는 겁니다. “하네스”라는 단어 자체를 모르는 개발자가 대부분입니다. 한국어 블로그에서 AI 하네스를 제대로 설명한 글은 2026년 2월 현재 거의 없습니다.
지금이 기회입니다.
VIII. 앞으로 할 것들 — 당신의 하네스를 만드는 5단계
지금 당장 시작할 수 있습니다.
Step 1: 퍼시스턴트 컨텍스트 파일 만들기
- Claude Code라면
CLAUDE.md, Cursor라면.cursorrules - 프로젝트의 규칙, 네이밍 컨벤션, 코드 스타일을 적습니다
- 이것만으로 AI의 일관성이 극적으로 올라갑니다
Step 2: 반복 작업을 워크플로우로 정의하기
- “코드 리뷰해줘”를 매번 프롬프트로 치지 마세요
- 워크플로우 파일로 만들어서 한 번 호출로 실행하세요
- 저는
/review,/debug,/plan같은 슬래시 커맨드를 만들어 씁니다
Step 3: 에이전트 역할 분리하기
- 하나의 AI에게 모든 걸 시키지 마세요
- 리서처, 라이터, 리뷰어처럼 역할을 나누세요
- 각 역할에 맞는 규칙과 도구를 따로 설정하세요
Step 4: 에러 복구 로직 넣기
- 실패하면 어떻게 되는지를 미리 정해두세요
- 재시도 횟수, 폴백 전략, 사용자 보고 조건을 명시하세요
- “AI가 실패해도 시스템은 멈추지 않는다”가 목표입니다
Step 5: 결과를 기록하고 패턴을 추적하기
- 매 실행 결과를 로깅하세요
- 어떤 프롬프트가 효과적이었는지, 어떤 도입부를 최근에 썼는지
- 이 데이터가 쌓이면 하네스가 스스로 진화합니다
FAQ
Q1. AI 하네스란 정확히 무엇인가요?
AI 모델(LLM)을 감싸서 장기적으로 안정적인 작업을 수행하도록 관리하는 시스템입니다. 컨텍스트 관리, 도구 호출, 에러 복구, 상태 지속성을 포함합니다. 자동차에 비유하면 모델이 엔진, 하네스가 차체+조향+제동 시스템입니다.
Q2. 프롬프트 엔지니어링과 하네스 엔지니어링의 차이는?
프롬프트 엔지니어링은 “좋은 질문을 던지는 기술”이고, 하네스 엔지니어링은 “AI가 자율적으로 일할 수 있는 환경을 설계하는 기술”입니다. 프롬프트는 하네스의 일부입니다.
Q3. 하네스 엔지니어링은 개발자만 할 수 있나요?
아닙니다. CLAUDE.md 같은 컨텍스트 파일을 만들거나, 워크플로우를 정의하는 것부터가 하네스 엔지니어링의 시작입니다. 코딩 능력보다 시스템 사고가 더 중요합니다.
Q4. OpenAI의 Harness Engineering 실험 결과는?
2025년 8월부터 5개월간, 소수의 엔지니어가 Codex 에이전트로 약 100만 줄의 코드를 출하했으며, 인간이 직접 작성한 코드는 0줄이었습니다. 애플리케이션 로직, 문서, CI, 모니터링까지 전부 포함됩니다.
Q5. Claude Code, Cursor, Copilot 중 하네스 관점에서 가장 나은 도구는?
용도에 따라 다릅니다. Claude Code는 대규모 코드베이스 이해와 멀티 에이전트에, Cursor는 멀티 파일 자율 실행에, Copilot은 인라인 코드 생성과 GitHub 통합에 강점이 있습니다. 핵심은 도구가 아니라 하네스를 어떻게 구축하느냐입니다.
Q6. 지금 당장 하네스를 시작하려면?
퍼시스턴트 컨텍스트 파일(CLAUDE.md, .cursorrules 등)을 만드는 것부터 시작하세요. 프로젝트 규칙과 스타일을 적어두면 AI의 일관성이 극적으로 향상됩니다.
Q7. 하네스 없이 AI를 쓰면 어떤 문제가 생기나요?
매 세션마다 같은 맥락을 반복 설명해야 하고, 에러 대응이 수동이며, 장기 프로젝트에서 AI가 앞의 작업을 잊어버립니다. 결국 AI를 “쓰는” 수준을 벗어나지 못합니다.
결론 — 모델은 교체됩니다. 하네스는 남습니다.
GPT-5가 나와도 GPT-6가 나와도 모델은 계속 바뀝니다.
내 모델이 내일 바뀌면?
프롬프트 잘 쓰는 사람은 처음부터 다시 배웁니다. 하네스를 가진 사람은 모델만 갈아끼우면 됩니다. 컨텍스트 관리, 도구 오케스트레이션, 에러 복구, 상태 지속성 — 이 시스템은 모델에 종속되지 않습니다.
2026년, AI를 “쓰는 사람”은 많습니다. AI를 “실행하는 사람”은 아직 적습니다. AI를 “설계하는 사람” — 하네스를 가진 사람 — 은 거의 없습니다.
지금 시작하면, 당신이 그 “거의 없는 사람” 중 하나가 됩니다.
참고 자료
- OpenAI Harness Engineering — InfoQ
- AI Agent Harness Architecture — Medium
- [Andrej Karpathy의 Claude 코딩 경험 단상](file:///Users/jtpark/Library/Mobile%20Documents/iCloud~md~obsidian/Documents/obsi_import/02.Areas/blog/ai_llm/Andrej%20Karpathy의%20최근%20몇%20주간%20Claude%20코딩%20경험에%20대한%20단상2026-01-28T132901+0900.md)
- 원본 Threads 포스트 — @seolo_o