에이전트 실험 노트는 처음엔 대개 작다.
한 번 해본 설정, 한 번 실패한 프롬프트, 한 번 유용했던 hook, 한 번 막힌 권한 경계.
이걸 바로 팀 플레이북으로 올리고 싶어진다.
멋있게 정리하면 다들 편할 것 같고, 다음 사람도 쉽게 따라올 것 같기 때문이다.
근데 실전에서는 너무 빨리 승격시키면 플레이북이 아니라 문서 무덤이 된다.
내가 직접 굴려보니 실험 노트가 플레이북으로 바뀌어야 할 때는 따로 있다.
반복성, 재현성, 전파성, 관리비.
이 네 개를 같이 봐야 한다.
이 글은 그 경계선을 TECHTAEK 운영 기준으로 정리한 메모다.
Quick Answer
에이전트 실험 노트는반복해서 같은 문제가 나오고,재현이 가능하고,팀이 공유해야 할 가치가 생기고,유지보수할 사람이 있을 때플레이북으로 승격시켜야 한다.
반대로 한 번만 썼거나, 모델이나 버전 의존성이 너무 강하거나, 아직 결과가 흔들리면 메모로 두는 게 낫다.
이 글이 필요한 사람
- Claude Code나 다른 에이전트 실험 노트가 너무 많이 쌓인 사람
- 언제 메모를 playbook으로 바꿔야 할지 감이 없는 사람
- 실험 결과를 팀 문서로 승격했다가 오히려 문서만 무거워진 사람
- 개인 노트와 팀 문서의 경계가 흐릿한 사람
- 운영 경험을 자산으로 남기고 싶은 사람
지금 결론
- 한 번 해본 건 메모다.
- 같은 문제가 반복되면 플레이북 후보가 된다.
- 재현 가능하면 승격을 고려한다.
- 팀이 실제로 따라 써야 하면 더더욱 승격할 가치가 있다.
- 유지보수할 오너가 없으면 플레이북 승격은 미룬다.
한 줄로 줄이면 이거다.
재현되고, 반복되고, 전파할 가치가 있을 때만 승격한다.
메모와 플레이북은 뭐가 다른가
| 구분 | 실험 노트 | 플레이북 |
|---|---|---|
| 목적 | 해본 것 기록 | 같은 문제를 다시 풀기 위한 기준 |
| 수명 | 짧거나 중간 | 길다 |
| 변경 빈도 | 높다 | 낮다 |
| 독자 | 작성자 본인 | 팀 전체 |
| 관리비 | 낮다 | 중간~높다 |
| 적합한 내용 | 실패, 관찰, 가설 | 절차, 기준, 금지선, 예외 |
실험 노트는 살아있는 메모고, 플레이북은 운영 문서다.
여기서 자주 착각하는 건 실험 노트가 많아지면 자동으로 플레이북이 된다 는 생각이다.
그렇지 않다.
정리 안 된 실험 노트는 그냥 실험 노트가 많이 쌓인 상태다.
직접 운영해보니 승격 신호는 어디서 왔나
내가 느낀 승격 신호는 대체로 네 가지였다.
1. 같은 문제가 세 번째 이상 다시 나올 때
한 번은 우연이다.
두 번은 패턴일 수 있다.
세 번이면 기준이 필요하다.
예를 들면
- hooks 권한
- logs 보존선
- prompt 길이
- 하니스 timeout
이런 건 한 번 겪고 끝나는 게 아니었다.
반복되기 시작하면 메모를 다시 읽는 것보다 플레이북으로 박아두는 게 싸다.
2. 다른 사람이 물어보기 시작할 때
실험 노트는 보통 작성자만 알아먹는다.
그런데 팀원이 이거 어디에 적혀 있어? 라고 묻기 시작하면 이미 문서 승격 후보다.
사람이 물어본다는 건 그게 개인 취향이 아니라 운영 지식이 됐다는 뜻이니까.
3. 실패 비용이 커질 때
실험 노트는 가볍게 써도 되지만, 실패 비용이 큰 패턴은 다르다.
- 배포
- 시크릿
- 권한
- 자동화 재실행
- 데이터 훼손
이런 건 메모로만 두면 안 된다.
같은 실수를 반복했을 때 비용이 커지기 때문이다.
4. 표현이 안정될 때
실험 결과가 아직 흔들리면 플레이북으로 쓰기 어렵다.
문장 하나만 바뀌어도 결과가 달라진다면 아직은 메모 단계다.
반대로 결과가 어느 정도 안정되면 팀 문서로 승격할 때다.
언제는 승격시키지 말아야 하나
1. 모델 버전 의존성이 너무 강할 때
특정 모델, 특정 버전, 특정 세팅에서만 먹히는 노하우는 플레이북보다 실험 노트에 가깝다.
2. 한 번만 필요한 경우
정말 한 번만 쓸 내용이면 굳이 운영 문서로 올릴 이유가 없다.
3. 작성자가 유지할 수 없을 때
플레이북은 결국 유지보수 문서다.
고쳐야 하는데 아무도 안 고치면 그게 제일 위험하다.
4. 범위가 너무 넓을 때
실험 노트 하나에 분류, 실행, 로그, 위키, 배포까지 다 담기 시작하면 승격이 아니라 비대화다.
직접 겪은 관리비
플레이북 승격은 멋있지만 공짜가 아니다.
관리비는 이런 식으로 생긴다.
- 업데이트 책임이 생긴다
- 예외를 적어야 한다
- 최신성과 canonical을 구분해야 한다
- 팀원이 오히려 문서를 더 의존하게 된다
그래서 승격은 늘 좋아 보여서 가 아니라 운영상 필요해서 해야 한다.
문서가 많아지는 순간부터 문서는 자산이면서 부채다.
실전 승격 체크리스트
아래 네 개 중 세 개 이상이면 플레이북 승격 후보다.
- 세 번 이상 다시 나왔나
- 다른 팀원이 봐도 바로 쓸 수 있나
- 실패 비용이 큰가
- 표현과 절차가 안정적인가
- 유지보수할 오너가 있는가
이 체크리스트를 통과하면 메모보다 플레이북이 낫다.
통과 못 하면 아직 메모로 두는 게 맞다.
실수 TOP 5
1. 실험 결과가 아직 흔들리는데 바로 승격하는 것
문서만 무거워진다.
2. 한 번 성공한 결과를 규칙처럼 적는 것
재현이 안 되면 기준이 아니다.
3. 팀 문서인데 개인 메모 톤으로 쓰는 것
다른 사람이 못 읽는다.
4. 예외를 안 적는 것
운영 문서는 예외가 없으면 금방 현실과 멀어진다.
5. 유지보수 오너를 안 정하는 것
플레이북은 결국 살아 있어야 한다.
FAQ
실험 노트와 플레이북의 가장 큰 차이는 무엇인가
실험 노트는 해본 것, 플레이북은 다시 하게 만드는 것이다.
몇 번 반복돼야 승격할 만한가
보통 세 번째부터 기준화할 가치가 보인다.
플레이북은 길수록 좋은가
길이보다 재사용 가능성이 중요하다.
길어도 팀이 안 쓰면 소용없다.
팀이 작아도 이런 구분이 필요한가
작을수록 더 필요할 때가 많다.
문서가 섞이면 나중에 더 오래 걸리기 때문이다.
다음에 읽을 글
- Claude Code 자동화 용어 정리 2026 — Triage·Compound·LLM Wiki·Harness를 어디에 써야 안 겹칠까
- AI 코딩 에이전트 로그를 어디까지 남겨야 할까 2026 — prompt·diff·승인기록 보존선 정하기
- 에이전트 결과가 흔들릴 때 모델보다 먼저 볼 것 2026 — 프롬프트·루프·하니스 3층 디버깅 순서
마무리
실험 노트는 버리라고 만든 게 아니다.
그렇다고 전부 플레이북이 되는 것도 아니다.
승격 기준이 있어야 문서가 살아 남는다.
그 기준이 없으면 문서가 많아질수록 더 헷갈린다.
나중에 다시 봤을 때 이건 메모였지 혹은 이건 팀 규칙이지 가 바로 구분돼야 한다.
그 선을 잘 긋는 게 생각보다 큰 운영 능력이다.