스킬은 늘었는데 팀 속도는 안 오른다.
이럴 때 보통 사람은 두 가지 중 하나를 한다. 스킬을 더 만들거나, CLAUDE.md에 규칙을 더 붙인다. 그런데 진짜 병목은 대개 거기가 아니다. 운영 실수가 쌓여서 스킬은 많은데 팀 전체 루프는 느려지는 경우가 더 많다.
이 글은 “스킬을 어떻게 만들까”보다 한 단계 뒤를 본다. 이미 hooks, gotchas, SKILL.md, 팀별 handoff를 쓰고 있는데도 결과가 들쭉날쭉하다면, 아래 7가지부터 점검하는 게 빠르다.
먼저 읽으면 좋은 글
– Claude Code Skills 운영법 2026 — 폴더형 실행지식·gotchas·hooks로 스킬 품질 올리는 법
– ClawTeam 운영비 공개 2026 — git worktree·tmux·LLM 팀을 실제로 굴리면 어디서 비용 터지나
– Claude Cowork Dispatch 실전기 2026 — 폰에서 시키고 PC에서 끝내는 비동기 에이전트 루프
Quick Answer
Claude Code Skills를 많이 만든다고 팀 생산성이 바로 오르진 않는다. 실제로 속도를 올리는 건 언제 불릴지, 어디서 실패했는지, 누가 검증을 닫는지를 운영 규칙으로 박아두는 일이다.
내가 직접 굴려보니 생산성을 제일 많이 갉아먹는 건 아래 세 가지였다.
- 비슷한 스킬이 여러 개라 호출 조건이 흐린 상태
- hook이 반쯤만 붙어서 사람이 마지막 복구를 떠맡는 상태
- 운영 검증과 성과 검증이 안 나뉘어서 모두가 느려 보이는 상태
이 글이 필요한 사람
- Claude Code Skills를 이미 몇 개 이상 운영 중인데 결과가 들쭉날쭉한 사람
- SKILL.md, gotchas, hooks까지 붙였는데 팀 속도가 잘 안 오르는 사람
- 에이전트 팀에서 “누가 마지막으로 닫는지” 자꾸 흐려지는 사람
- 새 스킬을 더 만들기 전에 운영 실수를 먼저 줄이고 싶은 사람
지금 결론
결론은 단순하다.
- 스킬은 문서가 아니라 운영 단위로 봐야 한다
- 실패 패턴은 gotcha로 남겨야 한다
- 운영 검증과 성과 검증은 분리해야 한다
- 승자 글 확장처럼 이미 먹힌 패턴을 재활용해야 한다
특히 TECHTAEK처럼 워크플로우 글을 쓰는 채널에서는 “좋은 설명”보다 “직접 돌려보니 어디서 삐걱였는지”가 훨씬 중요하다.
한 줄 진단
스킬 개수가 아니라 스킬이 언제 불리고, 누가 검증하고, 실패가 어디에 쌓이는지가 생산성을 결정한다.
즉 문제는 보통 이런 식이다.
- 스킬은 있음
- hook도 있음
- gotcha도 있음
- 그런데 팀 전체가 같은 실수를 반복함
이건 도구 부족이 아니라 운영 설계 부족이다.
실수 1. 스킬 이름은 있는데 호출 조건이 흐리다
스킬이 많아질수록 제일 먼저 오는 문제가 “언제 이 스킬을 써야 하지?”다.
예를 들어 비슷한 역할의 스킬이 3개 있는데 경계가 애매하면, 모델은 매번 다른 걸 고른다. 그 결과는 뻔하다.
- 어떤 날은 잘 됨
- 어떤 날은 엉뚱한 스킬이 불림
- 어떤 날은 아예 스킬이 안 불림
체크 포인트
- 이 스킬은 어떤 질문에서 반드시 호출되어야 하는가
- 비슷한 스킬과의 경계가 한 문장으로 설명되는가
- SKILL.md 첫 부분에 trigger 조건이 명확한가
바로 고칠 것
이 스킬은 언제 쓰는가를 한 줄로 다시 쓴다- 겹치는 스킬은 합치거나, 카테고리를 더 좁힌다
- “좋을 때 쓰기”가 아니라 “이 요청이면 반드시 쓰기” 수준으로 규칙을 만든다
실수 2. Gotchas를 문서가 아니라 일기장처럼 안 쓴다
Gotchas는 스킬에서 제일 신호가 높은 자산이다. 그런데 많은 팀이 gotcha를 “초기에 대충 적어둔 경고문”처럼 취급한다.
진짜 운영에서는 반대로 가야 한다.
- 모델이 오늘 틀린 것
- 리뷰어가 오늘 잡은 것
- 발행 후 운영팀이 오늘 복구한 것
이게 바로 gotcha에 들어가야 한다.
나쁜 예
- “정확성을 확인하세요”
- “출력 형식을 지키세요”
이건 아무 도움이 안 된다.
좋은 예
published_url없으면 publish contract가 안 닫힘analysis_seed를 덮어쓰면 handoff가 끊김- 이모지 붙은 SNS 섹션은 strip 규칙에서 빠질 수 있음
바로 고칠 것
- 리뷰에서 잡힌 실수만 gotcha에 추가한다
- 추상 경고는 지우고, 재발한 패턴만 남긴다
- gotcha는 “모델이 실제로 틀린 것” 위주로 유지한다
실수 3. hooks를 붙였는데 사람이 마지막으로 수습한다
hook의 목적은 경고문을 예쁘게 쓰는 게 아니라, 실수를 구조적으로 막는 것이다.
그런데 종종 이런 상황이 생긴다.
- publish는 됨
- 텔레그램은 빠짐
- 시트는 늦게 반영됨
- followup은 사람이 다시 돌림
이건 hook이 있는 게 아니라, hook이 반쯤만 있는 거다.
체크 포인트
- 발행 성공 후 자동으로 닫혀야 하는 계약이 한 번에 묶여 있는가
- 후속 sync가 사람 손 없이 이어지는가
- 실패했을 때 어디서 멈췄는지 로그가 남는가
바로 고칠 것
publish success -> notify -> mark-published -> followup -> A2A를 한 계약으로 묶는다- 중간에 사람이 다시 누르는 단계가 남아 있으면 줄인다
- hook은 “권고”가 아니라 “실행 흐름”을 강제해야 한다
직접 겪은 실패
최근 실제 운영에서 제일 골치 아팠던 건 이거였다.
- 글은 발행됐는데 텔레그램 푸시가 빠짐
- 시트는
published인데 followup은 아직recommended로 남음 - handoff 메타가 지워져서 분석팀이 공을 못 받는 것처럼 보임
결국 문제는 모델이 멍청해서가 아니라, 발행 후 닫혀야 할 계약이 한 번에 묶여 있지 않았던 거였다. 이걸 publish contract로 묶고 나서야 사람이 뒤늦게 청소하는 시간이 줄었다.
실수 4. 스킬 문서가 길기만 하고 분해가 안 돼 있다
스킬이 길어질수록 정보는 많아지는데, 오히려 잘 안 불리기 시작한다. SKILL.md 하나에 다 넣으면 사람은 안심되지만 모델은 더 헷갈린다.
이런 증상이 보이면 위험하다
- 본문이 200줄 넘는데도 핵심 트리거가 안 보임
- 실행 순서보다 배경 설명이 더 길다
- references로 뺄 내용을 다 본문에 박아넣음
바로 고칠 것
- SKILL.md는 입구 역할만 하게 줄인다
- 상세 API, 사례, 에러 테이블은
references/로 분리한다 - “언제 쓰는가 / 어떻게 시작하는가 / 주의할 것”만 앞쪽에 둔다
요약하면, 긴 스킬보다 잘 분리된 스킬이 더 강하다.
실수 5. owner와 검증 책임이 없다
AI 팀이 여러 명처럼 굴러가기 시작하면, 제일 위험한 순간이 온다.
“누가 마지막으로 확인하지?”
이 질문에 답이 없으면, 시스템은 돌아가는 척하다가 꼭 중간에 샌다.
대표적인 증상
- 분석팀이 추천은 했는데 누가 닫는지 애매함
- 글감팀이 backlog는 넣었는데 drafting으로 안 넘어감
- 운영팀이 복구는 했는데 verified는 아무도 안 찍음
바로 고칠 것
- owner를 notes에 남긴다
help_team과next_check_at을 같이 남긴다- 완료 기준을
발행이 아니라검증까지로 바꾼다
팀이 많아질수록 “누가 했나”보다 “누가 닫나”가 더 중요하다.
실수 6. 운영 검증과 성과 검증을 한 덩어리로 본다
이건 실제로 가장 자주 삐걱이는 포인트다.
발행 직후 바로 확인 가능한 것과, 하루 뒤 봐야 하는 것을 섞어버리면 모든 팀이 느려 보인다.
운영 검증은 당일 볼 수 있다
- URL 반영
- 텔레그램 푸시
- 시트 동기화
- publish contract closure
- 내부링크/허브 링크 존재
성과 검증은 하루 뒤가 낫다
- Search Console 노출
- 초기 클릭
- GA4 유입
- 램프업 여부
바로 고칠 것
- 운영팀은
ops_verified - 분석팀은
performance_verified - 둘을 한 줄 status로 섞지 않는다
이걸 나누는 순간, 팀이 갑자기 게을러 보이던 문제가 많이 사라진다. 실은 늦은 게 아니라, 다른 종류의 검증이었기 때문이다.
언제 굳이 안 나눠도 되나
모든 글에 이 구조가 필요한 건 아니다.
- 혼자 쓰는 개인 메모 수준
- 후속 추적이 필요 없는 짧은 테스트 포스트
- 공개 발행이 아니라 내부 검증 초안
이런 경우엔 ops_verified와 performance_verified를 굳이 나눌 필요가 없다. 하지만 팀 단위로 반복 발행하는 순간부터는 거의 무조건 나누는 게 낫다.
실수 7. 승자 글 확장을 안 하고 새 글만 늘린다
팀 생산성이 안 오르는 또 하나의 이유는, 매번 0에서 시작하는 글만 만든다는 거다.
이미 반응이 온 글이 있으면 그 글 주변으로 후속편을 파는 게 훨씬 효율적이다.
예를 들면 이런 식이다.
- 기본 운영법 글
- 비용 공개 글
- 실패담 글
- 비교/체크리스트 글
이렇게 같은 허브에서 3~4편으로 분기하면, 새 글 하나 쓸 때마다 전체 허브 가치가 같이 오른다.
바로 고칠 것
- winner_expand는 항상 후보로 유지한다
- 새 글 3건이면 허브 확장 1건을 섞는다
- 성과가 붙은 글은 “다음 후속 제목”까지 같이 메모한다
바로 쓰는 운영 점검표
오늘 팀 생산성이 안 오른다고 느껴지면 이 순서대로 보면 된다.
- 스킬 호출 조건이 명확한가
- gotcha가 실제 실패 데이터로 갱신되고 있는가
- hook이 경고문이 아니라 실행 계약으로 묶여 있는가
- 문서가 과도하게 길어져서 trigger가 흐려지지 않았는가
- owner와 next_check_at이 남아 있는가
- 운영 검증과 성과 검증이 분리되어 있는가
- 승자 글 확장이 새 글 편성과 같이 돌고 있는가
이 7개 중 2개만 틀어져도 팀 생산성은 금방 내려간다.
실수 TOP 3
빨리 보면 이 세 개가 제일 치명적이다.
SKILL.md만 늘리고 호출 조건은 안 적는다- gotcha를 추상 경고문처럼 적고 실제 실패 로그를 안 남긴다
- 발행 후 검증을 한 덩어리로 묶어 모두를 느리게 만든다
이 셋만 잡아도 팀 체감 속도는 꽤 달라진다.
FAQ
Q1. 스킬은 몇 개쯤부터 관리가 어려워지나?
보통 10개를 넘기기 시작하면 호출 조건, owner, 중복 영역이 흐려지기 쉽다. 개수보다 중요한 건 경계가 한 줄로 설명되느냐다.
Q2. gotcha는 얼마나 자주 업데이트해야 하나?
이상적으로는 리뷰나 운영 복구가 있었던 날 바로 업데이트하는 게 제일 좋다. 상상으로 적는 gotcha보다 방금 틀린 패턴 하나가 훨씬 가치 있다.
Q3. hook만 잘 붙이면 운영 문서는 짧아져도 되나?
어느 정도는 맞다. 다만 hook은 실행 계약을 강제하는 역할이고, trigger/owner/next step 같은 운영 문구는 여전히 문서에 남아 있어야 한다.
Q4. TECHTAEK 글에서 제일 중요한 증거는 뭐야?
직접 써본 흔적이다. 무슨 구조로 붙였고, 어디서 실패했고, 시간이나 비용이 얼마나 들었는지 같은 운영 디테일이 제일 세다.
다음에 읽을 글
- Claude Code Skills 운영법 2026 — 폴더형 실행지식·gotchas·hooks로 스킬 품질 올리는 법
- ClawTeam 운영비 공개 2026 — git worktree·tmux·LLM 팀을 실제로 굴리면 어디서 비용 터지나
- Claude Cowork Dispatch 실전기 2026 — 폰에서 시키고 PC에서 끝내는 비동기 에이전트 루프
결론
Claude Code Skills 운영에서 생산성을 올리는 건 더 많은 스킬이 아니다. 실패를 기록하고, 호출 조건을 분명히 하고, 검증 단계를 나누고, 승자 글을 확장하는 운영 습관이다.
스킬은 도구고, 생산성은 운영에서 나온다.
그래서 스킬이 많아졌는데 팀 속도가 안 오른다면, 새 스킬 만들기 전에 이 질문부터 해야 한다.
“우린 지금 스킬을 만드는 팀인가, 아니면 스킬을 운영하는 팀인가?”
대개 답은 후자여야 한다.