영상 링크
Claude Fable 5 공식 발표
Prompting Claude Fable 5
Claude Code /goal 문서
Parameter Golf
Continual Learning Bench
Claude Fable 5가 공개된 뒤 다시 커진 말이 있습니다. “프롬프트를 잘 쓰는 것"보다 “루프를 설계하는 것"이 더 중요하다 는 주장입니다. 이 영상이 좋은 이유는 이 말을 추상적인 유행어로 다루지 않고, 최소 단위를 아주 명확하게 잘라 보여 주기 때문입니다. 루프의 핵심은 거대한 멀티에이전트 시스템이 아니라, 작업을 던지고, 검증하고, 실패하면 다시 시도하는 구조 입니다. 영상 3:50
이번 글은 이 영상을 바탕으로, 왜 Fable 5가 이런 루프에 특히 잘 맞는지, 그리고 왜 이제는 프롬프트 문장보다 종료 조건과 검증 조건 이 더 중요해졌는지를 정리합니다.
1. 이 영상이 말하는 루프의 최소 단위는 네 칸이면 끝난다
영상 설명란의 타임스탬프를 보면 발표자가 루프의 기본 구조를 아주 직설적으로 요약합니다. 바로 작업, 검증, 실패, 재시도 입니다. 영상 3:50
flowchart TD
A["작업 요청
Task"] --> B["결과 생성
Produce"]
B --> C["독립 검증
Verify"]
C -->|통과| D["종료
Done"]
C -->|실패| E["원인 기록
Failure Signal"]
E --> F["재시도
Retry"]
F --> B
classDef input fill:#c5dcef,color:#333,stroke:#5b8db8,stroke-width:1px;
classDef work fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
classDef check fill:#fde8c0,color:#333,stroke:#c89d42,stroke-width:1px;
classDef fail fill:#ffc8c4,color:#333,stroke:#c46b6b,stroke-width:1px;
classDef doneTone fill:#e0c8ef,color:#333,stroke:#8b6fb3,stroke-width:1px;
class A input;
class B,F work;
class C check;
class E fail;
class D doneTone;이 구조가 중요한 이유는, 프롬프트 엔지니어링의 관심사가 “처음 한 번에 잘 말하기"였다면, 루프 엔지니어링의 관심사는 “틀렸을 때 어떻게 다시 돌릴 것인가"로 옮겨가기 때문입니다. 즉 품질은 입력 문장 하나가 아니라 반복 구조 전체 에서 나옵니다.
2. 그래서 중요한 것은 프롬프트 문장보다 종료 조건이다
Claude Code의 /goal 문서는 이 흐름을 제품 기능으로 아주 명확히 설명합니다. /goal은 완료 조건을 설정하면 Claude가 여러 턴에 걸쳐 계속 일하고, 각 턴 뒤에 작은 빠른 모델이 조건이 충족됐는지 검사 합니다. 충족되지 않으면 사용자에게 제어를 넘기지 않고 다음 턴을 시작합니다. Claude Code /goal 문서
이 설명은 사실상 루프 엔지니어링의 제품화입니다.
flowchart TD
A["사용자 요청"] --> B["/goal로 종료 조건 설정"]
B --> C["Claude가 한 턴 수행"]
C --> D["작은 평가 모델이 목표 충족 여부 검사"]
D -->|미충족| E["다음 턴 자동 시작"]
E --> C
D -->|충족| F["목표 자동 해제"]
classDef input fill:#c5dcef,color:#333,stroke:#5b8db8,stroke-width:1px;
classDef work fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
classDef check fill:#fde8c0,color:#333,stroke:#c89d42,stroke-width:1px;
classDef doneTone fill:#e0c8ef,color:#333,stroke:#8b6fb3,stroke-width:1px;
class A,B input;
class C,E work;
class D check;
class F doneTone;여기서 진짜 중요한 건, 사용자가 더 이상 매 턴마다 “다음엔 이거 해”, “이제 테스트해”, “실패했으니 다시 고쳐"라고 직접 프롬프트하지 않아도 된다는 점입니다. 사람이 해야 하는 일은 점점 문장 작성자 가 아니라 완료 판정자 로 이동합니다.
즉 이제 좋은 지시는:
- 무엇을 만들지
- 무엇이 성공인지
- 언제 멈춰야 하는지
- 실패하면 무엇을 확인해야 하는지
를 정의하는 쪽으로 바뀝니다.
3. Fable 5가 이 구조에 특히 잘 맞는 이유는 “더 똑똑해서"보다 “더 오래, 더 검증적으로” 일하기 때문이다
Anthropic의 공식 Fable 5 문서를 보면, 이 모델의 핵심 차별점은 단순한 점수 상승보다 long-horizon autonomy 에 더 가깝습니다. 문서는 Fable 5가 장시간의 복잡한 작업에서 지시를 유지하며, 병렬 서브에이전트 위임과 장기 실행에서 더 안정적으로 동작한다고 설명합니다. Prompting Claude Fable 5
공식 문서 기준으로 특히 눈에 띄는 항목은 이렇습니다.
- 장기 자율 작업 유지
- 복잡한 문제의 첫 시도 정답률 상승
- 병렬 서브에이전트 위임 안정성 상승
- 메모리 시스템과의 궁합
- 장시간 실행 중 진행 상황을 실제 도구 결과로 검증하도록 유도하기 쉬움
flowchart TD
A["Claude Fable 5"] --> B["장기 자율 실행"]
A --> C["병렬 서브에이전트 위임"]
A --> D["진행 상황 근거 점검"]
A --> E["메모리 시스템 활용"]
A --> F["긴 컨텍스트 유지"]
classDef core fill:#c5dcef,color:#333,stroke:#5b8db8,stroke-width:1px;
classDef cap fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
class A core;
class B,C,D,E,F cap;특히 공식 가이드는 Fable 5에서 긴 턴이 기본값처럼 느껴질 수 있다 고 말합니다. 어려운 작업은 몇 분씩 걸릴 수 있고, 자율 실행은 몇 시간까지 이어질 수 있으니, 클라이언트 타임아웃과 진행 표시, 비동기 구조를 재설계하라고 권합니다. Prompting Claude Fable 5
이건 꽤 중요한 신호입니다. 예전에는 모델을 “빠르게 한 번 답하는 기계"로 봤다면, Fable 5는 점점 백그라운드에서 돌고 있는 작업자 처럼 다뤄야 한다는 뜻이기 때문입니다.
4. 검증자는 작성자와 분리될수록 좋아진다
영상은 중간에 독립 검증자 가 왜 중요한지도 짚습니다. 영상 8:24 이 지점은 Anthropic 공식 문서와도 맞닿아 있습니다. 문서는 장기 실행 프롬프트에서 self-verification을 명시적으로 넣고, fresh-context verifier subagents가 자기반성보다 더 잘 먹히는 경향이 있다 고 설명합니다. Prompting Claude Fable 5
즉 같은 모델이더라도:
- 하나는 만든다
- 다른 하나는 검사한다
- 실패 사유를 남긴다
- 다시 만든다
구조가 더 낫다는 뜻입니다.
flowchart TD
A["Producer
만드는 에이전트"] --> B["산출물"]
B --> C["Verifier
독립 검증자"]
C -->|통과| D["채택"]
C -->|실패| E["실패 사유 기록"]
E --> F["수정 지시"]
F --> A
classDef maker fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
classDef artifact fill:#c5dcef,color:#333,stroke:#5b8db8,stroke-width:1px;
classDef check fill:#fde8c0,color:#333,stroke:#c89d42,stroke-width:1px;
classDef fail fill:#ffc8c4,color:#333,stroke:#c46b6b,stroke-width:1px;
classDef doneTone fill:#e0c8ef,color:#333,stroke:#8b6fb3,stroke-width:1px;
class A,F maker;
class B artifact;
class C check;
class E fail;
class D doneTone;이 구조가 없으면 인간이 매번 리뷰어 역할을 떠맡게 됩니다. 결국 사람이 병목이 됩니다. 루프 엔지니어링은 이 사람 역할을 완전히 지우지는 못해도, 최소한 반복 가능한 검증 업무를 바깥으로 꺼내는 기술 이라고 볼 수 있습니다.
5. 메모리는 안쪽 루프보다 바깥 루프를 강하게 만든다
영상은 9분대에서 메모리까지 포함한 바깥 루프 를 언급합니다. 영상 9:21 이것도 Fable 5 공식 문서와 정확히 연결됩니다. 문서는 Fable 5가 이전 실행에서 배운 교훈을 기록하고 다시 참조할 때 특히 잘 작동하므로, 아주 단순한 Markdown 메모리 파일이라도 두라고 권합니다. 한 파일에 한 교훈, 중복 제거, 틀린 메모 삭제 같은 규칙까지 제시합니다. Prompting Claude Fable 5
여기서 포인트는 메모리가 채팅 기록 백업이 아니라는 점입니다. 메모리는:
- 실패한 시도
- 통과한 접근법
- 왜 통과했는지
- 다음번에 피해야 할 실수
를 남기는 루프의 축적물 입니다.
flowchart TD
A["실행 루프"] --> B["성공/실패 결과"]
B --> C["교훈 추출"]
C --> D["메모리 파일 갱신"]
D --> E["다음 실행의 초기 컨텍스트"]
E --> A
classDef work fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
classDef state fill:#c5dcef,color:#333,stroke:#5b8db8,stroke-width:1px;
classDef mem fill:#e0c8ef,color:#333,stroke:#8b6fb3,stroke-width:1px;
class A,B,C work;
class D,E mem;그래서 좋은 루프는 “이번 턴을 잘 돌리는 구조"일 뿐 아니라, 다음번 루프가 더 빨라지게 만드는 구조 여야 합니다.
6. 왜 Parameter Golf와 Continual Learning Bench가 같이 나오는가
영상 설명란은 참조 자료로 Parameter Golf와 Continual Learning Bench도 함께 달아 둡니다. 이것도 우연은 아닙니다.
Parameter Golf는 제한된 자원 안에서 더 나은 모델을 만드는 경쟁이고, Continual Learning Bench는 상태를 가진 시스템이 실제로 경험으로부터 나아지는지 보는 벤치마크입니다. Parameter Golf Continual Learning Bench
루프 엔지니어링이 중요한 이유도 결국 같습니다.
- 좋은 모델 하나만으로 끝나지 않고
- 실행 구조가 있어야 하며
- 실패 데이터를 다시 쓰는 상태가 있어야 하고
- 다음 시도에서 실제로 더 나아져야 하기 때문입니다
즉 모델 성능과 시스템 학습은 따로 보지 말고, 루프와 상태가 합쳐진 운영 구조 로 봐야 한다는 메시지에 가깝습니다.
7. 비용을 줄이는 핵심도 모델 교체보다 루프 설계일 수 있다
영상 후반은 Fable 5 비용 이야기도 다룹니다. 영상 18:05 여기서 포인트는 “비싼 모델이라 안 된다"가 아니라, 비싼 모델을 어디에만 쓰고 무엇을 검증자에게 넘길지 설계해야 한다 는 쪽입니다.
Anthropic 공식 문서도 비슷한 이야기를 합니다.
effort가 지능, 지연시간, 비용의 핵심 제어 변수다- routine work는 낮은 effort로도 충분할 수 있다
- 높은 effort는 검증 품질을 높이지만 과도한 계획과 과잉 정리를 부를 수 있다
- 기존 스킬과 하네스가 너무 장황하면 오히려 품질을 떨어뜨릴 수 있다
결국 비용 최적화의 핵심은:
- 종료 조건을 더 명확히 쓰고
- 검증을 분리하고
- 실패 사유를 저장하고
- 메모리로 재활용하고
- 높은 effort는 정말 필요한 구간에만 쓰는 것
입니다.
8. 이 영상이 던지는 진짜 질문은 “프롬프트를 버릴까?“가 아니다
이 영상의 핵심을 한 줄로 줄이면 이렇습니다.
프롬프트는 사라지지 않지만, 프롬프트의 무게중심은 입력 문장 자체에서 종료 조건과 검증 구조 쪽으로 이동하고 있다.
예전에는:
- 잘 써진 요청문
- 자세한 지시
- 단계별 코칭
이 중요했다면, 이제는:
- 무엇이 성공인가
- 누가 검증하는가
- 언제 멈출 것인가
- 실패를 어떻게 기록할 것인가
가 더 중요해집니다.
flowchart TD
A["프롬프트 중심 시대"] --> B["좋은 문장"]
A --> C["상세 지시"]
A --> D["턴 단위 개입"]
E["루프 중심 시대"] --> F["명확한 종료 조건"]
E --> G["독립 검증"]
E --> H["실패 신호 축적"]
E --> I["다음 실행에 재주입"]
classDef oldTone fill:#fde8c0,color:#333,stroke:#c89d42,stroke-width:1px;
classDef newTone fill:#c0ecd3,color:#333,stroke:#5ca379,stroke-width:1px;
class A,B,C,D oldTone;
class E,F,G,H,I newTone;Fable 5는 이 전환을 밀어 주는 모델이고, /goal은 이 전환을 제품 기능으로 보여 주는 사례입니다. 그래서 이 영상에서 중요한 건 “새 용어가 나왔다"가 아니라, 코딩 에이전트를 다루는 실제 인터페이스가 바뀌고 있다 는 점입니다.
정리
- 이 영상은 루프 엔지니어링을 작업·검증·실패·재시도 의 최소 구조로 설명합니다.
- Claude Code의
/goal은 이 구조를 제품 안에 넣은 대표 사례에 가깝습니다. - Claude Fable 5는 장기 자율 실행, 병렬 위임, 메모리 활용, 진행 검증 측면에서 이런 루프에 특히 잘 맞습니다.
- 앞으로 좋은 프롬프트보다 더 중요한 것은 좋은 종료 조건과 좋은 검증 구조 일 가능성이 큽니다.
결국 질문은 “어떤 문장을 쓸까?“보다 “어떤 루프를 돌릴까?” 로 바뀌고 있습니다. 그리고 그 루프가 길어질수록, 모델보다도 검증자와 메모리와 종료 조건 설계가 더 큰 차이를 만들게 됩니다.