UltraCode는 비밀 모델이 아니라 요청 엔벨로프인가: UltraCode-Shim이 보여 준 Claude Code 하네스의 실체

Threads에서 화제가 된 요지는 꽤 도발적입니다. 클로드 코드의 UltraCode는 비밀 병기가 아니라, 사실상 드러난 요청 형태와 하네스 조합에 가깝다 는 주장입니다. 공개 카드에 붙은 이름은 UltraCode-Shim이고, 설명은 더 직접적입니다. Claude Code의 UltraCode deep-reasoning 모드를 “이미 돈을 내고 있는 아무 모델에나” 입힐 수 있다는 것입니다. 이 주장이 맞다면 핵심 경쟁력은 모델 이름보다도 요청을 어떻게 감싸고, 어떤 워크플로 하네스를 붙이고, 어떤 백엔드로 라우팅하느냐 로 이동합니다. Threads GitHub

이 글은 공개적으로 확인 가능한 범위만 씁니다. Threads 본문은 메타 설명과 카드 이미지에서 확인 가능한 문장만 사용했고, 구체 메커니즘은 OnlyTerp/UltraCode-Shim의 README와 docs/HOW_IT_WORKS.md를 기준으로 정리했습니다. 따라서 아래 내용은 Anthropic 내부 구현 전체를 단정하는 글이 아니라, 공개 저장소가 어떻게 UltraCode를 해석하고 재구성했는지에 대한 기술적 독해입니다. Threads HOW_IT_WORKS

Sources

1. Threads가 던진 메시지: “비장의 무기”라고 믿었던 것이 사실은 하네스일 수 있다

Threads 메타 설명에서 확인되는 핵심 문장은 이렇습니다. UltraCode는 Opus 4.8 출시와 함께 업데이트됐고, 어려운 문제를 만났을 때 켜는 “깊게 파고드는 모드”로 인식됐지만, 누군가 그것을 뜯어본 뒤 별것 아니라는 점을 밝혔고 심지어 다른 AI에 씌웠다는 것입니다. 카드 이미지는 그 대상이 UltraCode-Shim임을 명확히 보여 줍니다. Threads

즉 이 스레드의 핵심은 “Claude가 더 똑똑하다”가 아닙니다. 오히려 다음 질문에 가깝습니다.

UltraCode는 정말 별도 모델인가
아니면 기존 모델 호출 위에 얹는 요청 파라미터 세트인가
진짜 차별점은 모델보다 워크플로 하네스에 있는 것 아닌가

flowchart TD
    A["일반적 인식
UltraCode = 비밀 모델"] --> B["Threads 문제 제기
실은 뜯어보면 하네스"]
    B --> C["UltraCode-Shim 등장"]
    C --> D["Claude Code 요청 형태 재해석"]
    D --> E["다른 백엔드에도 비슷한 동작 부여"]

    classDef belief fill:#ffc8c4,stroke:#d9736a,color:#333,stroke-width:1px;
    classDef shift fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef build fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A belief;
    class B,C,D shift;
    class E build;

이 관점이 중요한 이유는, 최근 에이전트 도구 경쟁이 점점 누가 더 강한 모델을 붙였는가 보다 누가 더 강한 하네스를 설계했는가 로 이동하고 있기 때문입니다.

2. 저장소가 말하는 핵심: UltraCode는 “숨겨진 모델”이 아니라 요청 엔벨로프다

UltraCode-Shim README와 HOW_IT_WORKS.md는 이 프로젝트의 전제를 매우 분명하게 적습니다. 저장소 설명에 따르면 UltraCode는 API 경계에서 보면 별도 모델이 아니라, 일반 /v1/messages 요청에 추가되는 엔벨로프입니다. 문서가 열거하는 구성은 크게 네 가지입니다. effort=xhigh, adaptive thinking, 큰 max_tokens, 그리고 워크플로 품질을 유도하는 시스템 리마인더입니다. GitHub HOW_IT_WORKS

즉 저장소 저자의 주장은 이렇습니다.

UltraCode는 어떤 “신비한 별도 모델 이름”이 아니라
기존 메시지 API 요청을 특정 형태로 감싼 것이고
이 형태를 재현할 수 있다면
Anthropic Messages API와 호환되는 다른 백엔드에도 비슷한 실행 모드를 덧씌울 수 있다는 것입니다

flowchart TD
    A["기본 Claude Messages 요청"] --> B["effort = xhigh"]
    B --> C["adaptive thinking"]
    C --> D["large max_tokens"]
    D --> E["workflow 품질 reminder"]
    E --> F["UltraCode 스타일 요청 엔벨로프"]

    classDef base fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef add fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef result fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A base;
    class B,C,D,E add;
    class F result;

물론 이것이 곧 “원본 UltraCode와 완전히 동일하다”는 뜻은 아닙니다. 하지만 적어도 공개 저장소가 보여 주는 바는 분명합니다. 사용자가 체감하는 깊은 추론 모드의 상당 부분은 모델명 자체보다 요청 모양과 하네스 정책에서 나온다 는 해석이 가능해집니다.

3. 그래서 Shim은 무엇을 하나: Claude Code 앞단에 로컬 프록시를 둔다

이 프로젝트의 구현은 의외로 소박합니다. 문서에 따르면 핵심은 proxy.py입니다. Claude Code가 직접 Anthropic API로 가는 대신, 먼저 로컬 루프백 프록시를 보게 만들고, 이 프록시가 요청을 가로채 다음 일을 합니다. HOW_IT_WORKS

POST /v1/messages 요청에 UltraCode 스타일 엔벨로프를 강제로 덧씌운다
GET /v1/models 응답을 합성해서 사용자가 설정한 모델들을 /model 메뉴에 보이게 만든다
사용자가 선택한 모델 ID를 실제 백엔드 라우트로 매핑해 보낸다

즉 사용자는 Claude Code의 UI를 그대로 쓰지만, 뒤에서는 실제 모델 공급자가 바뀔 수 있습니다.

flowchart TD
    A["Claude Code /model"] --> B["로컬 loopback proxy"]
    B --> C["요청 엔벨로프 강제"]
    B --> D["가짜가 아닌 합성 model list 제공"]
    B --> E["선택된 model id를 실제 backend로 라우팅"]
    C --> F["Anthropic 호환 backend"]
    D --> F
    E --> F

    classDef ui fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef proxy fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef backend fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A ui;
    class B,C,D,E proxy;
    class F backend;

이 구조가 의미하는 바는 큽니다. Claude Code가 제공하는 사용성, 명령, 세션 UX는 유지하면서도, 실제 추론 비용과 모델 선택권은 바깥 계층에서 다시 잡을 수 있기 때문입니다.

4. `/model` 메뉴가 핵심인 이유: “선택 인터페이스”와 “실제 실행 모델”을 분리한다

README는 이 프로젝트가 /model 메뉴를 아주 적극적으로 활용한다고 설명합니다. 사용자가 보는 모델 이름은 Claude Code가 허용하는 형식으로 노출되지만, 그 ID는 실제로는 config.json에 정의된 다른 백엔드로 라우팅됩니다. 문서는 특히 model id가 claude 또는 anthropic 접두사를 가져야 Claude Code의 필터를 통과한다고 적습니다. GitHub HOW_IT_WORKS

이 지점이 흥미로운 이유는, 많은 사용자가 /model을 “실제 모델 직접 선택기”라고 생각하지만, 이 저장소는 그것을 프록시가 해석하는 가상 슬롯 처럼 사용하기 때문입니다.

flowchart TD
    A["/model 에 보이는 이름
claude-mimo / claude-openrouter ..."] --> B["Claude Code가 허용하는 형식"]
    B --> C["프록시의 routes 맵 조회"]
    C --> D["실제 backend endpoint 결정"]
    D --> E["OpenAI 호환 / Anthropic passthrough / Codex OAuth 등"]

    classDef visible fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef map fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef real fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A,B visible;
    class C,D map;
    class E real;

즉 사용자 경험은 Claude Code 안에 남겨 두고, 실질적 비용/공급자 제어권은 바깥 설정 파일로 뽑아낸 셈입니다.

5. 더 중요한 포인트: 이 프로젝트는 “모델 교체”보다 “하네스 이식”을 목표로 한다

README 첫 문장을 보면 이 저장소가 단순히 “Claude Code를 OpenAI로 연결한다”는 수준에 머물지 않는다는 점이 드러납니다. 프로젝트가 반복해서 강조하는 것은 full UltraCode harness 입니다. 즉 단지 API만 바꾸는 것이 아니라, 깊은 추론과 워크플로 fan-out을 유도하는 실행 맥락을 함께 실어 보내려는 것입니다. GitHub

이 때문에 이 프로젝트를 “모델 라우터”라고만 보면 반만 이해한 셈입니다. 더 정확히는:

요청 파라미터를 강제하고
모델 목록을 가상화하고
백엔드 프로토콜을 번역하고
동적 워크플로 호출까지 끝까지 사용자가 선택한 쪽으로 보내려는

하네스 프록시 에 가깝습니다.

flowchart TD
    A["단순 모델 라우터"] --> B["요청만 다른 endpoint로 보냄"]
    C["UltraCode-Shim"] --> D["요청 엔벨로프 강제"]
    D --> E["도구 호출 포맷 번역"]
    E --> F["workflow worker 라우팅"]
    F --> G["실패 복구까지 포함한 하네스"]

    classDef simple fill:#ffc8c4,stroke:#d9736a,color:#333,stroke-width:1px;
    classDef harness fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A,B simple;
    class C,D,E,F,G harness;

이건 최근 에이전트 도구들이 왜 “wrapper”보다 “runtime”이나 “harness”라는 말을 더 많이 쓰는지와도 맞닿아 있습니다.

6. 오케스트레이터와 워커를 분리하는 발상이 특히 중요하다

README와 HOW_IT_WORKS.md에서 가장 흥미로운 대목 중 하나는 orchestrator와 worker를 따로 잡는 2계층 구조입니다. 문서 설명에 따르면 Claude Code의 dynamic workflow는 실제 배후 트래픽에서 많은 sub-agent 작업을 stock model id로 보낼 수 있고, 이 때문에 사용자가 /model에서 뭘 골랐는지와 실제 청구 대상이 어긋날 수 있습니다. 이 프로젝트는 그 점을 문제로 보고, 메인 인터랙티브 루프와 백그라운드 worker 루프를 구조적으로 분리해 라우팅합니다. GitHub HOW_IT_WORKS

정리하면 이렇습니다.

오케스트레이터는 계획과 대화, 메인 루프를 담당한다
워커는 병렬 fan-out 작업과 서브에이전트 호출을 담당한다
둘을 같은 모델로 보낼 수도 있고
비싼 모델은 계획만, 싼 모델은 병렬 실행만 담당하게 할 수도 있다

flowchart TD
    A["User Prompt"] --> B["Orchestrator Model"]
    B --> C["Plan / Decide / Coordinate"]
    C --> D["Worker Model 1"]
    C --> E["Worker Model 2"]
    C --> F["Worker Model N"]
    D --> G["Sub-task Results"]
    E --> G
    F --> G
    G --> H["Final Synthesis"]

    classDef userTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef orchTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef workerTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A userTone;
    class B,C,H orchTone;
    class D,E,F,G workerTone;

이건 단순 비용 절감 테크닉이 아닙니다. 계획과 실행을 서로 다른 경제성 곡선에 얹는 하네스 설계 라는 점에서 훨씬 중요합니다.

7. 번역 계층도 핵심이다: Anthropic Messages ↔ OpenAI 호환 포맷

저장소는 여러 종류의 backend route를 설명합니다. Anthropic passthrough, OpenAI compatible translation, Codex OAuth, Cursor bridge 등이 그것입니다. 특히 openai_compat 경로에서 Anthropic request를 OpenAI Chat Completions로 바꾸고, 응답을 다시 Anthropic 스타일로 되돌린다고 밝힙니다. 도구 호출도 양방향으로 번역한다고 적습니다. HOW_IT_WORKS

이 말은 곧, 문제의 핵심이 단순 HTTP 프록시가 아니라는 뜻입니다. Claude Code는 자기 나름의 tool call 의미론과 스트리밍 기대치를 갖고 있고, 다른 백엔드는 또 다른 규약을 가질 수 있습니다. 따라서 실제 난점은 “요청 보내기”보다 행동 의미를 유지한 채 프로토콜을 왕복 변환하는 것 입니다.

flowchart TD
    A["Anthropic Messages 요청"] --> B["프록시 번역 계층"]
    B --> C["OpenAI Chat Completions"]
    C --> D["backend 응답"]
    D --> E["프록시 재번역"]
    E --> F["Anthropic 스타일 SSE / tool_use / tool_result"]

    classDef aTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef proxyTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef bTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A,F aTone;
    class B,E proxyTone;
    class C,D bTone;

에이전트 시대에 이런 번역 계층이 중요한 이유는, 앞으로 경쟁이 “어느 모델이 최고인가”에서 “어느 런타임이 어떤 모델들을 매끈하게 갈아 끼울 수 있는가”로 이동하기 때문입니다.

8. 신뢰성 설계가 들어간 점도 의미가 크다

README는 장시간 dynamic workflow에서 실제로 자주 만난 실패 유형을 기준으로 프록시를 강화했다고 설명합니다. 문서에 적힌 항목은 대략 네 가지입니다. 빈 응답 자동 재시도, 스트림 정지 타임아웃, 툴 거절 시 시퀀스 복구, 추론 중 dead air 방지입니다. GitHub HOW_IT_WORKS

이 포인트는 생각보다 중요합니다. 왜냐하면 하네스의 가치는 “한 번 멋지게 작동하는 데모”보다 40분짜리 자율 실행이 중간에 안 죽고 끝까지 가는가 에서 드러나기 때문입니다.

flowchart TD
    A["Long Workflow Run"] --> B["빈 응답"]
    A --> C["중간 스트림 정지"]
    A --> D["tool rejection mismatch"]
    A --> E["reasoning 중 무응답처럼 보임"]
    B --> F["auto retry"]
    C --> G["idle timeout 후 retry"]
    D --> H["tool sequence repair"]
    E --> I["keepalive 처리"]

    classDef problem fill:#ffc8c4,stroke:#d9736a,color:#333,stroke-width:1px;
    classDef fix fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A,B,C,D,E problem;
    class F,G,H,I fix;

즉 이 저장소는 “UltraCode를 흉내 냈다”는 수준을 넘어서, 장시간 에이전트 런타임에 필요한 운영적 내구성 을 별도 레이어로 보고 있습니다.

9. 이 프로젝트가 시사하는 진짜 변화: 경쟁 단위가 모델에서 하네스로 이동한다

이 저장소를 그대로 믿느냐와 별개로, 여기서 드러나는 시대 흐름은 꽤 분명합니다.

사용자는 Claude Code 같은 좋은 상위 UX를 원한다
하지만 비용과 공급자 선택권은 한 벤더에 묶이고 싶어 하지 않는다
따라서 중간에 프록시/하네스/라우터 계층이 생긴다
이 계층이 model discovery, request shaping, tool translation, reliability를 담당한다

즉 앞으로의 승부는 “누가 최고 모델을 가졌나” 하나만으로 끝나지 않습니다. 누가 더 좋은 에이전트 런타임을 설계했는가, 누가 더 싼 모델 조합으로 비슷한 작업 품질을 재현하는가 가 함께 중요해집니다.

flowchart TD
    A["과거 경쟁
더 강한 모델"] --> B["현재 경쟁
모델 + 하네스"]
    B --> C["request shaping"]
    B --> D["routing"]
    B --> E["tool translation"]
    B --> F["reliability"]
    B --> G["cost control"]

    classDef oldTone fill:#ffc8c4,stroke:#d9736a,color:#333,stroke-width:1px;
    classDef nowTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef partTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class A oldTone;
    class B nowTone;
    class C,D,E,F,G partTone;

이런 점에서 UltraCode-Shim은 단순한 “재밌는 해킹”이라기보다, 하네스 엔지니어링이 어디까지 제품 차별화 요소가 되었는지 보여 주는 사례 로 읽는 편이 더 정확합니다.

10. 다만 주의할 점도 있다: “비슷한 효과”와 “동일한 내부 동작”은 다르다

이 글에서 가장 조심해야 할 부분도 분명합니다. 공개 저장소 문서가 설명하는 것은 어디까지나 작성자가 관찰한 요청 형태와 그에 기반한 재구성입니다. 따라서:

원본 Claude Code 내부 구현이 앞으로 바뀔 수 있고
모든 workflow 동작이 완전히 동일하다고 보장할 수 없으며
특정 백엔드에서 추론 품질이나 tool semantics가 달라질 수 있고
“UltraCode-like” 경험과 “Anthropic 원본과 1:1 동일”은 같은 말이 아닙니다

즉 이 프로젝트의 가치는 “원본 복제 성공” 여부 하나가 아니라, 사용자가 체감하는 고급 에이전트 모드의 상당 부분이 외부 하네스로 재구성 가능하다는 점을 증명하려 한다 는 데 있습니다.

11. 부록: 각 실행 모드를 node·edge로 본 지도

지금까지 정리한 하네스 논의를 한 단계 더 시각화하면, Claude Code의 각 실행 모드는 결국 노드(작업 단위)와 엣지(흐름)의 조합 으로 환원됩니다. 같은 인터페이스 안에서도 일반 채팅, Skill, Subagent, Batch, Deep Research, Ultracode, /goal은 서로 다른 그래프 모양을 가지며, 이 그래프 모양 자체가 곧 하네스의 성격입니다. 단순 응답일수록 그래프는 선형이고, 깊은 추론·자율 실행일수록 루프와 fan-out이 등장합니다. 아래는 각 모드를 개별 그래프로 분리해 본 지도입니다.

일반 채팅

가장 단순한 선형 흐름입니다. 입력이 들어오면 곧장 답변으로 이어집니다.

flowchart TD
    User["User"] -->|"답변"| Answer["Answer"]

    classDef inputTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class User inputTone;
    class Answer outputTone;

Skill

작업 자체(Task)와 참조 지식(Skill)이 합류해 하나의 결과를 만듭니다. Skill은 실행을 대체하는 게 아니라 작업법을 보강하는 입력으로 들어옵니다.

flowchart TD
    Task["Task"] -->|"작업법"| Output["Output"]
    Skill["Skill"] -->|"참조"| Output

    classDef inputTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef refTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Task inputTone;
    class Skill refTone;
    class Output outputTone;

Subagent

메인이 작업을 갈래로 나눠 위임하고, 갈래의 결과를 다시 한 곳으로 모읍니다. fan-out 후 합류하는 기본형입니다.

flowchart TD
    Main["Main"] --> Front["Front"]
    Main --> Back["Back"]
    Front --> Collect["Collect"]
    Back --> Collect

    classDef mainTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef workTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Main mainTone;
    class Front,Back workTone;
    class Collect outputTone;

Batch

여러 작업이 각자의 에이전트로 병렬 분배되고, 결과가 한 번에 합쳐집니다. Subagent와 달리 입력 자체가 처음부터 복수입니다.

flowchart TD
    Task1["Task 1"] --> Agent1["Agent 1"]
    Task2["Task 2"] --> Agent2["Agent 2"]
    Agent1 --> Results["Results"]
    Agent2 --> Results

    classDef inputTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef workTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Task1,Task2 inputTone;
    class Agent1,Agent2 workTone;
    class Results outputTone;

Deep Research

계획 후 검색과 검증이 서로 오가는 루프가 핵심입니다. 검증이 부족하면 다시 검색으로 돌아가고, 충분해지면 보고서로 빠져나옵니다.

flowchart TD
    Plan["Plan"] --> Search["Search"]
    Search --> Verify["Verify"]
    Verify --> Search
    Search --> Report["Report"]

    classDef planTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef loopTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Plan planTone;
    class Search,Verify loopTone;
    class Report outputTone;

Ultracode

계획 후 빌드하면 반드시 리뷰를 거칩니다. 리뷰에서 수정이 필요하면(fix) 다시 계획(Replan)으로 돌아가 재빌드(again)하고, 통과하면 완료로 빠집니다. 빌드가 곧장 완료로 가지 않고 항상 리뷰 루프를 도는, 가장 깊은 하네스입니다.

flowchart TD
    Plan["Plan"] --> Build["Build"]
    Build --> Review["Review"]
    Review -->|"fix"| Replan["Replan"]
    Replan -->|"again"| Build
    Review --> Done["Done"]

    classDef planTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef loopTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef retryTone fill:#ffc8c4,stroke:#d9736a,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Plan planTone;
    class Build,Review loopTone;
    class Replan retryTone;
    class Done outputTone;

/goal

목표를 세우고 다음 단계로 나아갈 수 있으면(가능) 진행하며, 검사 결과 아직 미완이면(not yet) 다시 다음 단계로 돌아가고, 완료되면(done) 종료합니다. 목표 충족 여부가 루프의 종료 조건입니다.

flowchart TD
    Goal["Goal"] -->|"가능"| Next["Next"]
    Next --> Check["Check"]
    Check -->|"not yet"| Next
    Check -->|"done"| Complete["Complete"]

    classDef goalTone fill:#fde8c0,stroke:#c9a647,color:#333,stroke-width:1px;
    classDef loopTone fill:#c5dcef,stroke:#5b8db8,color:#333,stroke-width:1px;
    classDef outputTone fill:#c0ecd3,stroke:#5ca379,color:#333,stroke-width:1px;

    class Goal goalTone;
    class Next,Check loopTone;
    class Complete outputTone;

이 지도가 말하는 바는 분명합니다. 모드의 차이는 모델의 차이가 아니라 그래프 위상의 차이 입니다. 선형(일반 채팅)에서 fan-out(Subagent·Batch), 다시 루프(Deep Research·Ultracode·/goal)로 갈수록 하네스가 떠안는 제어 책임이 커지고, 이것이 곧 앞 절들에서 본 “경쟁 단위가 모델에서 하네스로 이동한다”는 흐름과 정확히 겹칩니다.

핵심 요약

Threads가 소개한 핵심 프로젝트는 OnlyTerp/UltraCode-Shim이다
이 저장소는 UltraCode를 숨겨진 모델이 아니라 요청 엔벨로프로 해석한다
핵심 요소는 xhigh effort, adaptive thinking, 큰 token budget, workflow reminder다
로컬 프록시가 /model discovery, request shaping, protocol translation, backend routing을 맡는다
특히 orchestrator와 worker를 분리해 계획 모델과 병렬 실행 모델을 따로 선택하게 한 점이 중요하다
이 사례는 에이전트 경쟁력이 모델 단독이 아니라 하네스 설계로 이동하고 있음을 보여 준다

결론

UltraCode-Shim이 흥미로운 이유는 “Claude의 기능을 베꼈다”는 자극적 문구 때문이 아닙니다. 더 본질적인 이유는, 우리가 비밀스러운 모델 성능이라고 믿었던 것들 중 일부가 사실은 요청 모양, 라우팅, 도구 번역, 워크플로 fan-out, 실패 복구 같은 하네스 계층의 산물일 수 있다 는 점을 공개적으로 보여 줬기 때문입니다. 앞으로 에이전트 툴을 볼 때는 모델 이름만 볼 것이 아니라, 그 뒤에 어떤 런타임과 하네스 가 붙어 있는지를 함께 봐야 합니다.