거의 매일 Claude Code의 사용 방식을 바꾸는 새로운 오픈소스 프로젝트가 GitHub에 등장하고 있습니다. 노이즈를 걷어내고, Chase AI가 선별한 2026년 3월의 핵심 리포지토리 5개를 집중 분석합니다. 일부는 이미 들어봤겠지만, 몇 가지는 분명 놀랄 것입니다.
Sources
전체 지형도
flowchart TD
CC[Claude Code] --> R1[Auto Research
Karpathy
⭐ 60k]
CC --> R2[OpenSpace
HKU 데이터랩
⭐ 1.7k]
CC --> R3[CLI Anything
HKU 데이터랩
⭐ 24k]
CC --> R4[Claude Peers
세션 간 통신
⭐ 1k]
CC --> R5[Google Workspace CLI
Google 개발자 제작
비공식]
R1 --> F1[자동 자기개선 루프]
R2 --> F2[스킬 자동 진화]
R3 --> F3[소프트웨어 → CLI 변환]
R4 --> F4[멀티 세션 협업]
R5 --> F5[구글 생태계 연동]
classDef repoStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef featStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef ccStyle fill:#fde8c0,stroke:#e6a817,color:#333
class CC ccStyle
class R1,R2,R3,R4,R5 repoStyle
class F1,F2,F3,F4,F5 featStyleRepo 1: Auto Research — Karpathy의 자동 자기개선 루프
Auto Research는 Andrej Karpathy가 만든 리포지토리로, 출시 3주 만에 GitHub 스타 60,000개를 돌파했습니다. 한 마디로 **“머신러닝 알고리즘을 박스 안에 넣은 것”**입니다.
Claude Code를 특정 태스크에 연결하고, 자동으로 테스트를 반복 실행하며 자기 개선을 수행합니다. 점수가 올라가면 커밋, 내려가면 버립니다. 이 자동화된 시행착오를 통해 원하는 결과를 점진적으로 최적화합니다.
Shopify CEO의 실전 결과:
Toby(Shopify CEO)가 내부 모델에 Auto Research를 적용했습니다. 0.8B 파라미터의 소형 모델이었는데, 8시간 동안 37번의 실험을 자동으로 수행한 결과 19% 효율 향상을 달성했습니다.
머신러닝 30초 크래시 코스
Auto Research를 이해하려면 기본 ML 개념이 필요합니다.
flowchart TD
A[문제 설정
예: 고양이 사진 인식] --> B[모델 실행]
B --> C[점수 획득]
C --> D{점수 개선?}
D -->|✅ 개선됨| E[가중치/코드 업데이트
git commit]
D -->|❌ 악화됨| F[변경사항 버림
git reset]
E --> B
F --> B
classDef actionStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef goodStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef badStyle fill:#ffc8c4,stroke:#e05050,color:#333
class A,B,C actionStyle
class E goodStyle
class F badStyle3개의 핵심 파일
Auto Research의 구조는 3개 파일로 이루어져 있습니다.
flowchart TD
subgraph user["👤 사용자가 편집"]
PM[problem.md
제약 조건 정의
목표 설명
무엇을 최적화할지]
end
subgraph claude["🤖 Claude Code가 편집"]
TR[train.py
ML의 가중치 역할
루프마다 수정됨
개선 시 커밋]
end
subgraph karpathy["🔧 Karpathy가 구축 (건드리지 말 것)"]
PR[prepare.py
기반 실행 코드
환경 준비
점수 측정 인프라]
end
PM --> Loop[Auto Research 루프]
PR --> Loop
Loop --> TR
TR --> Loop
classDef userStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef claudeStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef karpathyStyle fill:#fde8c0,stroke:#e6a817,color:#333
class PM userStyle
class TR claudeStyle
class PR karpathyStyle언제 쓰고 언제 쓰지 말아야 하나
모든 태스크가 Auto Research에 적합하지는 않습니다. 이진(yes/no) 점수로 측정할 수 없는 것은 사용 불가입니다.
flowchart TD
Q{점수를 이진값으로
측정할 수 있는가?}
Q -->|❌ 불가| Bad[사용 부적합]
Q -->|✅ 가능| Good[사용 적합]
Bad --> B1[소셜 미디어 콘텐츠 품질]
Bad --> B2[콜드 이메일 작성]
Bad --> B3[창의적 글쓰기]
Bad --> B4[주관적 판단 필요 작업]
Good --> G1[Python 스크립트 실행 속도]
Good --> G2[프롬프트 최적화]
Good --> G3[스킬 패스/페일 테스트]
Good --> G4[시스템 프롬프트 출력 형식 검증]
classDef badStyle fill:#ffc8c4,stroke:#e05050,color:#333
classDef goodStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef questionStyle fill:#fde8c0,stroke:#e6a817,color:#333
class Bad,B1,B2,B3,B4 badStyle
class Good,G1,G2,G3,G4 goodStyle
class Q questionStyle실제 성과: 첫 번째 예시에서 83번 실험, 15번 채택 개선이 이루어졌습니다. 모든 실험이 개선으로 이어지지 않는 것이 정상입니다.
Repo 2: OpenSpace — 스킬 자동 진화 시스템
OpenSpace는 HKU(홍콩대학교 데이터 인텔리전스 랩)가 만든 스킬 자동 개선·진화 시스템입니다. Lightra, Nanobot, Rag Anything, Deep Code 등을 만든 팀으로, 출시 4일 만에 GitHub 스타 1,700개를 돌파했습니다.
핵심 아이디어: MCP 서버가 스킬 사용 현황을 추적하고 품질 모니터링을 수행한 뒤, 자동으로 개선합니다.
3개 버킷 분류 시스템
flowchart TD
Monitor[스킬 사용 모니터링] --> Score{성능 평가}
Score --> Fix[autofix
🔴 작동 안 함
즉시 수정 필요]
Score --> Improve[autoimprove
🟡 작동하지만
개선 여지 있음]
Score --> Learn[autolearn
🟢 최적 상태
캡처 후 보존]
Fix --> Repair[자동 수정 실행]
Improve --> Enhance[자동 강화 실행]
Learn --> Archive[지식 아카이빙]
classDef monitorStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef fixStyle fill:#ffc8c4,stroke:#e05050,color:#333
classDef improveStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef learnStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
class Monitor,Score monitorStyle
class Fix,Repair fixStyle
class Improve,Enhance improveStyle
class Learn,Archive learnStyle성능 지표
| 지표 | 결과 |
|---|---|
| 토큰 절감 | 46% fewer tokens on real-world tasks |
| 소득 증가 | 4.2배 higher income |
| 가치 포착 | 73% value capture |
| 품질 | 70% (vs 기준 40%) |
| 테스트 규모 | 220개 실제 업무 × 44개 직종 |
자동 성장 데모: 초기 6개의 스킬에서 시작해 시스템이 자동으로 54개를 추가, 최종 60개 스킬로 성장했습니다.
Repo 3: CLI Anything — 모든 것을 CLI로
CLI Anything도 HKU 데이터랩이 만들었으며, 2026년 3월 초 출시 후 GitHub 스타 24,000개를 기록했습니다. Claude Code 생태계에서 MCP에서 CLI로의 전환 트렌드에 올라탄 도구입니다.
핵심 기능: 오픈소스 프로젝트를 가리키면 자동으로 CLI 도구로 변환해줍니다.
flowchart TD
A[오픈소스 프로젝트 URL 입력] --> B[2줄 설치
plugin + tool]
B --> C[단일 명령어 실행]
C --> D[자동 파이프라인]
D --> D1[코드 분석]
D --> D2[테스트 실행]
D --> D3[문서화]
D --> D4[CLI 도구로 배포]
D1 & D2 & D3 & D4 --> E[Claude Code에서 사용 가능한
CLI 도구 완성]
E --> F[추가 정제 가능
첫 패스 부족 시]
classDef inputStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef pipeStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef resultStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
class A,B,C inputStyle
class D,D1,D2,D3,D4 pipeStyle
class E,F resultStyle검증된 소프트웨어: Blender, Audacity, OBS, Zoom, draw.io에 이미 적용 완료.
왜 중요한가: Claude Code가 상호작용할 수 없었던 소프트웨어들을 터미널로 제어 가능하게 만들어, 에이전트-소프트웨어 간격을 좁혀줍니다. 한 번 CLI를 만들면 계속 정제할 수 있고, 첫 패스에서 원하는 기능이 없으면 추가 기능을 붙일 수 있습니다.
Repo 4: Claude Peers — 세션 간 통신
Claude Peers는 지난주 출시된 신생 프로젝트로, GitHub 스타 1,000개를 넘었습니다. 핵심 아이디어: 여러 Claude Code 인스턴스가 서로를 발견하고 대화할 수 있게 합니다.
flowchart TD
S1[세션 1
실행자 / 코드 작성] -->|MCP + SQLite| Bridge[(공유 브릿지
SQLite DB)]
S2[세션 2
평가자 / 품질 검토] -->|MCP + SQLite| Bridge
S3[세션 3
플래너 / 전략 수립] -->|MCP + SQLite| Bridge
Bridge --> Sync[세션 시작 시
대화 요약 자동 공유]
Sync --> S1
Sync --> S2
Sync --> S3
classDef sessionStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef bridgeStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef syncStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
class S1,S2,S3 sessionStyle
class Bridge bridgeStyle
class Sync syncStyleAnthropic 멀티세션 Harness 아티클과의 연계
Anthropic이 3월 24일 발표한 아티클은 장기 실행 애플리케이션 개발을 위한 하네스 구조를 제안했습니다.
핵심 인사이트: Claude Code는 자신의 작업을 스스로 평가하는 데 취약합니다. 자기 작업에 과도하게 긍정적입니다. 특히 프론트엔드 디자인, 게임 개발 같은 복잡한 프로젝트에서 이 문제가 두드러집니다.
제안 솔루션:
flowchart TD
Task[복잡한 프로젝트] --> Plan[세션 1: 플래너
전략 수립 & 분해]
Plan --> Execute[세션 2: 실행자
코드 작성]
Execute --> Evaluate[세션 3: 평가자
품질 검토]
Evaluate -->|피드백| Execute
Evaluate -->|승인| Done[완성]
classDef planStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef execStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef evalStyle fill:#e0c8ef,stroke:#7b5ea7,color:#333
class Plan planStyle
class Execute execStyle
class Evaluate evalStyleClaude Peers를 이 Harness 구조에 결합하면, 실행자 세션과 평가자 세션이 자동으로 통신하며 하네스가 거의 자동으로 구성됩니다.
Repo 5: Google Workspace CLI — 구글 전체 생태계 연동
Google Workspace CLI는 Google 개발자들이 직접 만들었지만 공식 Google 제품은 아닙니다. Claude Code에게 구글 전체 생태계에 대한 접근권을 부여합니다.
flowchart TD
CC[Claude Code] --> GW[Google Workspace CLI]
GW --> Gmail[Gmail
이메일 읽기/쓰기]
GW --> Drive[Google Drive
파일 관리]
GW --> Docs[Google Docs
문서 편집]
GW --> Cal[Google Calendar
일정 관리]
GW --> Other[기타 Google 서비스]
subgraph sandbox["샌드박싱 전략 (권장)"]
SB1[Drive만 접근]
SB2[Docs만 접근]
SB3[별도 이메일 + 공유 폴더]
end
GW --> sandbox
classDef ccStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef gwStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef serviceStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef sandboxStyle fill:#e0c8ef,stroke:#7b5ea7,color:#333
class CC ccStyle
class GW gwStyle
class Gmail,Drive,Docs,Cal,Other serviceStyle
class SB1,SB2,SB3 sandboxStyle설치 전 권장 접근법: 모든 서비스를 한꺼번에 연결하지 말고, Claude Code에게 저장소를 클론하게 한 뒤 어떤 스킬이 자신에게 맞는지 먼저 파악한 후 필요한 것만 설치하세요.
프롬프트 인젝션 방어: Model Armor
Gmail 연동 시 가장 큰 우려는 프롬프트 인젝션입니다. Google의 Model Armor가 이를 해결합니다.
flowchart TD
Email[수신 이메일] --> Armor[Google Model Armor
프롬프트 인젝션 스캐너]
Armor --> Check{인젝션 감지?}
Check -->|❌ 안전| CC[Claude Code에 전달]
Check -->|⚠️ 의심| Flag[플래그 표시 후 전달]
Check -->|🚨 위험| Block[완전 차단]
classDef emailStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef armorStyle fill:#c5dcef,stroke:#4a90d9,color:#333
classDef safeStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
classDef flagStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef blockStyle fill:#ffc8c4,stroke:#e05050,color:#333
class Email emailStyle
class Armor,Check armorStyle
class CC safeStyle
class Flag flagStyle
class Block blockStyle핵심 요약
| # | 리포지토리 | 제작사 | 스타 | 핵심 가치 |
|---|---|---|---|---|
| 1 | Auto Research | Karpathy | ⭐ 60k | 자동 자기개선 루프 |
| 2 | OpenSpace | HKU 데이터랩 | ⭐ 1.7k | 스킬 자동 진화 (46% 토큰 절감) |
| 3 | CLI Anything | HKU 데이터랩 | ⭐ 24k | 소프트웨어 → CLI 변환 |
| 4 | Claude Peers | 커뮤니티 | ⭐ 1k | 멀티 세션 간 통신 |
| 5 | Google Workspace CLI | Google 개발자 | — | 구글 생태계 전체 연동 |
flowchart TD
UseCase[내 사용 케이스] --> Q1{코드/알고리즘을
자동 최적화하고 싶다}
UseCase --> Q2{스킬 품질을
자동 관리하고 싶다}
UseCase --> Q3{특정 소프트웨어를
터미널에서 제어하고 싶다}
UseCase --> Q4{여러 세션이
협력하길 원한다}
UseCase --> Q5{구글 서비스와
통합하고 싶다}
Q1 --> R1[Auto Research]
Q2 --> R2[OpenSpace]
Q3 --> R3[CLI Anything]
Q4 --> R4[Claude Peers]
Q5 --> R5[Google Workspace CLI]
classDef qStyle fill:#fde8c0,stroke:#e6a817,color:#333
classDef rStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333
class Q1,Q2,Q3,Q4,Q5 qStyle
class R1,R2,R3,R4,R5 rStyle결론
2026년 3월 한 달 동안 Claude Code 생태계는 폭발적으로 성장했습니다. Auto Research는 ML적 자기개선을 AI에 적용했고, OpenSpace는 스킬 자체를 진화시키며, CLI Anything은 소프트웨어 장벽을 허물고, Claude Peers는 멀티 에이전트 협업을 현실화했으며, Google Workspace CLI는 일상 생산성 도구를 연결합니다.
이 다섯 가지 중 하나라도 지금 당장 적용한다면, Claude Code는 지금과 완전히 다른 도구가 될 것입니다.