거의 매일 Claude Code의 사용 방식을 바꾸는 새로운 오픈소스 프로젝트가 GitHub에 등장하고 있습니다. 노이즈를 걷어내고, Chase AI가 선별한 2026년 3월의 핵심 리포지토리 5개를 집중 분석합니다. 일부는 이미 들어봤겠지만, 몇 가지는 분명 놀랄 것입니다.

Sources


전체 지형도

flowchart TD
    CC[Claude Code] --> R1[Auto Research
Karpathy
⭐ 60k] CC --> R2[OpenSpace
HKU 데이터랩
⭐ 1.7k] CC --> R3[CLI Anything
HKU 데이터랩
⭐ 24k] CC --> R4[Claude Peers
세션 간 통신
⭐ 1k] CC --> R5[Google Workspace CLI
Google 개발자 제작
비공식] R1 --> F1[자동 자기개선 루프] R2 --> F2[스킬 자동 진화] R3 --> F3[소프트웨어 → CLI 변환] R4 --> F4[멀티 세션 협업] R5 --> F5[구글 생태계 연동] classDef repoStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef featStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef ccStyle fill:#fde8c0,stroke:#e6a817,color:#333 class CC ccStyle class R1,R2,R3,R4,R5 repoStyle class F1,F2,F3,F4,F5 featStyle

Repo 1: Auto Research — Karpathy의 자동 자기개선 루프

Auto Research는 Andrej Karpathy가 만든 리포지토리로, 출시 3주 만에 GitHub 스타 60,000개를 돌파했습니다. 한 마디로 **“머신러닝 알고리즘을 박스 안에 넣은 것”**입니다.

Claude Code를 특정 태스크에 연결하고, 자동으로 테스트를 반복 실행하며 자기 개선을 수행합니다. 점수가 올라가면 커밋, 내려가면 버립니다. 이 자동화된 시행착오를 통해 원하는 결과를 점진적으로 최적화합니다.

Shopify CEO의 실전 결과:

Toby(Shopify CEO)가 내부 모델에 Auto Research를 적용했습니다. 0.8B 파라미터의 소형 모델이었는데, 8시간 동안 37번의 실험을 자동으로 수행한 결과 19% 효율 향상을 달성했습니다.

머신러닝 30초 크래시 코스

Auto Research를 이해하려면 기본 ML 개념이 필요합니다.

flowchart TD
    A[문제 설정
예: 고양이 사진 인식] --> B[모델 실행] B --> C[점수 획득] C --> D{점수 개선?} D -->|✅ 개선됨| E[가중치/코드 업데이트
git commit] D -->|❌ 악화됨| F[변경사항 버림
git reset] E --> B F --> B classDef actionStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef goodStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef badStyle fill:#ffc8c4,stroke:#e05050,color:#333 class A,B,C actionStyle class E goodStyle class F badStyle

3개의 핵심 파일

Auto Research의 구조는 3개 파일로 이루어져 있습니다.

flowchart TD
    subgraph user["👤 사용자가 편집"]
        PM[problem.md
제약 조건 정의
목표 설명
무엇을 최적화할지] end subgraph claude["🤖 Claude Code가 편집"] TR[train.py
ML의 가중치 역할
루프마다 수정됨
개선 시 커밋] end subgraph karpathy["🔧 Karpathy가 구축 (건드리지 말 것)"] PR[prepare.py
기반 실행 코드
환경 준비
점수 측정 인프라] end PM --> Loop[Auto Research 루프] PR --> Loop Loop --> TR TR --> Loop classDef userStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef claudeStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef karpathyStyle fill:#fde8c0,stroke:#e6a817,color:#333 class PM userStyle class TR claudeStyle class PR karpathyStyle

언제 쓰고 언제 쓰지 말아야 하나

모든 태스크가 Auto Research에 적합하지는 않습니다. 이진(yes/no) 점수로 측정할 수 없는 것은 사용 불가입니다.

flowchart TD
    Q{점수를 이진값으로
측정할 수 있는가?} Q -->|❌ 불가| Bad[사용 부적합] Q -->|✅ 가능| Good[사용 적합] Bad --> B1[소셜 미디어 콘텐츠 품질] Bad --> B2[콜드 이메일 작성] Bad --> B3[창의적 글쓰기] Bad --> B4[주관적 판단 필요 작업] Good --> G1[Python 스크립트 실행 속도] Good --> G2[프롬프트 최적화] Good --> G3[스킬 패스/페일 테스트] Good --> G4[시스템 프롬프트 출력 형식 검증] classDef badStyle fill:#ffc8c4,stroke:#e05050,color:#333 classDef goodStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef questionStyle fill:#fde8c0,stroke:#e6a817,color:#333 class Bad,B1,B2,B3,B4 badStyle class Good,G1,G2,G3,G4 goodStyle class Q questionStyle

실제 성과: 첫 번째 예시에서 83번 실험, 15번 채택 개선이 이루어졌습니다. 모든 실험이 개선으로 이어지지 않는 것이 정상입니다.


Repo 2: OpenSpace — 스킬 자동 진화 시스템

OpenSpace는 HKU(홍콩대학교 데이터 인텔리전스 랩)가 만든 스킬 자동 개선·진화 시스템입니다. Lightra, Nanobot, Rag Anything, Deep Code 등을 만든 팀으로, 출시 4일 만에 GitHub 스타 1,700개를 돌파했습니다.

핵심 아이디어: MCP 서버가 스킬 사용 현황을 추적하고 품질 모니터링을 수행한 뒤, 자동으로 개선합니다.

3개 버킷 분류 시스템

flowchart TD
    Monitor[스킬 사용 모니터링] --> Score{성능 평가}
    Score --> Fix[autofix
🔴 작동 안 함
즉시 수정 필요] Score --> Improve[autoimprove
🟡 작동하지만
개선 여지 있음] Score --> Learn[autolearn
🟢 최적 상태
캡처 후 보존] Fix --> Repair[자동 수정 실행] Improve --> Enhance[자동 강화 실행] Learn --> Archive[지식 아카이빙] classDef monitorStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef fixStyle fill:#ffc8c4,stroke:#e05050,color:#333 classDef improveStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef learnStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 class Monitor,Score monitorStyle class Fix,Repair fixStyle class Improve,Enhance improveStyle class Learn,Archive learnStyle

성능 지표

테스트 결과는 인상적입니다.

지표 결과
토큰 절감 46% fewer tokens on real-world tasks
소득 증가 4.2배 higher income
가치 포착 73% value capture
품질 70% (vs 기준 40%)
테스트 규모 220개 실제 업무 × 44개 직종

자동 성장 데모: 초기 6개의 스킬에서 시작해 시스템이 자동으로 54개를 추가, 최종 60개 스킬로 성장했습니다.


Repo 3: CLI Anything — 모든 것을 CLI로

CLI Anything도 HKU 데이터랩이 만들었으며, 2026년 3월 초 출시 후 GitHub 스타 24,000개를 기록했습니다. Claude Code 생태계에서 MCP에서 CLI로의 전환 트렌드에 올라탄 도구입니다.

핵심 기능: 오픈소스 프로젝트를 가리키면 자동으로 CLI 도구로 변환해줍니다.

flowchart TD
    A[오픈소스 프로젝트 URL 입력] --> B[2줄 설치
plugin + tool] B --> C[단일 명령어 실행] C --> D[자동 파이프라인] D --> D1[코드 분석] D --> D2[테스트 실행] D --> D3[문서화] D --> D4[CLI 도구로 배포] D1 & D2 & D3 & D4 --> E[Claude Code에서 사용 가능한
CLI 도구 완성] E --> F[추가 정제 가능
첫 패스 부족 시] classDef inputStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef pipeStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef resultStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 class A,B,C inputStyle class D,D1,D2,D3,D4 pipeStyle class E,F resultStyle

검증된 소프트웨어: Blender, Audacity, OBS, Zoom, draw.io에 이미 적용 완료.

왜 중요한가: Claude Code가 상호작용할 수 없었던 소프트웨어들을 터미널로 제어 가능하게 만들어, 에이전트-소프트웨어 간격을 좁혀줍니다. 한 번 CLI를 만들면 계속 정제할 수 있고, 첫 패스에서 원하는 기능이 없으면 추가 기능을 붙일 수 있습니다.


Repo 4: Claude Peers — 세션 간 통신

Claude Peers는 지난주 출시된 신생 프로젝트로, GitHub 스타 1,000개를 넘었습니다. 핵심 아이디어: 여러 Claude Code 인스턴스가 서로를 발견하고 대화할 수 있게 합니다.

flowchart TD
    S1[세션 1
실행자 / 코드 작성] -->|MCP + SQLite| Bridge[(공유 브릿지
SQLite DB)] S2[세션 2
평가자 / 품질 검토] -->|MCP + SQLite| Bridge S3[세션 3
플래너 / 전략 수립] -->|MCP + SQLite| Bridge Bridge --> Sync[세션 시작 시
대화 요약 자동 공유] Sync --> S1 Sync --> S2 Sync --> S3 classDef sessionStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef bridgeStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef syncStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 class S1,S2,S3 sessionStyle class Bridge bridgeStyle class Sync syncStyle

Anthropic 멀티세션 Harness 아티클과의 연계

Anthropic이 3월 24일 발표한 아티클은 장기 실행 애플리케이션 개발을 위한 하네스 구조를 제안했습니다.

핵심 인사이트: Claude Code는 자신의 작업을 스스로 평가하는 데 취약합니다. 자기 작업에 과도하게 긍정적입니다. 특히 프론트엔드 디자인, 게임 개발 같은 복잡한 프로젝트에서 이 문제가 두드러집니다.

제안 솔루션:

flowchart TD
    Task[복잡한 프로젝트] --> Plan[세션 1: 플래너
전략 수립 & 분해] Plan --> Execute[세션 2: 실행자
코드 작성] Execute --> Evaluate[세션 3: 평가자
품질 검토] Evaluate -->|피드백| Execute Evaluate -->|승인| Done[완성] classDef planStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef execStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef evalStyle fill:#e0c8ef,stroke:#7b5ea7,color:#333 class Plan planStyle class Execute execStyle class Evaluate evalStyle

Claude Peers를 이 Harness 구조에 결합하면, 실행자 세션과 평가자 세션이 자동으로 통신하며 하네스가 거의 자동으로 구성됩니다.


Repo 5: Google Workspace CLI — 구글 전체 생태계 연동

Google Workspace CLI는 Google 개발자들이 직접 만들었지만 공식 Google 제품은 아닙니다. Claude Code에게 구글 전체 생태계에 대한 접근권을 부여합니다.

flowchart TD
    CC[Claude Code] --> GW[Google Workspace CLI]
    GW --> Gmail[Gmail
이메일 읽기/쓰기] GW --> Drive[Google Drive
파일 관리] GW --> Docs[Google Docs
문서 편집] GW --> Cal[Google Calendar
일정 관리] GW --> Other[기타 Google 서비스] subgraph sandbox["샌드박싱 전략 (권장)"] SB1[Drive만 접근] SB2[Docs만 접근] SB3[별도 이메일 + 공유 폴더] end GW --> sandbox classDef ccStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef gwStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef serviceStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef sandboxStyle fill:#e0c8ef,stroke:#7b5ea7,color:#333 class CC ccStyle class GW gwStyle class Gmail,Drive,Docs,Cal,Other serviceStyle class SB1,SB2,SB3 sandboxStyle

설치 전 권장 접근법: 모든 서비스를 한꺼번에 연결하지 말고, Claude Code에게 저장소를 클론하게 한 뒤 어떤 스킬이 자신에게 맞는지 먼저 파악한 후 필요한 것만 설치하세요.

프롬프트 인젝션 방어: Model Armor

Gmail 연동 시 가장 큰 우려는 프롬프트 인젝션입니다. Google의 Model Armor가 이를 해결합니다.

flowchart TD
    Email[수신 이메일] --> Armor[Google Model Armor
프롬프트 인젝션 스캐너] Armor --> Check{인젝션 감지?} Check -->|❌ 안전| CC[Claude Code에 전달] Check -->|⚠️ 의심| Flag[플래그 표시 후 전달] Check -->|🚨 위험| Block[완전 차단] classDef emailStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef armorStyle fill:#c5dcef,stroke:#4a90d9,color:#333 classDef safeStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 classDef flagStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef blockStyle fill:#ffc8c4,stroke:#e05050,color:#333 class Email emailStyle class Armor,Check armorStyle class CC safeStyle class Flag flagStyle class Block blockStyle

핵심 요약

# 리포지토리 제작사 스타 핵심 가치
1 Auto Research Karpathy ⭐ 60k 자동 자기개선 루프
2 OpenSpace HKU 데이터랩 ⭐ 1.7k 스킬 자동 진화 (46% 토큰 절감)
3 CLI Anything HKU 데이터랩 ⭐ 24k 소프트웨어 → CLI 변환
4 Claude Peers 커뮤니티 ⭐ 1k 멀티 세션 간 통신
5 Google Workspace CLI Google 개발자 구글 생태계 전체 연동
flowchart TD
    UseCase[내 사용 케이스] --> Q1{코드/알고리즘을
자동 최적화하고 싶다} UseCase --> Q2{스킬 품질을
자동 관리하고 싶다} UseCase --> Q3{특정 소프트웨어를
터미널에서 제어하고 싶다} UseCase --> Q4{여러 세션이
협력하길 원한다} UseCase --> Q5{구글 서비스와
통합하고 싶다} Q1 --> R1[Auto Research] Q2 --> R2[OpenSpace] Q3 --> R3[CLI Anything] Q4 --> R4[Claude Peers] Q5 --> R5[Google Workspace CLI] classDef qStyle fill:#fde8c0,stroke:#e6a817,color:#333 classDef rStyle fill:#c0ecd3,stroke:#3aaa6c,color:#333 class Q1,Q2,Q3,Q4,Q5 qStyle class R1,R2,R3,R4,R5 rStyle

결론

2026년 3월 한 달 동안 Claude Code 생태계는 폭발적으로 성장했습니다. Auto Research는 ML적 자기개선을 AI에 적용했고, OpenSpace는 스킬 자체를 진화시키며, CLI Anything은 소프트웨어 장벽을 허물고, Claude Peers는 멀티 에이전트 협업을 현실화했으며, Google Workspace CLI는 일상 생산성 도구를 연결합니다.

이 다섯 가지 중 하나라도 지금 당장 적용한다면, Claude Code는 지금과 완전히 다른 도구가 될 것입니다.