신규하 블로그

개발 기록 보관소

AI를 단순히 똑똑한 도구로 쓰는 단계를 넘어, 이제는 AI가 성과를 낼 수 있는 환경 을 설계하는 ‘하네스 엔지니어링(Harness Engineering)‘이 주목받고 있습니다. 단순히 프롬프트를 잘 던지는 것이 아니라, AI가 일하는 방식과 규칙, 검증 절차를 시스템화하는 것이 핵심입니다. 이 글은 아래 영상을 기반으로, 하네스 엔지니어링의 개념부터 사주 분석 앱을 만드는 실전 사례, 그리고 피터 드러커의 MBO(Management by Objectives)를 결합한 관리 관점의 AI 운영 전략을 정리한 가이드입니다. 영상: 하네스 엔지니어링 따라하기 (Harness Engineering Practice feat. Management) 채널: Ask Dori! Dori와 따라하는 IT 더보기

같은 모델에게 비슷한 수준의 일을 시켰는데 하나는 20분과 9달러만에 멈췄고, 다른 하나는 6시간과 200달러를 써서 실제로 플레이 가능한 결과물을 만들었다면 차이는 어디에서 생겼을까요? 이 영상의 핵심 주장은 모델 자체보다도 모델을 어떤 역할 구조와 검증 루프로 묶어 쓰느냐가 훨씬 큰 차이를 만든다는 데 있습니다. 영상은 이를 “하네스” 관점에서 설명합니다. 단일 에이전트에게 기획, 구현, 테스트, 자기평가를 모두 맡기면 실패 확률이 높아지고, 반대로 역할을 분리한 다중 에이전트 구조에 명확한 평가 기준과 도구를 붙이면 결과물의 품질이 급격히 올라간다는 이야기입니다. 더보기

하루에 터미널 창 20개를 열어놓고 각각의 Claude Code 세션이 뭘 하고 있는지 잊어버린 적 있는가? Paperclip은 바로 그 고통에서 출발한 오픈소스 AI 오케스트레이션 도구다. 출시 3주 만에 GitHub 스타 36,000개를 돌파했고, Nate Herk가 직접 대시보드 라이브 데모를 통해 어떻게 CEO·엔지니어·마케터 에이전트를 한 화면에서 지휘하는지를 공개했다. 더보기

Claude Code에서 “파일 편집 후 항상 Prettier를 실행해 줘"라고 프롬프트하면 어떻게 될까요? 가끔은 작동하지만, Claude가 잊거나 속도를 우선시하거나 변경이 “너무 작다"고 판단하면 건너뜁니다. Hooks 는 이 문제를 근본적으로 해결합니다. 모델의 동작과 관계없이 특정 시점에 셸 명령을 반드시 실행하는 결정론적 자동화 시스템입니다. 이 글은 Blake Crosley의 Claude Code CLI: The Definitive Technical Reference를 핵심 참고 자료로 활용하여, Hooks 시스템의 전체 구조와 실전 활용법을 정리합니다. 더보기

Claude Code를 쓰는 사람은 대부분 .claude/ 폴더가 있다는 사실은 압니다. 프로젝트 루트에 생기는 것도 봤고, 뭔가 중요한 설정이 들어 있을 것 같다는 감도 있습니다. 그런데 막상 열어 보지 않은 경우가 많습니다. Daily Dose of Data Science의 “Anatomy of the .claude/ Folder” 는 바로 이 지점을 파고듭니다. .claude/ 는 그냥 숨김 폴더가 아니라, Claude Code가 프로젝트 안에서 어떻게 행동할지를 결정하는 제어 센터 라는 것이 글의 출발점입니다. 더보기

대학생 한 명이 10일 만에 만든 AI가 GitHub 세계 1위를 찍었습니다. MiroFish라는 프로젝트입니다. 문서 하나를 넣으면 수천 명의 가상 인간을 만들어내고, 이 사람들이 서로 대화하고, 논쟁하고, 편을 바꾸면서 “앞으로 어떤 일이 벌어질지"를 시뮬레이션해줍니다. 과거에는 연구실 전체가 필요했던 시스템을, 22살 개발자 한 명이 만들어냈습니다. GitHub 스타 2만 4천 개, 포크 2,800개, X에서 83만 뷰. 더보기