“하네스 구성해줘” 한 마디면 도메인에 맞는 전문 에이전트 팀을 설계하고, 에이전트가 사용할 스킬까지 자동 생성해주는 메타 스킬이 공개됐다. 카카오 AI Native 전략 팀 리더 황민호 님이 개발한 Harness는 Claude Code의 에이전트 팀 시스템을 구조화된 방식으로 활용할 수 있도록 설계된 Claude Code 플러그인이다. 더보기

AI 에이전트가 브라우저를 다뤄야 할 때, 선택지는 여러 가지입니다. Playwright MCP, Claude Chrome Extension, Playwright Skill — 그리고 dev-browser. 벤치마크에서 dev-browser는 가장 빠르고, 가장 저렴하고, 가장 적은 턴으로 작업을 완료했습니다. 어떻게 이게 가능한지, 그리고 어떻게 쓰는지 살펴보겠습니다. 더보기

AI를 단순히 똑똑한 도구로 쓰는 단계를 넘어, 이제는 AI가 성과를 낼 수 있는 환경 을 설계하는 ‘하네스 엔지니어링(Harness Engineering)‘이 주목받고 있습니다. 단순히 프롬프트를 잘 던지는 것이 아니라, AI가 일하는 방식과 규칙, 검증 절차를 시스템화하는 것이 핵심입니다. 이 글은 아래 영상을 기반으로, 하네스 엔지니어링의 개념부터 사주 분석 앱을 만드는 실전 사례, 그리고 피터 드러커의 MBO(Management by Objectives)를 결합한 관리 관점의 AI 운영 전략을 정리한 가이드입니다. 영상: 하네스 엔지니어링 따라하기 (Harness Engineering Practice feat. Management) 채널: Ask Dori! Dori와 따라하는 IT 더보기

같은 모델에게 비슷한 수준의 일을 시켰는데 하나는 20분과 9달러만에 멈췄고, 다른 하나는 6시간과 200달러를 써서 실제로 플레이 가능한 결과물을 만들었다면 차이는 어디에서 생겼을까요? 이 영상의 핵심 주장은 모델 자체보다도 모델을 어떤 역할 구조와 검증 루프로 묶어 쓰느냐가 훨씬 큰 차이를 만든다는 데 있습니다. 영상은 이를 “하네스” 관점에서 설명합니다. 단일 에이전트에게 기획, 구현, 테스트, 자기평가를 모두 맡기면 실패 확률이 높아지고, 반대로 역할을 분리한 다중 에이전트 구조에 명확한 평가 기준과 도구를 붙이면 결과물의 품질이 급격히 올라간다는 이야기입니다. 더보기

대학생 한 명이 10일 만에 만든 AI가 GitHub 세계 1위를 찍었습니다. MiroFish라는 프로젝트입니다. 문서 하나를 넣으면 수천 명의 가상 인간을 만들어내고, 이 사람들이 서로 대화하고, 논쟁하고, 편을 바꾸면서 “앞으로 어떤 일이 벌어질지"를 시뮬레이션해줍니다. 과거에는 연구실 전체가 필요했던 시스템을, 22살 개발자 한 명이 만들어냈습니다. GitHub 스타 2만 4천 개, 포크 2,800개, X에서 83만 뷰. 더보기

Claude Code를 오래 쓰다 보면 메모리 파일이 뒤죽박죽이 됩니다. 오래된 메모와 새 메모가 모순되고, 없어진 파일을 가리키는 참조가 남아 있고, “어제"처럼 시간이 지나면 의미가 달라지는 표현도 그대로 남습니다. Auto Dream은 이 문제를 사람의 손 없이 자동으로 해결하는 Claude Code 내장 기능입니다. 바이브 코딩 중 우연히 발견된 이 기능은 Ray Amjad 채널에서 조회수 8.2만을 기록하며 빠르게 알려졌습니다. /memory 설정 한 번이면 됩니다. 더보기