AI 에이전트에서 memory는 가장 쉽게 과장되는 기능 중 하나다.
모든 대화와 실패를 다 기억시키면 더 똑똑해질 것 같지만, 실제로는 반대일 때가 많다.
오래된 가정과 일회성 실패가 다음 작업을 오염시키기 때문이다.
그래서 중요한 건 “많은 기억”이 아니라
실패는 먼저 Run Ledger에 남기고, 반복 가능하고 검증된 사실만 Memory로 승격하는 절차다.
더보기
Anthropic의 Prompting 101 영상은 프롬프트를 “예쁘게 쓰는 문장 기술”로 설명하지 않는다.
핵심은 오히려 반대다.
좋은 프롬프트는 문장력이 아니라 구조라는 것이다.
특히 API 기반 애플리케이션에서는 대화를 여러 번 주고받기보다,
한 번의 메시지로 처음부터 맞는 답을 받는 single-shot 설계가 중요하다는 점을 아주 실전적으로 보여 준다.
더보기
ima2-gen을 한 줄로 설명하면 README 표현 그대로다.
ChatGPT/Codex 이미지 워크플로를 작은 데스크톱형 웹앱으로 옮긴 로컬 이미지 생성 스튜디오
이 프로젝트가 흥미로운 이유는 이미지 생성 모델 하나를 감싸는 CLI에 머물지 않고,
히스토리·브랜칭·배치·캔버스 편집까지 묶은 작업 환경으로 확장하려 하기 때문이다.
더보기
에이전트 런타임을 만들겠다고 하면 보통 바로 거대한 시스템이 떠오른다.
SQLite state agent scheduler multi-agent orchestrator memory graph permission engine 하지만 실제로는 그 전에 해야 할 일이 있다.
에이전트가 무엇을 해야 하고, 어디서 멈추고, 무엇을 남겨야 하는지 문서로 먼저 분리하는 것이다.
더보기
이 Threads의 핵심은 과장된 광고가 아니다.
Claude가 코드 리뷰에서 “정말 깔끔하네요!”만 반복하는 문제를, 5KB짜리 CLAUDE.md 하나로 줄이려는 시도
다.
중요한 건 이걸 “비밀 프롬프트”로 보지 않는 것이다.
이 프로젝트는 오히려 RLHF가 낳은 sycophancy를 프로젝트 레벨 페르소나로 덮어쓰는 작은 패치에 가깝다.
더보기
Context Mode의 README 첫 문장은 꽤 정확하다.
The other half of the context problem.
많은 사람이 컨텍스트 문제를 “긴 대화”로만 생각하지만, 이 프로젝트는 다른 절반을 찌른다.
도구 출력이 너무 크고 그 출력이 문맥창을 오염시키고 압축 이후에는 에이전트가 무엇을 하던 중이었는지 잊어버린다 즉 Context Mode는 단순 토큰 절감기가 아니라,
도구 샌드박싱과 세션 연속성을 묶어 컨텍스트 위생을 관리하는 레이어에 가깝다.
더보기
이 영상의 포인트는 “Claude를 덜 써라”가 아니다.
오히려 정반대다.
같은 사용량으로도 usage limit를 덜 맞게 하려면, 대화 앞단에 실리는 컨텍스트와 MCP 오버헤드를 줄여야 한다는 주장이다.
즉 병목은 질문 횟수만이 아니라, 세션이 어떤 무게로 시작하느냐에 있다.
더보기