LLM 기능을 제품에 붙이기 시작하면 금방 같은 문제가 반복됩니다. 프롬프트가 정말 좋아졌는지, 모델을 바꾸면 회귀가 생기는지, RAG나 에이전트가 위험한 입력에서 무너지는지, 이 세 가지를 사람 눈으로만 계속 확인하기가 어렵습니다. Promptfoo 는 바로 이 지점을 겨냥합니다. 프롬프트 품질 평가와 보안 레드팀을 YAML 설정과 CLI 중심으로 묶어서, “감으로 확인하는 LLM 개발"을 “반복 가능한 테스트"로 바꾸는 도구입니다. 이 글에서는 Promptfoo를 단순한 프롬프트 비교기가 아니라, eval 과 redteam 이라는 두 개의 운영 루프를 가진 LLM 테스트 하니스 로 보는 관점으로 정리합니다. 더보기

OpenRAG는 문서 지식 기반 AI 응용 프로그램을 구축하기 위한 종합적인 RAG(Retrieval-Augmented Generation) 플랫폼입니다. Langflow의 시각적 워크플로우 빌더, OpenSearch의 확장 가능한 검색 엔진, Docling의 강력한 문서 처리 기능을 하나로 통합하여 개발자가 복잡한 RAG 시스템을 신속하게 구축할 수 있도록 지원합니다. 이 글에서는 OpenRAG의 핵심 아키텍처, 주요 기능, 그리고 실제 구현 방법을 살펴보겠습니다. 더보기

매일 쏟아지는 새로운 AI 도구와 프롬프트 가이드를 따라가느라 지치셨나요? 월요일에 마스터한 도구가 금요일이면 구식이 되는 느낌, 익숙하실 겁니다. 이 글에서는 Google NotebookLM을 활용해 도구를 자동으로 발견하고, 프롬프트를 자동으로 작성해주는 시스템을 구축하는 방법을 소개합니다. 더보기

MiroFish-Ko는 저장소 소개 문구만 보면 꽤 과감합니다. “무엇이든 예측한다” 는 표현을 전면에 두고, 뉴스나 정책 초안, 금융 신호 같은 현실 세계의 시드 정보를 넣으면 수천 개의 에이전트가 상호작용하는 병렬 디지털 세계를 만들어 미래를 리허설할 수 있다고 설명합니다. 공개 저장소 기준으로 보면 이 프로젝트는 단순한 챗봇이 아니라, 입력 문서를 그래프와 에이전트 환경으로 바꾸고 시뮬레이션을 돌린 뒤 보고서와 후속 상호작용까지 이어지는 멀티 에이전트 예측 애플리케이션 으로 읽는 편이 더 정확합니다. 더보기

Reddit 커뮤니티에서 탄생해 수개월간 반복 개선된 Agency Agents 는 112개 이상의 전문화된 AI 에이전트 페르소나를 제공하는 오픈소스 프로젝트다. 단순한 프롬프트 템플릿이 아니라, 각 에이전트가 고유한 성격 , 워크플로우 , 구체적인 산출물 , 성공 지표 를 갖춘 완전한 에이전트 시스템이다. Claude Code, Cursor, Aider, Windsurf, Gemini CLI, OpenCode 등 주요 에이전틱 코딩 도구에서 즉시 사용할 수 있다. 더보기

AI를 오래 써 본 팀일수록 비슷한 불만을 말합니다. 모델은 분명 똑똑한데, 세금 처리 같은 도메인 업무나 팀 내부 절차처럼 맥락이 중요한 일로 가면 매번 설명을 다시 해야 하고 결과 기준도 흔들립니다. 이 영상은 그 문제를 “지능은 높지만 경험은 없는 상태"로 설명하고, 해결책으로 스킬을 제시합니다. 더보기