AI | 신규하 블로그

Promptfoo: LLM 평가와 레드팀을 하나의 CLI로 운영하는 방법

2026년 03월 12일 18시 10분 AI

LLM 기능을 제품에 붙이기 시작하면 금방 같은 문제가 반복됩니다. 프롬프트가 정말 좋아졌는지, 모델을 바꾸면 회귀가 생기는지, RAG나 에이전트가 위험한 입력에서 무너지는지, 이 세 가지를 사람 눈으로만 계속 확인하기가 어렵습니다. Promptfoo 는 바로 이 지점을 겨냥합니다. 프롬프트 품질 평가와 보안 레드팀을 YAML 설정과 CLI 중심으로 묶어서, “감으로 확인하는 LLM 개발"을 “반복 가능한 테스트"로 바꾸는 도구입니다. 이 글에서는 Promptfoo를 단순한 프롬프트 비교기가 아니라, eval 과 redteam 이라는 두 개의 운영 루프를 가진 LLM 테스트 하니스 로 보는 관점으로 정리합니다. 더보기

OpenRAG: Langflow 기반 통합 RAG 플랫폼

2026년 03월 12일 17시 00분 AI

OpenRAG는 문서 지식 기반 AI 응용 프로그램을 구축하기 위한 종합적인 RAG(Retrieval-Augmented Generation) 플랫폼입니다. Langflow의 시각적 워크플로우 빌더, OpenSearch의 확장 가능한 검색 엔진, Docling의 강력한 문서 처리 기능을 하나로 통합하여 개발자가 복잡한 RAG 시스템을 신속하게 구축할 수 있도록 지원합니다. 이 글에서는 OpenRAG의 핵심 아키텍처, 주요 기능, 그리고 실제 구현 방법을 살펴보겠습니다. 더보기

NotebookLM으로 프롬프트 엔지니어링 자동화 시스템 구축하기

2026년 03월 12일 10시 00분 AI

매일 쏟아지는 새로운 AI 도구와 프롬프트 가이드를 따라가느라 지치셨나요? 월요일에 마스터한 도구가 금요일이면 구식이 되는 느낌, 익숙하실 겁니다. 이 글에서는 Google NotebookLM을 활용해 도구를 자동으로 발견하고, 프롬프트를 자동으로 작성해주는 시스템을 구축하는 방법을 소개합니다. 더보기

클로드 코드로 PPT 만들기: 스킬 제작부터 마켓플레이스 배포까지

2026년 03월 12일 10시 00분 AI

클로드 코드를 사용하면 반복적인 작업을 자동화하는 스킬(Skill)을 만들 수 있습니다. 이번 글에서는 클로드 코드의 스킬을 활용해 HTML 기반 웹 PPT를 만드는 방법과, 이를 플러그인으로 패키징해 팀원들과 공유하는 마켓플레이스 배포 과정까지 다룹니다. 더보기

MiroFish-Ko는 어떻게 미래를 리허설하나: 군집 지능 예측 엔진 구조 읽기

2026년 03월 12일 08시 30분 AI

MiroFish-Ko는 저장소 소개 문구만 보면 꽤 과감합니다. “무엇이든 예측한다” 는 표현을 전면에 두고, 뉴스나 정책 초안, 금융 신호 같은 현실 세계의 시드 정보를 넣으면 수천 개의 에이전트가 상호작용하는 병렬 디지털 세계를 만들어 미래를 리허설할 수 있다고 설명합니다. 공개 저장소 기준으로 보면 이 프로젝트는 단순한 챗봇이 아니라, 입력 문서를 그래프와 에이전트 환경으로 바꾸고 시뮬레이션을 돌린 뒤 보고서와 후속 상호작용까지 이어지는 멀티 에이전트 예측 애플리케이션 으로 읽는 편이 더 정확합니다. 더보기

Agency Agents: AI 전문가 팀을 손끝에서 조립하는 오픈소스 에이전트 컬렉션

2026년 03월 11일 12시 30분 AI

Reddit 커뮤니티에서 탄생해 수개월간 반복 개선된 Agency Agents 는 112개 이상의 전문화된 AI 에이전트 페르소나를 제공하는 오픈소스 프로젝트다. 단순한 프롬프트 템플릿이 아니라, 각 에이전트가 고유한 성격 , 워크플로우 , 구체적인 산출물 , 성공 지표 를 갖춘 완전한 에이전트 시스템이다. Claude Code, Cursor, Aider, Windsurf, Gemini CLI, OpenCode 등 주요 에이전틱 코딩 도구에서 즉시 사용할 수 있다. 더보기

AI는 왜 똑똑한데 일관되지 않을까: 폴더형 스킬이 팀 전문성을 만드는 방식

2026년 03월 11일 09시 30분 AI

AI를 오래 써 본 팀일수록 비슷한 불만을 말합니다. 모델은 분명 똑똑한데, 세금 처리 같은 도메인 업무나 팀 내부 절차처럼 맥락이 중요한 일로 가면 매번 설명을 다시 해야 하고 결과 기준도 흔들립니다. 이 영상은 그 문제를 “지능은 높지만 경험은 없는 상태"로 설명하고, 해결책으로 스킬을 제시합니다. 더보기