LLM

2026.05.29 Gemini 환각을 줄이는 '비장의 치트키'의 정체: 모델을 바꾸는 게 아니라 개인 맞춤 지침으로 답변 규칙을 강하게 거는 방법

2026.05.20 Claude·ChatGPT·Gemini를 나눠 쓰는 8가지 업무 프롬프트: 회의자료부터 경쟁사 분석까지

2026.05.19 TradingAgents가 흥미로운 이유: '주식 추천 봇'이 아니라 증권사 조직도를 LLM 팀으로 옮긴 프레임워크

2026.05.19 LangGraph를 배워야 하는 이유를 한 문장으로 줄이면: '알아서 해줘'가 아니라 '어떻게 움직일지 설계한다'

2026.05.17 Karpathy의 한 장짜리 LLM Wiki 문서는 정말 RAG의 종말을 말하나

2026.05.16 NVIDIA Build는 진짜로 무료 AI API를 주나: 모델 카탈로그와 Free Endpoint를 구분해서 봐야 하는 이유

2026.05.13 Ethernet이 아니라 Thunderbolt RDMA가 병목을 깼다: 4대의 Mac Studio로 2TB 로컬 AI 클러스터 만들기

2026.05.05 veRL이 중요한 이유: LLM RL의 병목을 3D-HybridEngine과 HybridFlow로 푼다

2026.04.17 Graphify는 왜 토큰을 71.5배 아끼나: 지식 그래프로 코드베이스를 먼저 읽는 방식

2026.04.12 Gemma 4를 Colab에서 파인튜닝하는 가장 현실적인 경로: Unsloth 실습 흐름 정리

2026.04.06 Karpathy의 LLM Wiki: RAG 대신 누적되는 영속적 위키라는 발상

2026.03.25 컨텍스트 로트(context rot): 긴 문맥이 길수록 AI가 흐려지는 이유

2026.03.21 vLLM이 Ollama보다 빠른 이유: PagedAttention, Continuous Batching, 그리고 벤치마크 해석

2026.03.21 GPT-5.4로 더 좋은 프런트엔드를 뽑아내는 방법

2026.03.12 Promptfoo: LLM 평가와 레드팀을 하나의 CLI로 운영하는 방법

2026.03.12 OpenRAG: Langflow 기반 통합 RAG 플랫폼

2026.03.01 Prompt-Level Distillation(PLD): 미세튜닝 없이 추론 성능을 끌어올리는 비파라메트릭 접근

2026.02.22 파일 업로드 최적화: 두 개의 AI로 비용 절감과 성능 향상

2026.02.18 LLM에서 RAG vs CAG 비교: 언제 검색하고, 언제 캐시할까?