Ai | 신규하 블로그

vLLM이 Ollama보다 빠른 이유: PagedAttention, Continuous Batching, 그리고 벤치마크 해석

2026년 03월 21일 22시 25분 AI

로컬 LLM을 이야기할 때 대부분의 출발점은 Ollama입니다. 설치가 간단하고 바로 써볼 수 있기 때문입니다. 그런데 이번 영상은 질문 자체를 바꿉니다. 내 PC에서 모델이 돌아가느냐 가 아니라, 여러 요청을 계속 받아내는 서빙 엔진으로도 효율적인가 를 봐야 한다는 것입니다. 영상은 vLLM의 강점이 바로 그 지점, 즉 KV Cache 메모리 관리와 다중 요청 스케줄링에서 나온다고 설명합니다. 근거 영상 중요한 것은 숫자를 그대로 외우는 것이 아니라, 왜 어떤 환경에서는 차이가 거의 없고 어떤 환경에서는 크게 벌어지는지 를 이해하는 것입니다. 영상 도입부는 Red Hat의 2025년 8월 8일 벤치마크를 인용해 vLLM의 높은 TPS와 낮은 지연시간을 언급하지만, 뒤에서 보여주는 자체 테스트에서는 단일 요청에서는 큰 차이가 없고 동시 요청 환경에서 우위가 커진다고 정리합니다. 이 글은 바로 그 차이를 만든 구조를 따라가 보려는 글입니다. 근거 영상 더보기

GPT-5.4로 더 좋은 프런트엔드를 뽑아내는 방법

2026년 03월 21일 21시 10분 Web

2026년 3월 20일 OpenAI Developers에 올라온 Designing delightful frontends with GPT-5.4 의 핵심은 단순히 “GPT-5.4가 더 예쁜 화면을 만든다"가 아닙니다. 더 정확히는, GPT-5.4는 이미지를 보고 판단하고, UI를 구현하고, 다시 실행해 검증하는 루프 가 이전보다 훨씬 자연스러워졌고, 그 루프를 살리는 프롬프트 구조가 따로 있다는 이야기입니다. 이 글은 같은 달 3월 5일 공개된 Introducing GPT-5.4 와 함께 읽으면서, OpenAI가 왜 시각 참조, 디자인 제약, 낮은 reasoning, 실제 콘텐츠, Playwright 검증을 한 세트로 묶어 이야기하는지 정리합니다. 포인트는 “길게 지시하면 잘 만든다"가 아니라, 좋은 프런트엔드가 나오도록 작업면 자체를 설계하는 것 입니다. 더보기

browser-use는 AI 에이전트에게 웹을 어떻게 열어 주는가

2026년 03월 21일 21시 01분 Developer Tools

2026년 3월 21일 기준으로 browser-use 의 GitHub 저장소 페이지는 81.6k stars 를 보여 주고, pyproject.toml 과 PyPI 메타데이터는 최신 공개 버전을 0.12.2, 지원 Python 범위를 >=3.11,<4.0 으로 적고 있습니다. README가 이 프로젝트를 짧게 설명하는 문장은 "Make websites accessible for AI agents" 인데, 이 한 줄이 의외로 정확합니다. browser-use 는 단순한 브라우저 매크로나 Playwright 래퍼가 아니라, 웹페이지의 상태를 LLM이 판단할 수 있는 작업 공간으로 바꾸고, 그 판단을 다시 브라우저 액션으로 연결하는 계층 을 만들려는 프로젝트입니다. 더보기

클로드 코드(Claude Code)로 전문가 수준의 웹사이트 디자인하기: 수파노바 디자인 스킬과 제미나이 활용법

2026년 03월 21일 10시 00분 web engineering automation

AI가 만든 웹사이트 디자인을 보면 왠지 모를 ‘AI스러운’ 느낌을 받을 때가 많습니다. 어색한 폰트, 보라색 그라데이션, 정돈되지 않은 레이아웃 등 이른바 **AI 슬롭(AI Slop)**이라 불리는 현상인데요. 이번 포스트에서는 클로드 코드(Claude Code)의 잠재력을 200% 끌어올려 전문가 수준의 웹사이트를 제작하는 혁신적인 스킬과 워크플로우를 소개합니다. 더보기

바이브코딩 외주 실전 전략: '두달만에 3500' 영상에서 확인되는 것과 확인되지 않는 것

2026년 03월 19일 08시 40분 Automation

바이브코딩(Vibe Coding) 관련 콘텐츠는 많지만, 실제로 돈을 받고 무엇을 만들었는지까지 공개하는 사례는 생각보다 드뭅니다. 이번 영상이 흥미로운 이유는 “두달만에 3500” 이라는 강한 문구 자체보다, 최소한 공개 페이지와 댓글만 봐도 외주 실험의 방향, 숨고 같은 유입 채널, 그리고 실제로 언급된 프로젝트 종류가 제법 구체적으로 드러난다는 점에 있습니다.12 더보기

23살 창업자의 바이브코딩 앱 전략: 20개 벤치마크, 온보딩, 빠른 출시가 수익보다 중요한 이유

2026년 03월 19일 08시 37분 Product

이 영상이 흥미로운 이유는 “2주 만에 앱으로 2,800만원” 이라는 숫자보다, 비개발자형 바이브코딩을 어떤 프로세스로 해석하고 있는지 를 꽤 선명하게 보여주기 때문입니다. 공개된 설명과 공유 요약을 기준으로 보면, 코딩 자체보다 앞단의 시장 조사, 온보딩 해석, AI에게 넣는 입력 구조, 그리고 너무 늦지 않게 출시하는 판단이 더 중요하다는 방향이 두드러집니다.12 더보기

코덱스와 리모션으로 PPT 느낌 없이 감각적인 AI 영상을 만드는 실전 워크플로우

2026년 03월 18일 06시 42분 Automation

리모션은 원래부터 강력한 툴이지만, 영상에서 반복해서 강조하는 포인트는 분명합니다. 리모션 자체만으로는 설명형 PPT 같은 결과가 나오기 쉽고, 여기에 외부 이미지와 짧은 모션 자산을 레이어로 섞어야 비로소 “감각적인 영상” 으로 넘어간다는 것입니다. (참고: 0:00, 2:54, 5:14) 더보기