전체 글 75

물리 법칙을 지키는 다이어그램 생성과 물리 추론 벤치마크: 무엇이 달라졌나

# 물리 법칙을 지키는 다이어그램 생성과 물리 추론 벤치마크: 무엇이 달라졌나arXiv에 공개된 두 편의 논문은 텍스트와 이미지에서 물리 현상을 다루는 AI의 약점을 서로 다른 방향에서 짚는다. PhyDrawGen은 자연어로부터 물리 다이어그램을 생성할 때 물리 법칙과 기하 제약을 함께 만족시키려는 방법을 제안하고, BilliardPhys-Bench는 이미지 속 상황을 보고 이후의 움직임과 상호작용을 얼마나 잘 추론하는지 평가하기 위한 벤치마크를 제시한다. [S1][S9] [S1] [S9]소개: 논문 이름과 발표 맥락PhyDrawGen은 자연어에서 물리 다이어그램을 생성하는 문제를 다룬 arXiv 논문이다. 이 논문은 텍스트로부터 물리 장면을 그릴 때 단지 보기 그럴듯한 그림이 아니라 물리 법칙을 지키는..

SageMaker AI와 NVIDIA DynoSim으로 보는 LLM 서빙 관측성과 튜닝 포인트

# SageMaker AI와 NVIDIA DynoSim으로 보는 LLM 서빙 관측성과 튜닝 포인트오늘은 LLM 서빙을 운영하는 과정에서 무엇을 관측해야 하는지, 그리고 어떤 설정을 튜닝하려는지에 초점을 맞춘 두 소식을 함께 살펴봅니다. 하나는 Amazon SageMaker AI 엔드포인트의 관측성을, 다른 하나는 NVIDIA DynoSim이 다루는 서빙 튜닝 문제를 정리합니다. [S1] [S2]오늘의 AI 뉴스 한눈에 보기오늘 다룰 두 소식은 모두 LLM 서빙의 운영과 최적화에 맞닿아 있습니다. Amazon SageMaker AI 쪽에서는 엔드포인트의 관측성을 넓히는 접근이 소개됐고, NVIDIA 쪽에서는 LLM 서빙을 튜닝할 때 마주치는 여러 선택의 조합을 다루는 DynoSim이 제시됐습니다. 두 소식..

오늘의 AI 뉴스 2026.06.01

AWS와 NVIDIA가 공개한 AI 운영·배포 실무 뉴스 4가지

# AWS와 NVIDIA가 공개한 AI 운영·배포 실무 뉴스 4가지이번에 공개된 AWS와 NVIDIA의 소식은 AI 모델을 만드는 단계보다, 실제로 운영하고 배포하는 흐름에 더 가까운 주제들입니다. 평가, 관측성, 멀티모달 실행, 포털 임베드까지 실무에서 자주 마주치는 지점을 한 번에 살펴보겠습니다. [S2] [S3] [S4] [S7]오늘의 AI 뉴스 한눈에 보기오늘 다룰 소식은 AWS와 NVIDIA가 각각 공개한 AI 운영·배포 관련 뉴스입니다. AWS는 딥 에이전트 평가, SageMaker AI LLM 추론 관측성, SageMaker AI MLflow 앱 포털 임베드에 관한 실무 가이드를 제시했고, NVIDIA는 GPU에서 멀티모달 AI를 실행하는 방향을 소개했습니다. 서로 주제는 다르지만, 모두 개..

오늘의 AI 뉴스 2026.05.31

LLM 에이전트의 안전성과 신뢰성을 다루는 최신 논문 3편: 가드레일, 환각 완화, 자기개선 평가

# LLM 에이전트의 안전성과 신뢰성을 다루는 최신 논문 3편: 가드레일, 환각 완화, 자기개선 평가최근 arXiv에는 LLM 에이전트의 성능 자체보다, 실제 사용 과정에서 드러나는 안전성과 신뢰성 문제를 다루는 논문들이 이어지고 있다. 이번 글에서는 세 편을 함께 본다. 「Hallucination Mitigation with Agentic AI, Nested Learning, and AI Sustainability via Semantic Caching」는 멀티에이전트 파이프라인에서 환각이 단계적으로 전파되는 문제를 다룬다. 「Robust and Efficient Guardrails with Latent Reasoning」는 안전 가드레일의 정확도와 함께 지연 시간, 토큰 오버헤드 문제를 함께 본다. 「..

LLM 에이전트의 신뢰성과 운영을 다룬 최신 논문 4편: 검증, 정책, 메모리, 프라이버시

# LLM 에이전트의 신뢰성과 운영을 다룬 최신 논문 4편: 검증, 정책, 메모리, 프라이버시이번 글은 2026년 5월 arXiv에 공개된 네 편의 논문을 함께 본다. 대상은 과학적 주장과 인용의 정합성을 다루는 「DeepSciVerify: Verifying Scientific Claim--Citation Alignment via LLM-Driven Evidence Escalation」, 멀티에이전트 서빙을 위한 「A Policy-Driven Runtime Layer for Agentic LLM Serving」, Minecraft 환경에서 경험을 기술로 내재화하는 「PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of ..

반응형