# 롱호라이즌 에이전트는 왜 무너질까? HORIZON과 장기 실행 진단의 핵심최근 LLM 에이전트는 짧거나 중간 길이의 과제에서는 강한 모습을 보이지만, 길고 서로 의존적인 행동이 이어지는 장기 과제에서는 쉽게 무너질 수 있다는 문제가 다시 주목받고 있다. arXiv에 공개된 "The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break"는 이런 공백을 다루기 위해 HORIZON을 제안하며, 장기 과제 실패를 체계적으로 진단하고 비교할 수 있는 초기 cross-domain diagnostic benchmark라는 점을 전면에 둔다. [S1]논문 소개: HORIZON이 다루는 문제HORIZON은 장기 과제에서 에이전트 시스템이 어..