# 롱호라이즌 에이전트는 왜 무너질까? HORIZON과 관련 논문으로 보는 진단과 대응arXiv에 공개된 「The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break」는 LLM 에이전트가 짧거나 중간 길이의 작업에서는 강한 성능을 보이지만, 길고 서로 얽힌 단계들을 오래 이어가야 하는 작업에서는 자주 무너진다는 문제를 정면으로 다룬다. 이 논문은 이런 장기 작업 실패가 아직 충분히 정리되지 않았다는 점을 문제의식으로 삼고, 이를 체계적으로 진단하기 위한 교차 도메인 벤치마크 HORIZON을 제안한다. [S1] [S1]논문 소개: HORIZON과 문제의식HORIZON의 출발점은 비교적 분명하다. 오늘날 LLM 에이전트는 짧은 작..