\

전체 글 83

멀티모달 LLM 내부에서 오디오·비주얼 정보는 어떻게 흘러가나

# 멀티모달 LLM 내부에서 오디오·비주얼 정보는 어떻게 흘러가나arXiv에 공개된 논문 「From Senses to Decisions: The Information Flow of Auditory and Visual Perception in Multimodal LLMs」는 멀티모달 대형언어모델이 듣고 본 정보를 실제로 내부에서 어떻게 전달해 최종 답변에 반영하는지를 다룬다. 오디오와 비주얼 신호가 네트워크 안에서 어떤 경로를 따라 움직이는지에 대한 이해가 아직 충분하지 않다는 문제의식에서 출발한 연구다. [S1]논문 소개: 무엇을 다루는가이 논문은 Audio-Visual Large Language Models, 즉 오디오와 시각 정보를 함께 다루는 멀티모달 LLM 내부를 들여다보는 연구다. 제목 그대로 ..

LLM 에이전트의 기억과 도구 사용을 어떻게 더 안정적으로 만들까

# LLM 에이전트의 기억과 도구 사용을 어떻게 더 안정적으로 만들까최근 arXiv에 공개된 세 편의 논문은 공통적으로 도구를 사용하는 LLM 에이전트의 안정성을 다룬다. "Contract2Tool: Learning Preconditions and Effects for Reliable Tool-Augmented LLM Agents"는 도구를 언제 쓰는 것이 적절한지 설명하는 계약 정보에 주목하고, "MemToolAgent"는 이전 상호작용과 장기 기억을 활용해 도구 사용을 개선하는 방향을 제시한다. "Efficient Skill Grounding via Code Refactoring with Small Language Models"는 환경이나 구현 차이 때문에 기존 스킬이 그대로 작동하지 않는 문제를 코..

LLM 에이전트의 기억과 작업 흐름을 더 잘 다루는 최신 연구 3편

# LLM 에이전트의 기억과 작업 흐름을 더 잘 다루는 최신 연구 3편최근 arXiv에는 LLM 에이전트가 긴 작업을 더 안정적으로 수행하기 위해 무엇이 필요한지를 서로 다른 각도에서 다루는 논문들이 올라오고 있다. Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory, AdMem: Advanced Memory for Task-solving Agents, Workflow-to-Skill: Skill Creation via Routing-Workflow-Semantics-Attachments Decomposition은 모두 2026년 6월 arXiv에 공개된 연구로, 각각 워크플로 검증, 장기 기억, 스킬 생성이라는 축..

LLM 에이전트의 안전성, 효율성, 그리고 실제 적용 가능성: 최근 논문 4편으로 읽기

# LLM 에이전트의 안전성, 효율성, 그리고 실제 적용 가능성: 최근 논문 4편으로 읽기이번 글은 최근 arXiv에 공개된 네 편의 논문을 통해 LLM 시스템이 실제로 부딪히는 문제를 함께 살펴본다. 다루는 논문은 멀티에이전트 시스템의 통신 효율을 다룬 "What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems", 프롬프트 인젝션과 jailbreak 탐지를 다룬 "GuardNet: Ensemble Strategies of Shallow Neural Networks for Robust Prompt Injection and Jailbreak Detection", 안전 정렬이 오히려 새로운 우회 취약성을 만들 수 ..

에이전트의 실행 전 검증과 런타임 안전: 최근 arXiv 논문 3편으로 보는 핵심 아이디어

# 에이전트의 실행 전 검증과 런타임 안전: 최근 arXiv 논문 3편으로 보는 핵심 아이디어최근 arXiv에는 AI 에이전트를 실제 환경에 배포하기 전 무엇을 검증해야 하는지, 그리고 실행 중에는 어떤 방식으로 위험을 줄이려 하는지를 다룬 논문들이 이어지고 있다. 이번 글에서는 기업용 AI 에이전트의 배포 전 보증을 다루는 「Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification」, 자율 에이전트의 런타임 안전에서 개입 시점 문제를 다루는 「The Saturation Trap and the Subjectivity of Intervention Timing: Why..

반응형