\

전체 글 78

LLM 다양성은 왜 줄어들까? SFT 이후 생성 다양성을 다시 보는 연구

# LLM 다양성은 왜 줄어들까? SFT 이후 생성 다양성을 다시 보는 연구arXiv에 공개된 "Diversity in Large Language Models under Supervised Fine-Tuning"은 supervised fine-tuning(SFT)이 대규모 언어모델의 생성 다양성에 어떤 영향을 주는지 다시 살펴보는 연구다. SFT는 LLM을 사용자 의도에 맞추는 데 중요한 단계로 널리 쓰이지만, 동시에 생성 다양성을 억제한다는 인식도 함께 따라왔다. 이 논문은 바로 그 인식이 실제로 얼마나 경험적으로 검증되어 왔는지에 주목하며, LLM의 표현력과 다양성을 더 깊게 분석할 필요가 있다고 문제를 제기한다. [S4]intro: 논문 소개이 논문은 "Diversity in Large Langua..

AWS와 NVIDIA가 보여준 최신 AI 흐름: LLM 평가 강화와 에이전트 확산

# AWS와 NVIDIA가 보여준 최신 AI 흐름: LLM 평가 강화와 에이전트 확산이번에 소개된 두 AI 뉴스는 모델을 더 잘 평가하고 학습시키는 흐름과, 에이전트 기술이 조직으로 확산되는 흐름을 각각 보여줍니다. AWS와 NVIDIA의 발표를 함께 보면, AI 업계가 어디에 관심을 두고 있는지 비교해 볼 수 있습니다. [S1] [S2]오늘의 AI 뉴스 한눈에 보기오늘은 AWS가 다룬 reinforcement fine-tuning과 LLM-as-a-judge 접근, 그리고 NVIDIA Blog가 소개한 OpenClaw Agents의 의미를 함께 살펴봅니다. 두 소식은 각각 모델 학습 방식의 개선과 에이전트 생태계의 확산을 보여주며, AI 흐름을 비교해 보기 좋은 사례입니다.출처: [S1], [S2]AW..

오늘의 AI 뉴스 2026.05.03

LLM 에이전트와 과학 발견: 최근 논문 4편이 보여주는 자동화의 방향

# LLM 에이전트와 과학 발견: 최근 논문 4편이 보여주는 자동화의 방향최근 arXiv에 새로 올라온 네 편의 연구는 LLM 에이전트와 자동화 시스템이 어디까지 확장될 수 있는지를 서로 다른 장면에서 보여준다. 한 편은 실제 광학 플랫폼에서 종단간 자율 과학 발견을 다루고, 다른 한 편은 데이터셋과 자연어 목표만으로 ML 파이프라인을 자동 생성하는 다중 에이전트 구조를 제안한다. 또 다른 연구는 GUI를 직접 다루는 컴퓨터 사용 에이전트의 비용과 속도 문제를 단계별 최적화로 풀려 하고, 마지막 연구는 언어만을 공통 인터페이스로 삼는 한계를 넘어 서로 다른 과학 foundation model이 협업하는 틀을 제시한다. 흐름을 한 줄로 묶으면, 최근 연구들은 단순한 보조 도구를 넘어 실제 작업 환경과 전문..

DreamProver와 AGEL-Comp: 에이전트가 더 잘 추론하고 일반화하려면 무엇이 필요한가

# DreamProver와 AGEL-Comp: 에이전트가 더 잘 추론하고 일반화하려면 무엇이 필요한가이번 글에서는 2026년 4월 arXiv에 공개된 두 편의 논문, 「DreamProver: Evolving Transferable Lemma Libraries via a Wake-Sleep Theorem-Proving Agent」와 「AGEL-Comp: A Neuro-Symbolic Framework for Compositional Generalization in Interactive Agents」를 함께 살펴본다. 두 논문은 같은 시스템을 제안하는 것은 아니지만, 공통적으로 LLM 기반 에이전트가 추론과 일반화에서 보이는 한계를 보완하려는 시도라는 점에서 연결된다. DreamProver는 형식적 정리 증..

LLM 에이전트의 계획·추론을 더 안정적으로 만드는 최근 논문 3편

# LLM 에이전트의 계획·추론을 더 안정적으로 만드는 최근 논문 3편2026년 4월 arXiv에는 LLM 에이전트의 계획과 추론을 더 안정적으로 다루려는 논문들이 연이어 공개됐다. Analytica는 복잡한 분석을 더 구조화된 방식으로 다루려는 아키텍처를 제안하고, From Coarse to Fine은 작업 난도에 따라 계획의 세분화를 조절하는 계층적 계획을 다룬다. CAP-CoT는 장문·다단계 문제에서 흔들리기 쉬운 Chain-of-Thought 추론을 반복적이고 대조적인 수정 방식으로 보완하려는 접근이다. 세 논문은 서로 다른 문제를 다루지만, 복잡한 작업에서 LLM이 한 번에 모든 것을 처리하려 할 때 생기는 불안정성을 줄이려는 공통된 흐름을 보여준다. [S5] [S9] [S11]intro: 논문..

반응형