대규모 언어 모델(LLM)은 자연어 처리 분야에 혁신을 가져왔지만, 그럴듯하지만 사실이 아닌 내용을 생성하는 환각 현상을 일으키기도 합니다. 본 연구는 LLM 환각 현상의 원인, 유형, 탐지 방법, 완화 전략, 벤치마크, 그리고 앞으로의 연구 방향을 제시하며, LLM의 신뢰성과 안전성을 향상시키기 위한 포괄적인 분석을 제공합니다.
METEOR라는 새로운 자기 진화 방법론을 통해 대규모 언어 모델(LLM)이 지도 학습에서 벗어나 자율적으로 도메인 전문성을 갖추도록 진화하는 과정을 제시합니다.
텍스트에서 구조화된 다이어그램을 생성하고 편집하는 새로운 과제를 해결하기 위해 DiagramGenBenchmark 데이터셋과 DiagramAgent 프레임워크를 제안하여 기존 텍스트-이미지 및 텍스트-코드 생성 방식의 한계를 극복하고 정확하고 수정 가능한 다이어그램 생성을 가능하게 합니다.
대규모 언어 모델(LLM)의 컨텍스트 창 내부에서 작동하는 메커니즘을 분석한 결과, 초기 토큰의 위치 정보가 이후 토큰의 위치 벡터 형성에 중요한 역할을 하며, 컨텍스트 창 확장은 위치 벡터의 보간을 통해 이루어진다는 것을 발견했습니다. 이를 기반으로 위치 벡터 교체 및 어텐션 윈도우 확장이라는 두 가지 훈련 없는 컨텍스트 창 확장 방법을 제안합니다.
OASIS는 다양한 소셜 미디어 플랫폼에서 발생하는 사회적 현상을 현실적으로 시뮬레이션하기 위해 개발된 일반화 가능하고 확장 가능한 시뮬레이터로, 대규모 사용자 상호 작용을 지원하고 LLM 기반 에이전트의 행동을 분석하여 집단 행동 역학 및 정보 확산에 대한 심층적인 이해를 제공합니다.
대규모 언어 모델(LLM)은 인간의 언어 처리 방식을 모방하는 것이 아니라, 방대한 데이터에서 예측 패턴을 추출하는 뛰어난 능력을 지닌 범용 학습 기계로 이해해야 한다.
대규모 언어 모델(LLM)은 뛰어난 성능에도 불구하고, 학습 데이터에 내재된 사회적 편견으로 인해 편향성을 나타낼 수 있으며, 이는 공 fairness, equity, and accountability를 위해 반드시 해결해야 할 과제이다.
본 논문은 정규화된 LSTM 네트워크를 사용하여 가짜 뉴스 기사를 효과적으로 탐지하는 머신러닝 기반 접근 방식을 제시합니다.
LLM 기반 에이전트의 동적 팀 구성 및 협업 구조를 통해 작업 수행 능력과 효율성을 향상시킬 수 있다.
텍스트에서 이벤트 간의 인과 관계를 자동으로 식별하는 이벤트 인과 관계 식별(ECI) 작업에 대한 포괄적인 개요를 제공하며, 핵심 원칙, 기술 프레임워크, 분류, 과제 및 미래 방향을 제시합니다.