LLM 기반 다중 에이전트 토론 프레임워크를 통한 개방형 텍스트 평가 향상
본 연구는 대화형 다중 에이전트 프레임워크인 MATEval을 제안하여, 대규모 언어 모델(LLM)이 생성한 개방형 텍스트의 품질을 향상시키는 것을 목표로 한다. MATEval은 자기 성찰과 연쇄 사고 전략을 통합하여 에이전트 간 토론을 유도하고, 피드백 메커니즘을 통해 합의에 도달하도록 한다. 이를 통해 텍스트 오류 유형 및 위치 파악, 상세한 설명과 점수 제공 등 종합적인 평가 보고서를 생성한다.