생물의학 분야에서 대규모 언어 모델의 신뢰성을 평가하는 프레임워크: RAMBLA
대규모 언어 모델(LLM)은 생물의학 분야와 같이 잠재적으로 큰 사회적 영향을 미칠 수 있는 다양한 분야에서 점점 더 많이 활용되고 있지만, 실제 사용 사례에서의 신뢰성은 충분히 연구되지 않았다. 이 연구에서는 생물의학 분야에서 LLM 보조 도구로서의 신뢰성을 평가하기 위한 RAMBLA 프레임워크를 소개하고, 4개의 최신 기반 LLM이 이 분야에서 신뢰할 수 있는 보조 도구로 활용될 수 있는지 평가한다.