Core Concepts
본 연구는 일본어 비즈니스 도메인을 위한 대규모 언어 모델을 개발하고, 최신 정보로 지속적으로 업데이트하는 방법을 제안한다.
Abstract
본 연구는 일본어 비즈니스 도메인을 위한 대규모 언어 모델을 개발하고 평가하는 것을 목표로 한다. 주요 내용은 다음과 같다:
일본어 비즈니스 도메인 데이터를 수집하고 정제하여 13억 개의 매개변수를 가진 대규모 언어 모델을 처음부터 학습했다.
비즈니스 관련 질문에 대한 답변 생성 능력을 평가하기 위해 새로운 벤치마크 데이터셋을 구축했다.
기존 일본어 언어 모델과 비교 실험을 수행한 결과, 본 연구의 모델이 비즈니스 도메인 질문에 대한 답변 생성 정확도가 가장 높은 것으로 나타났다.
최신 비즈니스 문서를 활용하여 모델을 지속적으로 업데이트하는 방법을 제안하고, 이를 통해 최신 정보에 대한 답변 능력이 향상됨을 확인했다.
Stats
2023년 3월에 경영 파산한 두 개의 미국 은행은 Silicon Valley Bank와 Signature Bank이다.
2023년 10월과 11월에 발표된 최신 비즈니스 문서를 활용하여 모델을 업데이트하면 최신 정보에 대한 답변 정확도가 향상된다.
Quotes
"본 연구는 일본어 비즈니스 도메인을 위한 대규모 언어 모델을 처음으로 개발했다."
"최신 비즈니스 문서를 활용하여 모델을 지속적으로 업데이트하면 최신 정보에 대한 답변 능력이 향상된다."