本研究では、トルコ語のみのデータセットを使用して開発された、効率的で高性能なトルコ語言語モデルcosmoGPTを紹介している。
主な内容は以下の通り:
355M、774MパラメータのcosmoGPT Medium、Large モデルを開発し、オープンソースで公開した。これらはトルコ語のみのデータで学習されたモデルである。
様々な命令実行タスクに適応させるための新しい微調整データセットと、モデルの性能を客観的に評価するための新しい評価データセットを開発した。
トルコ語に対応する既存の大規模言語モデルと、開発したcosmoGPTモデルを包括的に比較した。その結果、パラメータ数が10倍大きいモデルよりも優れた性能を発揮することが示された。
モデル評価プロセスでは、人間評価と他の基準との相関関係を分析した。
これらの成果により、トルコ語NLPの分野で大きな進歩が得られ、より効果的なモデルの開発につながることが期待される。
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by H. Toprak Ke... lúc arxiv.org 04-29-2024
https://arxiv.org/pdf/2404.17336.pdfYêu cầu sâu hơn