Core Concepts
HyperCLOVA Xは、韓国語と英語の両言語に優れた理解力と生成能力を持つ大規模言語モデルである。
Abstract
本報告では、HyperCLOVA Xの開発プロセスと評価結果について詳しく説明している。
HyperCLOVA Xは、韓国語、英語、プログラミングコードのデータを均等に使ってプリトレーニングを行い、その後、人間による高品質なデモンストレーションデータとフィードバックを使ってアラインメント学習を行った。
HyperCLOVA Xは、推論、知識、常識、事実性、コーディング、数学、チャット、命令理解、有害性の観点から、韓国語と英語の両言語で包括的な評価を受けた。その結果、HyperCLOVA Xは韓国語の理解と推論能力に優れ、英語でも他の大規模言語モデルと遜色ない性能を発揮することが示された。
さらに、HyperCLOVA Xは複数の言語間の推論や機械翻訳の能力も高く、多言語化への優れた一般化能力を持つことが明らかになった。
HyperCLOVA Xの開発では、NAVER AIの倫理原則に基づいて、システマティックなレッドチーミングとデータ収集プロセスを採用し、自動および人手による安全性評価を行った。
HyperCLOVA Xは、韓国語と英語の両言語に優れた性能を発揮する大規模言語モデルであり、他の地域や国が独自の大規模言語モデルを開発する際の参考になると考えられる。
Stats
韓国語のドキュメントを平均676.48トークンでエンコードできる。これは他のモデルと比べて最も少ないトークン数である。
HyperCLOVA Xは、韓国語の理解と推論能力で他のモデルを大きく上回る。
HyperCLOVA Xは、英語の主要ベンチマークでも他の大規模言語モデルと遜色ない性能を発揮する。
Quotes
"HyperCLOVA Xは、韓国語と英語の両言語に優れた理解力と生成能力を持つ大規模言語モデルである。"
"HyperCLOVA Xは、韓国語の理解と推論能力に優れ、英語でも他の大規模言語モデルと遜色ない性能を発揮する。"
"HyperCLOVA Xは複数の言語間の推論や機械翻訳の能力も高く、多言語化への優れた一般化能力を持つ。"