大規模言語モデル(LLM)とLLMベースのエージェントは、化学のさまざまな分野、特に分子設計、特性予測、合成最適化において変革をもたらす可能性を秘めている。
Hunyuan-Largeは、大規模な合成データ、効率的なMoE構造、効果的な学習戦略によって、さまざまなベンチマークで優れたパフォーマンスを発揮する、オープンソースの大規模言語モデルである。
本稿では、べき乗則デコーダ表現を用いた大規模言語モデル(PLDR-LLM)は、小規模なデータセットとバッチサイズで学習しても、従来のモデルに匹敵する性能を達成できることを示している。
Sabiá-3は、ブラジルポルトガル語に特化した大規模言語モデルであり、多様な専門分野および学術的なベンチマークにおいて優れたパフォーマンスを発揮し、特に推論重視のタスクにおいて大幅な改善を示している。
医学における大規模言語モデルの開発と展開に関する包括的なレビューとその課題と機会を提供する。