本研究では、地球科学分野の大規模言語モデル「GeoGalactica」を開発した。GeoGalacticaは、Galacticaをベースモデルとして、さらに地球科学関連のテキストデータで事前学習を行い、地球科学分野の専門知識を獲得した。その後、地球科学分野の質問応答データを使ってファインチューニングを行い、地球科学分野の様々なタスクに優れた性能を発揮する。
具体的には以下の手順で開発された:
GeoGalacticaは、地球科学分野の知識抽出、文書分類、質問応答、知識発見など、幅広いNLPタスクで優れた性能を発揮する。また、地球科学分野の研究や実践に活用できる可能性を秘めている。本研究では、GeoGalacticaの開発プロセスや評価結果を詳細に報告している。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Zhouhan Lin,... kl. arxiv.org 04-16-2024
https://arxiv.org/pdf/2401.00434.pdfDybere Forespørgsler