핵심 개념
大規模言語モデルの事前学習において、モデルの学習過程におけるデータ選好度の変化を捉え、動的にデータを選択することで、事前学習の効率と効果を大幅に向上させることができる。
초록
MATES: データ影響モデルを用いた効率的な事前学習のためのモデル認識データ選択
Yu, Z., Das, S., & Xiong, C. (2024). MATES: Model-Aware Data Selection for Efficient Pretraining with Data Influence Models. Advances in Neural Information Processing Systems, 38.
本研究は、大規模言語モデルの事前学習において、モデルの学習過程におけるデータ選好度の変化を捉え、動的にデータを選択することで、事前学習の効率と効果を向上させることを目的とする。