本文介紹了SC-Phi2,一個經過微調的細小語言模型,用於星際爭霸II的宏觀管理任務。作者創建了一個新的星際爭霸II文本數據集,包含有關種族、角色和動作的信息,並使用自監督學習的方式對Phi-2模型進行微調。作者還將Phi-2模型與BLIP-2預訓練的視覺變換器(ViT)相結合,在MSC數據集上進一步微調,以構建包含視覺遊戲狀態信息的動態提示。與之前使用的大型模型相比,SC-Phi2只有28億個參數,但在建造順序和全局狀態預測方面仍然表現出色。作者還利用LoRA和量化技術,使模型能夠在單個GPU上進行訓練。
Para outro idioma
do conteúdo fonte
arxiv.org
Principais Insights Extraídos De
by Muhammad Jun... às arxiv.org 10-01-2024
https://arxiv.org/pdf/2409.18989.pdfPerguntas Mais Profundas