Core Concepts
LLMを使ってパフォーマンスを考慮したコードを生成する手法を提案する。
Abstract
本研究では、LLMを使ってパフォーマンスを考慮したコードを生成する手法を提案している。
まず、コーディングコンテストのデータセットと合成データを組み合わせた大規模なデータセットを作成した。
次に、教師学習、強化学習、直接アラインメントの3つの手法を用いてLLMをファインチューニングし、パフォーマンスを考慮したコードを生成できるようにした。
評価では、コード生成タスクとコード最適化タスクを行い、ファインチューニングしたLLMが生成するコードの正確性とパフォーマンスを検証した。
その結果、ファインチューニングしたLLMは、ベースラインのLLMと比べて、シリアルコードで0.9倍から1.6倍、OpenMPコードで1.9倍から4.5倍の高速化を達成できることが示された。
また、合成データを使ってファインチューニングすることで、正確性とパフォーマンスの両方が向上することが分かった。
Stats
生成したシリアルコードのベースラインに対する期待最大速度向上は1.6倍
生成したOpenMPコードのベースラインに対する期待最大速度向上は4.5倍
Quotes
"LLMを使ってパフォーマンスを考慮したコードを生成する手法を提案する。"
"ファインチューニングしたLLMは、ベースラインのLLMと比べて、シリアルコードで0.9倍から1.6倍、OpenMPコードで1.9倍から4.5倍の高速化を達成できる。"