核心概念
Large language models (LLMs) are utilized for decompilation, introducing the first open-source LLMs dedicated to decompilation and a benchmark emphasizing re-compilability and re-executability.
要約
デコンパイルは、コンパイルされたコードを人間が読めるソースコードに復元するプロセスであり、大規模言語モデル(LLMs)がプログラミングタスクに活用されている。この研究では、初のオープンソースLLMを導入し、再コンパイル可能性と再実行可能性に焦点を当てたベンチマークを紹介している。LLM4Decompileは87%の再コンパイル可能性と21%の再実行可能性を達成し、大規模なモデルサイズの利点を示している。これらの結果は、データ駆動型デコンパイルへの初期探索であり、将来の取り組みを促すものである。
統計
LLM4Decompileは21%のアセンブリコードを正確にデコンパイルし、GPT-4よりも50%改善されている。
6Bバージョンでは90%以上が再コンパイル可能であり、21%がテストケースを通過している。
引用
"大規模言語モデル(LLMs)はプログラミングタスクに活用されており、初めてオープンソースLLMsがデコンパイルに専念したことが紹介されています。"
"再コンパイル可能性と再実行可能性に焦点を当てた新しいベンチマークが設立されました。"