本論文では、2023年のAI4EICハッカソンについて説明する。このハッカソンは、Electron Ion Collider (EIC)の物理、データサイエンス、コンピューターサイエンスの研究者が一堂に会し、AIおよび機械学習の最新の進展について議論する年次ワークショップの最終日に開催された。
ハッカソンの課題は、ChatGPT-3.5を使ってGlueXバレル型カロリメーターのシミュレーションデータから中性子とフォトンを識別する二値分類器を構築することであった。参加者は、大規模言語モデルを使ってコードを生成し、限られたデータセット情報でモデルを構築する必要があった。
ハッカソンは2つの問題で構成され、参加者はChatGPTとのやり取りを通じてモデルを構築した。第1問では、中性子とフォトンの分離が容易な全相空間を対象とした。第2問では、中性子とフォトンの分離が困難な相空間の一部を対象とした。
参加者の取り組みは非常に優れたものであり、予想を大きく上回る結果を得た。特に第2問では、全チームが99%以上の高精度を達成した。最終的に、最少のプロンプト数で最速の解を提出した"Jets"チームが優勝した。
この取り組みは、大規模言語モデルを物理学分野の研究に活用する可能性を示すものであり、研究者の生産性向上に役立つことが期待される。また、得られたデータを分析することで、ドメイン専門家によるプロンプトの質と精度を高める手法の開発につながると考えられる。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Cristiano Fa... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.05752.pdfDeeper Inquiries