本論文は、オープンソースAIベースのソフトウェアエンジニアリング(SE)ツールの開発と維持に関する課題と機会について論じている。
現在のオープンソースコードモデルの開発は主に単一のチームによって行われており、以下の3つの主要な課題がある:
これらの課題に対して、本論文は連邦学習(FL)を活用した新しいガバナンスフレームワークを提案する。このフレームワークでは、参加者がデータを共有せずにモデルを共同で開発・維持できる。
具体的には以下の4つの要素から成る:
さらに、ガバナンス委員会が全体を管理し、新規参加者の承認や開発ガイドラインの維持を行う。
本論文では、6つのデータ分布戦略を設定し、4つのコードモデルと5つのコードタスクを用いて実験を行った。その結果、連邦学習はデータプライバシーを保護しつつ、モデルパフォーマンスを向上させられることが示された。また、データ分布の異質性がモデルパフォーマンスに大きな影響を与えることも明らかになった。
最後に、本提案の課題と機会について議論している。主な課題には、コードデータのプライバシー保護、参加者への適切な報酬メカニズム、参加者間の協調的な相互作用プロトコルの設計などがある。一方で、このフレームワークにより、オープンソースAIベースのSEツールの共同開発と維持が促進され、ソフトウェアエンジニアリング分野の発展に寄与できると期待される。
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Zhihao Lin,W... ב- arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06201.pdfשאלות מעמיקות