toplogo
Sign In

J.P. Morgan Chaseのグラフニューラルネットワークを用いたコードリバート予測に関する研究


Core Concepts
実業界の制約に基づくコードリバート予測の重要性とGNNを活用した解決策に焦点を当てる。
Abstract
AIがソフトウェアエンジニアリングタスクに適用され、特にソースコード分析が成長している。 コード欠陥検出とは異なり、コード変更がロールバックされる可能性を予測する新しい課題である。 GNNや不均衡分類、異常検知などの手法を組み合わせて実験を行い、実世界のデータセットで比較を行った。 実験結果から、データの極端な不均衡性がコードリバート予測に影響を与えることが示唆された。 さまざまな戦略やGNNアプローチの比較から、データセットの不均衡性が予測に与える影響が明らかになった。
Stats
Revert frequency last 30 days: 0.570, 直近30日間のリバート頻度は別のリバートで高い確率と対応しています。 File version: 0.326, 高いファイルバージョンはリバートの可能性が高くなります。 Commit to push lag days: 0.188, コミットからプッシュまでの遅延時間が長いほどリバート率が高くなります。 Total lines of code in push set: 0.151, より多くのコード行数はより高いリバート率と関連しています。 Total Cyclomatic complexity: 0.100, 高い総循環的複雑性はリバート確率の増加と関連しています。
Quotes
"Early prediction of code reversion effectively mitigates potential risks." "Code revert prediction is a novel and specialized form of software defect detection." "Utilizing attributes, structures, downsampling techniques can improve code revert identification."

Key Insights Distilled From

by Yulong Pei,S... at arxiv.org 03-15-2024

https://arxiv.org/pdf/2403.09507.pdf
Code Revert Prediction with Graph Neural Networks

Deeper Inquiries

実世界でコード欠陥検出と比較した場合、コードリバート予測はどう異なりますか?

コード欠陥検出は通常、ソフトウェアの問題を特定し修正することに焦点を当てていますが、コードリバート予測は開発中のコード変更が巻き戻される可能性を予測することに重点を置いています。つまり、単純なエラーの特定ではなく、実際にプロジェクトや製品全体に影響を及ぼすような重大な問題や不具合の事前防止に焦点があります。また、従来のデータセットでは極端に不均衡であるため、その対処法やモデル設計も異なっており、これらが主な違いです。
0
visual_icon
generate_icon
translate_icon
scholar_search_icon
star