核心概念
コスト最適化と知識統合を考慮したLLMの活用により、産業レベルのアプリケーションのUIオートメーション・テストを効果的に実現する。
要約
本研究では、CAT(Cost-effective UI Automation Tests)と呼ばれるアプローチを提案している。CATは、機械学習手法とLLMを組み合わせることで、産業レベルのアプリケーションのUIオートメーション・テストを効果的に実現することを目的としている。
CATは2つのフェーズから構成される:
タスク記述の分解フェーズ:
検索ベースの手法を用いて、タスク記述に関連する過去の事例を検索し、LLMの学習コンテキストとして活用する。
LLMを用いて、タスク記述から具体的な操作ステップを生成する。
UIオートメーション実行フェーズ:
機械学習手法を用いて、生成された操作ステップとUIエレメントの対応付けを行う。
LLMをコンプリメンタリーな最適化手法として活用し、UIエレメントの不一致を解決する。
評価実験の結果、CATは90%のタスクを完了し、1回あたり0.34ドルのコストで実行できることが示された。これは、最先端の手法と比較して、コストを大幅に削減しつつ、完了率を維持できることを意味している。また、実際のWeChat テスト環境への統合により、141件のバグを検出し、開発者の負担を軽減することができた。
統計
1回のトークン推論にはLLaMA-7Bで67億FLOPsが必要
全UIオートメーション処理では数百万トークンが使用される
引用
"LLMsは、産業レベルのアプリテストに適用する際、コスト最適化と知識統合の課題に直面する"
"CATは機械学習手法とLLMを組み合わせることで、コスト最適化と知識統合の課題に取り組む"