Concepts de base
비용 최적화와 지식 통합을 고려하여 기계 학습 기법과 LLM을 결합한 UI 자동화 테스트 접근법을 제안한다.
Résumé
이 연구는 UI 자동화 테스트를 위한 비용 효율적인 접근법인 CAT를 제안한다. CAT는 두 단계로 구성된다:
-
작업 설명 분해 단계:
- 검색 기반 방식을 사용하여 유사한 산업용 앱 사용 사례를 찾아 LLM에 제공하여 작업 설명을 구체적인 실행 가능한 액션으로 분해한다.
-
UI 자동화 실행 단계:
- 기계 학습 기법을 사용하여 UI 요소를 매핑하고, LLM을 보완적인 최적화 도구로 활용하여 동적 UI에서 정확한 요소를 찾는다.
실험 결과, CAT는 WeChat 데이터셋에서 90%의 완료율을 달성하면서 평균 $0.34의 비용으로 UI 자동화 테스트를 수행할 수 있었다. 또한 실제 WeChat 테스트 플랫폼에 통합하여 141개의 버그를 자동으로 감지하는 등 실용성을 입증했다.
Stats
이 접근법은 39,981개의 WeChat 앱 작업 설명을 처리할 수 있다.
평균 작업 설명 길이는 18.7단어이며, 각 설명은 평균 7.3단계의 액션을 포함한다.
실험 기간 동안 6,300개의 작업 설명을 자동화하여 88%의 완료율을 달성했다.
141개의 버그를 자동으로 감지했다.
Citations
"LLM은 비용이 많이 들어 산업 수준의 테스팅에 적합하지 않다. 따라서 기계 학습 기법과 LLM을 결합하여 비용 최적화와 지식 통합을 달성했다."
"CAT는 90%의 완료율을 달성하면서 평균 $0.34의 비용으로 UI 자동화 테스트를 수행할 수 있었다."