NaviQAte는 웹 애플리케이션 탐색을 질문-답변 과제로 정의하여, 구체적인 매개변수 없이도 기능을 탐색할 수 있는 방법을 제안한다. 이를 위해 3단계 접근법을 사용하는데, 첫 번째 단계에서는 GPT-4o와 같은 고급 대형 언어 모델을 활용하여 복잡한 의사결정을 수행하고, 두 번째 단계에서는 GPT-4o mini와 같은 비용 효율적인 모델을 사용하여 단순한 작업을 처리한다. NaviQAte는 텍스트와 이미지와 같은 다중 모달 입력을 통합하여 상황 이해를 높인다. Mind2Web-Live 및 Mind2Web-Live-Abstracted 데이터셋에 대한 평가 결과, NaviQAte는 사용자 작업 탐색에서 44.23%의 성공률과 기능 탐색에서 38.46%의 성공률을 달성하여, WebCanvas 대비 각각 15%와 33%의 향상을 보였다. 이러한 결과는 NaviQAte의 접근법이 자동화된 웹 애플리케이션 테스팅을 발전시키는 데 효과적임을 보여준다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Mobina Shahb... alle arxiv.org 09-18-2024
https://arxiv.org/pdf/2409.10741.pdfDomande più approfondite