이 연구는 언어 모델 에이전트의 성능에 가장 큰 영향을 미치는 요소 속성을 조사했습니다. 실험 결과, 요소 순서가 다른 어떤 속성보다도 에이전트 성능에 큰 영향을 미치는 것으로 나타났습니다.
요소 순서를 무작위로 변경하면 웹 페이지의 모든 텍스트를 제거하는 것과 유사한 수준으로 성능이 저하됩니다. 웹 페이지는 계층적 구조를 가지고 있지만, 픽셀에서 직접 요소를 파싱하면 이러한 순서가 없습니다. 또한 과제가 더 어려워지고 모델이 더 발전함에 따라 순서의 영향이 증가하는 것으로 나타났습니다.
효과적인 순서를 찾는 것은 간단하지 않습니다. 이 연구에서는 웹 및 데스크톱 환경에서 다양한 요소 순서 방법의 영향을 조사했습니다. 픽셀 전용 환경에서는 차원 축소가 효과적인 순서를 제공한다는 것을 발견했습니다. 또한 픽셀에서 UI 요소를 감지하는 모델을 훈련하여 OmniACT 벤치마크에 적용했으며, 이를 통해 이전 최신 기술 대비 2배 이상의 평균 과제 성공률을 달성했습니다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Wayne Chi, A... о arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.12089.pdfГлибші Запити