本文提出了一種名為「樹狀透鏡」(ToL)的新方法,用於構建佈局感知型 GUI 螢幕閱讀代理,該代理可以理解使用者在螢幕上指示的區域的內容和佈局資訊,並生成自然語言描述,以幫助視障使用者更輕鬆地理解和使用數位設備。
사용자가 지정한 화면상의 지점을 해석하여 콘텐츠와 레이아웃 정보를 모두 제공하는 ToL(Tree-of-Lens) 기반 스크린 리더를 소개합니다.
本稿では、ユーザーがGUI上の任意の場所をポイントして読める、Tree-of-Lens Groundingを用いた新しいレイアウト認識GUIスクリーンリーダー「ToLエージェント」を提案する。
This research paper introduces the Tree-of-Lens (ToL) agent, a novel approach to screen point-and-read tasks that leverages hierarchical layout understanding to generate detailed content and layout descriptions for enhanced accessibility.
在人類監督的自主系統中,機器人的求助行為會影響人類對機器人的信任和他們對次要任務的參與度,而設計一個最佳的求助策略可以提高人機團隊的整體績效。
SPROUT은 대규모 언어 모델(LLM)을 활용하여 프로그래밍 튜토리얼 생성 과정의 효율성과 사용자 제어 능력을 향상시키는 인터랙티브 저작 도구이다.
LLMを用いたプログラミングチュートリアル生成において、生成プロセスの透明性とユーザーの制御性を向上させるために、思考の樹形図を用いたインタラクティブなオーサリングツールSPROUTを提案する。
本研究採用使用者中心設計方法,開發並測試結合社交輔助機器人和非沉浸式虛擬實境的雙人活動,以促進長期照護機構中老年人的參與度和社交互動,並探討了實施過程中面臨的挑戰和教訓。
본 연구는 사용자 중심 디자인 프로세스를 활용하여 장기 요양 시설에 거주하는 노인의 사회적 참여를 증진시키기 위해 사회적 보조 로봇과 비몰입형 가상현실을 결합한 짝 활동 시스템을 개발하고, 그 유용성과 수용 가능성을 평가합니다.
本稿では、長期ケア施設の高齢者のアパシーに対処するため、社会的支援ロボットと非没入型VRを組み合わせた、ユーザー中心設計による多感覚的な二人で行うアクティビティの開発と評価について述べている。