이 논문은 로봇 실패에 대한 다중 모달 설명 생성 문제를 다룹니다. 기존 연구에서는 텍스트 설명만을 고려했지만, 다중 모달 설명이 더 직관적이고 효과적일 수 있습니다. 그러나 단순히 모달을 결합하면 모달 간 의미적 불일치가 발생할 수 있습니다. 이는 사용자의 이해를 어렵게 하고 로봇의 능력에 대한 잘못된 결론을 유도할 수 있습니다.
이 논문에서는 모달 간 논리적 일관성을 확인하고 필요한 경우 수정하는 접근법을 제안합니다. 일관성 평가를 텍스트 함축 인식 문제로 모델링하고, 관련 데이터셋에 대한 사전 학습 모델을 fine-tuning하여 효과적인 일관성 분류기를 학습합니다. 또한 불일치가 발생할 경우 이를 해결하기 위한 수정 전략을 제안합니다.
실험 결과, 제안 방법이 기존 접근법에 비해 우수한 성능을 보였으며, 특히 보이지 않는 작업 유형에 대한 일반화 능력이 뛰어났습니다. 이를 통해 로봇 실패에 대한 다중 모달 설명의 일관성과 신뢰성을 높일 수 있습니다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문