JRDB-Socialは、JRDB[2]データセットの拡張版である。個人属性(性別、年齢、人種)、グループ内の詳細な相互作用、社会的文脈(身体の位置と内容の関係、周辺の重要なシーン要素、場所、目的)の3つのレベルで注釈を提供する。これにより、ロボットが人間の社会的行動を包括的に理解できるようになる。
個人レベルでは、性別、年齢、人種の属性を注釈している。グループレベルでは、各ペアの詳細な相互作用(20カテゴリ)を時間軸で注釈している。社会的グループレベルでは、グループの身体の位置と内容の関係、周辺の重要なシーン要素、場所、目的などの文脈情報を注釈している。
このデータセットを使って、最新の大規模言語モデルの性能を評価した。個人属性の認識は比較的良好だが、グループ内相互作用や社会的文脈の理解では課題が残されている。人間の社会的行動を包括的に理解するには、さらなる研究の進展が必要である。
To Another Language
from source content
arxiv.org
Viktige innsikter hentet fra
by Simindokht J... klokken arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04458.pdfDypere Spørsmål