Core Concepts
OAKINK2数据集提出了一种基于物体的三层抽象方法,用于管理复杂操作任务的固有复杂性。该数据集包含了人类完成复杂日常活动的演示,并提供了相应的多视角图像流和精确的姿态注释。
Abstract
OAKINK2数据集旨在构建复杂操作任务的结构化表示。它采用了三个层次的抽象:
功能性(Affordance):物体/物体部件的功能属性,如<切割,某物>。
基本任务(Primitive):完成某个功能性的最小交互单元,如使用刀切割水果。
复杂任务(Complex Task):由多个基本任务按特定顺序组成的长期、多目标操作,如准备一碗热甜果汁茶。
OAKINK2数据集提供了人类完成这些复杂任务的多视角视频和相应的3D姿态注释。基于此,本文提出了一个面向任务的复杂任务完成(CTC)框架,包括使用大语言模型进行任务分解,以及基于任务的运动生成模型。这些应用展示了OAKINK2数据集的多样性和价值。
Stats
使用刀切割梨子。
从糖罐中取出糖放入茶杯。
打开水瓶盖,将水倒入茶杯。