핵심 개념
本文介绍了FoodieQA数据集,该数据集旨在通过多图像、单图像和纯文本的多选问题评估对中国地域料理文化的细致理解。实验结果表明,理解食物及其文化背景仍是一个复杂和未被充分探索的任务。
초록
本文介绍了FoodieQA数据集,该数据集旨在评估对中国地域料理文化的细致理解。数据集包括三种任务:多图像问答、单图像问答和纯文本问答。
数据集收集过程如下:
- 选择14种中国主要地域菜系
- 收集当地人上传的未公开图像
- 对每道菜品进行详细注释
- 基于注释信息生成多图像和单图像问答题
- 生成纯文本问答题
实验结果显示:
- 多图像问答任务是最具挑战性的,现有模型与人类表现相差超过40%
- 模型在中文和英文问题上的表现存在差异,双语模型在中文上表现更好
- 视觉信息对模型性能有显著提升
总的来说,理解食物及其文化内涵仍是一个复杂的未解决问题。本文数据集为该领域的进一步研究提供了有价值的基准。
통계
中国地区菜品占总数的16.8%。
川菜和粤菜分别占16.8%和16.5%。
西北菜和东北菜分别占8.5%和1.1%。
인용구
"中国作为一个幅员辽阔、历史悠久的国家,培养了丰富多样的饮食文化和传统。"
"理解食物及其文化内涵仍是一个复杂的未解决问题。"