本論文では、ビジネス文書の理解に関する新しいデータセット「BuDDIE」を紹介する。BuDDIEは1,665の実世界のビジネス文書から構成され、文書分類、キーエンティティ抽出、視覚的質問応答の3つのタスクに対して豊富な注釈が付与されている。
文書分類タスクでは、5つの文書クラスを定義し、アノテーターによる高い一致率で注釈を付与した。キーエンティティ抽出タスクでは、7つのスーパーカテゴリーと69の詳細なエンティティラベルを定義し、文書内のエンティティを注釈した。視覚的質問応答タスクでは、文書内のキーエンティティを使ってスパン型の質問と真偽型の質問を生成した。
BuDDIEは、従来のデータセットと比べて文書の種類が多様であり、かつ複数のタスクに対応している点が特徴的である。これにより、実世界のビジネス文書処理における要求に合致したモデルの開発が期待できる。本論文では、BuDDIEに対するいくつかのベースラインモデルの結果も示している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問