Centrala begrepp
クラウドソーシングプラットフォームから収集されたNetEaseCrowdデータセットは、長期およびオンライン真実推論に適しており、効果的な研究基盤を提供する。
Sammanfattning
大規模なデータセットであるNetEaseCrowdは、約6か月間にわたって収集され、各注釈のタイムスタンプが保存されている。
データは異なる種類のタスクから収集され、能力要件が異なる。
統計分析と実験結果により、作業者の注釈能力は時間とともに変化し、作業者能力を静的にモデル化することが不十分であることが示唆されている。
能力ID情報を活用することで、真実推論アルゴリズムの性能が向上する可能性がある。
Statistik
このデータセットは約6か月間で2,413人の作業者、999,799件のタスク、6,016,319件の注釈を含んでいる。