EPIC-SOUNDS は、家庭の台所で録音された100時間の音声データを収集し、78,366の分類された音声イベントと39,187の非分類の音声イベントを含む大規模なデータセットである。音声イベントは人手で聞いて分類されており、音声のみで判別可能な行動を特定することができる。