本論文では、サッカー動画のアクション検出タスクに取り組むためのモデル「ASTRA」を提案している。
まず、サッカー動画のアクション検出タスクが抱える3つの主な課題を指摘している。
これらの課題に対処するため、ASTRAは以下の手法を導入している。
さらに、ASTRAはトランスフォーマーエンコーダ・デコーダ構造を採用し、入力と出力の時間的解像度を柔軟に設定できるようにしている。
実験の結果、ASTRAは既存手法を上回る性能を示し、SoccerNet 2023 Action Spottingチャレンジでは3位の成績を収めた。特に、非可視アクションの検出や全体的な緩やかな評価指標での成績が良好であった。これは、音声情報の活用やラベルの不確実性モデル化が効果的に機能したことを示唆している。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Artu... alle arxiv.org 04-03-2024
https://arxiv.org/pdf/2404.01891.pdfDomande più approfondite