本研究では、ストリーミングニューラルネットワークモデルの学習能力を向上させるために、ストリーミングアンカーロス(SAL)と呼ばれる新しい損失関数を提案している。
SALは、タスクに重要なフレーム(アンカーフレーム)に近いフレームに対して、より大きな損失ペナルティを与えることで、モデルがこれらの重要なフレームの予測に集中するようにする。
これにより、リソース制限の厳しいモデルでも、効率的にタスクを学習することができる。
提案手法は、キーワード検出、マルチモーダルトリガー検出、音声開始検出の3つのタスクで評価され、従来の損失関数と比べて、精度とレイテンシの両方で大幅な改善が示された。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Utkarsh Oggy... at arxiv.org 04-19-2024
https://arxiv.org/pdf/2310.05886.pdfDeeper Inquiries