吃音検出において、ConformerモデルとLSTMネットワークを組み合わせ、マルチタスク学習戦略を最適化することで、従来の手法を超える精度と実用性を実現できる。
本稿では、マンダリン吃音イベント検出において、音声の細かなニュアンスを捉えることで検出精度を向上させる、きめ細かい対照学習(FGCL)フレームワークを提案しています。