Linnk AI letöltése
•
Kutatási asszisztens
>
Bejelentkezés
betekintés
-
高效的音視頻語音識別
高效的音視頻語音識別模型:雙重Conformer交互模組
提出一種新的音視頻語音識別模型架構,利用雙重Conformer交互模組(DCIM)實現跨模態信息高效交換,並設計了一種預訓練策略進一步提升性能,在保持高性能的同時大幅降低了模型參數數量。
1