本研究提出了一種基於深度神經網絡的全自動手語識別(SLR)方法。我們將數據集輸入到遷移學習(TL)模型中,不包括其頂層,以提取特徵。我們故意凍結所有層以保持預訓練權重。隨後,我們引入了一個自定義的分類層,使用輸入張量重塑圖像數據。我們使用帶有dropout的密集層進行正則化。我們採用ResNet、Inception V3、Xception和VGG架構,以及categorical cross-entropy損失、Adam優化器和評估指標來提高方法的效率,這在對不丹手語(BSL)數據集的全面評估中得到證實。最後,我們使用SHAP技術對模型的解釋能力進行了徹底的調查。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by A. E. M Ridw... alle arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07426.pdfDomande più approfondite