Główne pojęcia
本研究提出了一種全新的深度神經網絡方法來自動化實現手語識別。該方法結合了先進的預處理技術以優化整體性能。我們利用ResNet、Inception、Xception和VGG等架構來有選擇地對手語圖像進行分類。我們設計了一個DNN架構並將其與預處理架構相結合。在後處理階段,我們使用基於合作博弈論的SHAP深度解釋器來量化特定特徵對機器學習模型輸出的影響。我們在不丹手語(BSL)數據集上進行了訓練和測試,結果顯示ResNet50模型的準確率高達98.90%。我們的模型還能夠提供信息清晰度,這得益於SHAP方法的顯著健壯性和可靠性。
Streszczenie
本研究提出了一種基於深度神經網絡的全自動手語識別(SLR)方法。我們將數據集輸入到遷移學習(TL)模型中,不包括其頂層,以提取特徵。我們故意凍結所有層以保持預訓練權重。隨後,我們引入了一個自定義的分類層,使用輸入張量重塑圖像數據。我們使用帶有dropout的密集層進行正則化。我們採用ResNet、Inception V3、Xception和VGG架構,以及categorical cross-entropy損失、Adam優化器和評估指標來提高方法的效率,這在對不丹手語(BSL)數據集的全面評估中得到證實。最後,我們使用SHAP技術對模型的解釋能力進行了徹底的調查。
Statystyki
我們的模型在不丹手語(BSL)數據集上的訓練準確率為98.90%。
我們的模型在不丹手語(BSL)數據集上的測試準確率為90.24%。
我們的模型在不丹手語(BSL)數據集上的精確率為90.04%。
我們的模型在不丹手語(BSL)數據集上的F1分數為90.24%。
我們的模型在不丹手語(BSL)數據集上的召回率為90.24%。
Cytaty
"本研究提出了一種全新的深度神經網絡方法來自動化實現手語識別。"
"我們的模型還能夠提供信息清晰度,這得益於SHAP方法的顯著健壯性和可靠性。"