手語識別

基於深度神經網絡的手語識別：利用遷移學習和可解釋性的全面方法

本研究提出了一種全新的深度神經網絡方法來自動化實現手語識別。該方法結合了先進的預處理技術以優化整體性能。我們利用ResNet、Inception、Xception和VGG等架構來有選擇地對手語圖像進行分類。我們設計了一個DNN架構並將其與預處理架構相結合。在後處理階段，我們使用基於合作博弈論的SHAP深度解釋器來量化特定特徵對機器學習模型輸出的影響。我們在不丹手語(BSL)數據集上進行了訓練和測試,結果顯示ResNet50模型的準確率高達98.90%。我們的模型還能夠提供信息清晰度,這得益於SHAP方法的顯著健壯性和可靠性。

基於多流神經網路，專注於局部區域和骨骼資訊的單詞級手語識別

阿塞拜疆手語數據集：用於指拼、單詞和句子翻譯的數據集及基準軟體

SignCLIP：透過對比學習連接文字和手語

基於深度神經網絡的手語識別：利用遷移學習和可解釋性的全面方法