المفاهيم الأساسية
文章介紹了一個名為 AzSLD 的阿塞拜疆手語數據集,該數據集旨在促進手語識別和翻譯系統的發展。
數據集組成
AzSLD 數據集包含以下三個主要組成部分:
AzSLD Fingerspelling:包含 10,864 張靜態字母圖像和 3,587 個動態字母視頻,用於指拼識別。
AzSLD Words:包含 100 個最常出現詞彙的視頻,用於單詞級別的手語識別。
AzSLD Sentences:包含 500 個句子的視頻,每個句子由至少 18 位不同的手語使用者進行演示,並配有時間對齊的阿塞拜疆語句子翻譯,用於句子級別的手語識別和翻譯。
數據集特點
AzSLD 數據集是第一個公開發布的阿塞拜疆手語數據集,為阿塞拜疆手語識別和翻譯技術的發展提供了重要的數據資源。
數據集涵蓋了日常生活和社會服務場景中常用的詞彙和表達方式,具有較高的實用價值。
數據集採用了多視角拍攝和精細標註的方法,為手語識別和翻譯模型的訓練提供了豐富的信息。
數據集的倫理考量
在數據集的創建過程中,研究團隊嚴格遵守了相關的倫理準則,所有參與者都提供了知情同意,並確保了數據的隱私和安全。
AzSLD 數據集的發布對於促進阿塞拜疆手語識別和翻譯技術的發展具有重要意義,可以應用於以下方面:
開發基於深度學習的手語識別和翻譯系統。
研究阿塞拜疆手語的語言學特徵。
為聽障人士提供更便捷的溝通和信息獲取方式。