Khái niệm cốt lõi
Kallaama 프로젝트는 세네갈의 3대 언어인 월로프, 풀라르, 세레르어의 농업 분야 음성 데이터셋을 제공하여 음성 기술 개발을 지원합니다.
Tóm tắt
Kallaama 프로젝트는 세네갈의 3대 언어인 월로프, 풀라르, 세레르어의 농업 분야 음성 데이터셋을 제공합니다. 이 데이터셋은 다음과 같은 특징을 가지고 있습니다:
총 125시간의 음성 데이터로 구성되어 있으며, 각 언어별로 약 40시간 내외의 데이터가 포함되어 있습니다.
농업 관련 주제의 자연스러운 대화 음성으로 구성되어 있습니다.
농민, 농업 자문가, 농식품 사업 관리자 등이 참여하여 다양한 상황의 음성 데이터가 포함되어 있습니다.
음성 데이터 외에도 각 언어별 텍스트 코퍼스와 월로프 발음 사전도 함께 제공됩니다.
이 데이터셋은 세네갈 국가어의 음성 기술 개발을 위한 기반을 마련하고, 농업 분야의 음성 기반 솔루션 개발을 지원할 것으로 기대됩니다.
Thống kê
세네갈 농촌 지역의 문해율은 62.7%에 달합니다.
세네갈 인구의 약 65%가 디지털 문해력 부족으로 인터넷 사용에 어려움을 겪고 있습니다.
세네갈 인구의 약 80%가 월로프, 풀라르, 세레르어를 사용합니다.
Trích dẫn
"세네갈 국가어는 AI 기술의 주요 발전으로부터 소외되어 왔습니다."
"농업은 세네갈 경제의 중요한 축으로, 전체 인구의 55%가 농업 가치 사슬에 종사하고 있습니다."