Khái niệm cốt lõi
Aufbau eines umfassenden und repräsentativen Sprachdatensatzes für indische Sprachen zur Förderung der Sprachtechnologie.
Thống kê
"Wir präsentieren INDICVOICES, einen Datensatz natürlicher und spontaner Sprache mit insgesamt 7348 Stunden."
"1639 Stunden wurden bereits transkribiert, mit einer Medianzeit von 73 Stunden pro Sprache."
Trích dẫn
"Wir hoffen, dass dieser Open-Source-Blueprint als umfassendes Starter-Kit für Datensammlungsbemühungen in anderen mehrsprachigen Regionen der Welt dient."