מושגי ליבה
Aufbau eines umfassenden und repräsentativen Sprachdatensatzes für indische Sprachen zur Förderung der Sprachtechnologie.
סטטיסטיקה
"Wir präsentieren INDICVOICES, einen Datensatz natürlicher und spontaner Sprache mit insgesamt 7348 Stunden."
"1639 Stunden wurden bereits transkribiert, mit einer Medianzeit von 73 Stunden pro Sprache."
ציטוטים
"Wir hoffen, dass dieser Open-Source-Blueprint als umfassendes Starter-Kit für Datensammlungsbemühungen in anderen mehrsprachigen Regionen der Welt dient."