Core Concepts
Aufbau eines umfassenden und repräsentativen Sprachdatensatzes für indische Sprachen zur Förderung der Sprachtechnologie.
Stats
"Wir präsentieren INDICVOICES, einen Datensatz natürlicher und spontaner Sprache mit insgesamt 7348 Stunden."
"1639 Stunden wurden bereits transkribiert, mit einer Medianzeit von 73 Stunden pro Sprache."
Quotes
"Wir hoffen, dass dieser Open-Source-Blueprint als umfassendes Starter-Kit für Datensammlungsbemühungen in anderen mehrsprachigen Regionen der Welt dient."