Sāmayik: Ein Benchmark-Datensatz für die Übersetzung vom Englischen ins Sanskrit
Sāmayik ist ein Datensatz mit rund 53.000 parallelen Englisch-Sanskrit-Sätzen, der die zeitgenössische Verwendung des Sanskrit in Prosa abdeckt. Der Datensatz überwindet die Beschränkung bestehender Korpora, die sich hauptsächlich auf Poesie und klassische Literatur konzentrieren.