IndicSTR12 ist der größte und umfassendste Datensatz für die Erkennung indischer Szenentext, der 12 der wichtigsten indischen Sprachen abdeckt und die Entwicklung robuster Texterkennungsmodelle vorantreiben wird.
Effektive Integration von synthetischen und realen Daten zur Verbesserung des Vorabtrainings von Textdetektoren.
Effiziente Erkennung von maschinengenerierten Texten durch Multi-Population Aware Optimization für maximale mittlere Diskrepanz.