RuBLiMPは、ロシア語の形態論、統語論、意味論における45種類の言語現象を網羅する大規模なベンチマークである。自然言語コーパスから抽出された文章を基に、言語学者による専門的な手法を用いて最小対を生成し、25種類の言語モデルの性能を評価した。