大規模言語モデル(LLM)は、著作権で保護されたテキストをどの程度再現するか、また、モデルやデータセットによってその程度がどのように異なるかを体系的に調査した結果、LLMの著作権遵守には大きなばらつきがあり、モデルの規模が大きいほど潜在的な著作権侵害の件数は増加する傾向にあるが、著作権遵守の特異性については、必ずしも規模と相関関係があるわけではないことが明らかになった。