本研究では、自動運転タスクにおける報酬設計の課題に取り組むため、大規模事前学習モデルを活用した逆報酬設計手法を提案する。従来の報酬設計では、「安全に運転する」といった抽象的な目標を定義することが困難であったが、本手法では「衝突する」といった具体的な望ましくない状態を定義することで、大規模事前学習モデルを効果的に活用できる。