本論文では、安全性が重要な自律システムの故障を予測し、修復するためのシミュレーションベースのフレームワークを提案している。
まず、故障予測では、事前確率分布と故障の重大さのバランスを取るため、近似ベイズ推論の枠組みを用いて、故障ケースを効率的にサンプリングする。
次に、故障修復では、予測された故障ケースを考慮しながら、元の設計に近い修復済みポリシーをサンプリングする。
この予測と修復のプロセスを交互に行うことで、多様な故障ケースを網羅しつつ、頑健なポリシーを得ることができる。
提案手法には、微分可能なシミュレーションとレンダリングを活用した勾配ベースのバージョンと、勾配情報が利用できない場合のための勾配フリーバージョンがある。
理論的な分析では、勾配ベースのサンプリングが高次元問題で効率的に収束することを示し、実験では、提案手法が既存手法に比べて、より多様な故障ケースを発見し、修復済みポリシーの性能が高いことを示している。
また、ハードウェア実験では、シミュレーションで予測された故障ケースと修復済みポリシーが現実世界でも有効であることを実証している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Charles Daws... at arxiv.org 04-05-2024
https://arxiv.org/pdf/2404.03412.pdfDeeper Inquiries