核心概念
本文提出一種基於學習的四軸飛行器低階控制器,能夠自適應地控制具有顯著質量、尺寸和執行器性能差異的四軸飛行器。該控制器結合了模仿學習和強化學習,創建了一個快速自適應且通用的控制框架,消除了對精確模型估計或手動調整的需求。
摘要
本文介紹了一種基於學習的四軸飛行器低階控制器,能夠自適應地控制具有顯著差異的四軸飛行器。
主要內容包括:
控制架構:該控制器設計為低階控制器,在高階控制器的基礎上執行具體的馬達控制任務。這種分層控制架構可以將複雜的物理動力學問題從高階控制器中抽象出來。
自適應控制器的學習:控制器採用模仿學習和強化學習相結合的方式進行訓練。模仿學習從專門的基於模型的控制器學習,強化學習則通過直接的回饋信號進行優化。此外,設計了特定的獎勵函數,以確保控制器在高頻率下保持靈敏和敏捷的特性。
仿真環境中的參數隨機化:在訓練過程中,通過一種設計導向的隨機化方法,生成具有真實世界約束的四軸飛行器參數變化,增強控制器的適應能力。
實驗結果:在仿真環境中,該控制器展現出優秀的適應性和泛化能力,可以控制質量和尺寸相差16倍的四軸飛行器。在實際硬件實驗中,該控制器也表現出良好的鲁棒性,能夠適應離心負載和電機故障等干擾。
總的來說,該工作提出了一種通用的四軸飛行器控制框架,大幅簡化了無人機設計過程,提高了自主飛行作業在不可預測環境中的可靠性。
統計資料
我們的控制器可以控制質量相差3.68倍,臂長相差3.1倍,以及完全不同槳葉的兩種四軸飛行器。
在仿真環境中,我們的控制器的適應範圍可以擴展到訓練集的16倍。
在實際硬件實驗中,我們的控制器成功適應了高達3.7倍質量差異和100倍以上槳葉常數差異的四軸飛行器,並且能夠快速適應離心負載和電機故障等干擾。
引述
"本文提出一種基於學習的四軸飛行器低階控制器,能夠自適應地控制具有顯著質量、尺寸和執行器性能差異的四軸飛行器。"
"該控制器結合了模仿學習和強化學習,創建了一個快速自適應且通用的控制框架,消除了對精確模型估計或手動調整的需求。"
"我們的控制器展現出優秀的適應性和泛化能力,可以控制質量和尺寸相差16倍的四軸飛行器。"