Grunnleggende konsepter
팔을 장착한 휠-다리 로봇의 안정성과 효율성을 보장하면서도 동적 물체 조작 능력을 향상시키기 위해 팔 제약 커리큘럼 강화학습 프레임워크를 제안하였다.
Sammendrag
본 연구에서는 팔을 장착한 휠-다리 로봇의 이동-조작 능력 향상을 위한 프레임워크를 제안하였다.
먼저, 팔 제약 강화학습 알고리즘(AC-PPO)을 개발하여 로봇의 안정성과 제어 성능을 보장하였다. 이를 통해 팔과 바퀴의 동시 제어 시 발생할 수 있는 불안정성과 불확실성 문제를 해결하였다.
또한, 팔과 바퀴 간 보상 설정의 차이를 해결하기 위해 보상 인지 커리큘럼 학습 방법을 제안하였다. 이를 통해 팔 부분의 학습 진척도를 향상시켜 전체 에이전트의 균형 잡힌 학습을 달성하였다.
제안된 프레임워크를 통해 휠-다리 로봇은 문 열기, 선풍기 조작, 계주봉 추적 등의 동적 물체 조작 작업을 성공적으로 수행할 수 있었다. 시뮬레이션과 실제 로봇 실험 결과, 제안 방법이 안정성과 효율성을 보장하면서도 동적 조작 능력을 향상시킬 수 있음을 확인하였다.
Statistikk
선형 속도 추적 성능: exp(-7.5 * ||vcmd_x - vx||2)
각속도 추적 성능: exp(-1.25 * ||ωcmd_z - ωz||2)
가속도 제한: -0.1 * ||v_last_x - vx||2
자세 오차 페널티: -1.2 * ||Ry||2 - 1.2 * ||Rx||2
에너지 소모 페널티: -10^-5 * ||τ||2
다리 움직임 페널티: -10^-7 * (||q̇leg||2 - 2.5 * ||q̈leg||2)
그리퍼 위치 추적 성능: exp(-5 * ||p_ee - p_cmd_ee||2)
몸체 위치 추적 성능: exp(-0.05 * ||p_base - p_cmd_base||2)
팔 관절 상한 제한: -10 * Σ max(q_arm,i,t - q_upper_arm,i, 0)^2
팔 관절 하한 제한: -10 * Σ min(q_arm,i,t - q_lower_arm,i, 0)^2
Sitater
"팔을 장착한 휠-다리 로봇은 민첩성을 높이고 실용적인 응용 분야를 확장할 수 있다."
"팔과 바퀴의 동시 제어는 다양한 제어 모드와 동역학적 제약을 관리해야 하는 추가적인 과제를 야기한다."
"제안된 프레임워크는 안정성과 효율성을 보장하면서도 동적 물체 조작 능력을 향상시킬 수 있다."