Liu, X. ; Gasoto, R. ; Jiang, Z. ; Onal, C. ; Fu, J. (2020). Learning to Locomote with Artificial Neural-Network and CPG-based Control in a Soft Snake Robot. 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). https://doi.org/10.1109/iros45743.2020.9340763
@inproceedings{Liu_2020, title={Learning to Locomote with Artificial Neural-Network and CPG-based Control in a Soft Snake Robot}, url={http://dx.doi.org/10.1109/iros45743.2020.9340763}, DOI={10.1109/iros45743.2020.9340763}, booktitle={2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)}, publisher={IEEE}, author={Liu, Xuan and Gasoto, Renato and Jiang, Ziyi and Onal, Cagdas and Fu, Jie}, year={2020}, month=oct, pages={7758–7765} }
본 논문에서는 소프트 로봇 뱀을 위한 새로운 이동 제어 방법을 제시한다. 생물학적 뱀에서 영감을 받아, 우리의 제어 아키텍처는 두 가지 핵심 모듈로 구성된다: 변하는 목표에 대해 적응적인 목표 추적 행동을 달성하기 위한 강화학습(RL) 모듈과, 안정적이고 다양한 이동 패턴을 생성하기 위한 Matsuoka 오실레이터 기반의 중앙 패턴 생성기(CPG) 시스템이다. 두 모듈은 폐루프 시스템으로 상호 연결된다: 척추동물의 중뇌에 위치한 이동 영역에 비유되는 RL 모듈은 로봇의 상태 피드백이 주어졌을 때 CPG 시스템으로의 입력을 조절한다. 이후 CPG 시스템의 출력은 소프트 뱀 로봇의 공압 액추에이터에 대한 압력 입력으로 변환된다. Matsuoka 오실레이터의 진동 주파수와 파형 진폭이 서로 다른 시간 스케일에서 독립적으로 제어될 수 있다는 사실에 기반하여, 우리는 최적성과 데이터 효율성으로 측정되는 학습 성능을 개선하기 위해 option-critic 프레임워크를 추가로 적용한다. 제안된 제어기의 성능은 시뮬레이션과 실제 소프트 뱀 로봇 모두에서 실험적으로 검증된다.
저자들은 RL 모듈과 CPG 모듈을 폐루프로 결합해, 고수준 의사결정은 학습으로 담당하고 저수준 리듬 생성은 신경 오실레이터가 담당하는 계층형 제어를 제안합니다. 핵심은 RL이 CPG의 자극/주파수 관련 입력을 상황별로 조절해 목표 추적 적응성을 확보하고, CPG가 물리적으로 부드럽고 연속적인 구동 파형을 생성해 실제 소프트 액추에이터에 직접 연결하는 점입니다.