소프트 로봇 팔은 무한한 수동 자유도와 고유한 안전성 때문에 인간의 일상 생활에 대한 적용 가능성에서 큰 잠재력을 보여 왔습니다. 물 한 잔을 전달하는 것과 같이, 로봇의 움직임이 특정 자세 제약을 만족해야 하는 일상적인 작업들이 존재하지만, 이러한 제약은 소프트 팔을 통해 구현되지 않았습니다. 소프트 팔의 작업 공간은 하중이나 상호작용에 의해 영향을 받기 때문에, 이러한 작업을 운동 계획 방법으로 구현하기가 어렵습니다. 본 논문에서는 이 문제를 해결하기 위해 Q‑러닝 기반 접근법을 제안하며, 하중 및 상호작용 하에서도 계획 없이 제약을 포함한 운동 제어를 직접 달성합니다. 우리는 먼저 Q‑러닝을 기반으로 소프트 팔용 제어기를 생성하는데, 이 제어기는 팔에 하중이 가해지지 않거나 환경과 상호작용하지 않을 때 자세 제약을 만족하면서 팔을 작동시킬 수 있습니다. 그 다음, 제어기 내의 해당 Q값을 조정하는 과정을 도입하여, 알려지지 않은 하중이나 상호작용이 존재하더라도 자세 제약을 유지하면서 팔을 작동시킬 수 있게 합니다. 본 접근법을 우리 소프트 팔, 즉 Honeycomb Pneumatic Network (HPN) 팔에 구현했습니다. 실험 결과, 이 접근법은 팔이 훈련되지 않은 상황에 도달했거나 상호작용으로 인해 작업 공간을 초과한 경우에도 효과적임을 보여줍니다.