Isaac Gym Example: Franka Operational Space Control [Basic] Force Control Using Inverse Dynamics

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ต.ค. 2024

ความคิดเห็น • 4

  • @seunghyeonjoe
    @seunghyeonjoe 3 หลายเดือนก่อน

    트윅님 매번 양질의 영상잘보고있습니다!! : )
    다름이 아니라, 영상을 보다 궁금한점이 생겨서 질문 드립니다.
    다른곳에서도 보면 pid보다 pd제어를 많이쓰는 경우를 볼수있는데, pd제어가 더 많이 쓰이는 이유를 알수있을까요??
    감사합니다.

    • @tweak-cd6ss
      @tweak-cd6ss  3 หลายเดือนก่อน +2

      안녕하세요. 대부분의 경우 PID보다는 PI, 또는 PD와 같이 두 개의 term으로만 구성해서 사용하게 되는데, 응용에 따라서 굳이 세 개의 term을 모두 사용할 필요가 없기 때문입니다. 일단 변수가 많아지면 그만큼 튜닝이 어려워지고 제어기가 복잡해집니다. 즉, 내가 적용하고자 하는 응용에 대해서 불필요한 요소는 배제하고 반드시 필요한 요소만 활용하여 제어기를 구성하는 것이 시스템 복잡도, computational cost, tuning 작업 등에서 유리하므로 응용에 맞게 반드시 필요한 요소만 포함하는 것이 좋은데, 많은 응용에서 pd컨트롤러 만으로 충분하기 때문입니다.
      예를 들어 휴머노이드 예제 같은 경우, 앞으로 달리는 모션을 생성함에 있어 하나의 지점에 정확한 타겟에 오랫동안 위치하는 것이 중요한게 아니라, 목표하는 위치로 빠르게 보내면서도 그렇다고 너무 불안정하지 않도록 적당히 안정적으로 관절을 움직이는 것이 중요합니다(안정적이며 빠른 응답성). 이 경우에 PD 컨트롤러만으로 충분히 원하는 바를 달성할 수 있기 때문에 굳이 i제어기를 포함시키지 않는 것입니다. 포함시켜봐야 계산할 것만 늘어나고 튜닝 과정도 복잡해 지기 때문입니다. i-제어기의 주요 목적 중 하나는 목표 위치에 대한 누적 오차를 줄이는, 즉 정상상태에러(steady-state error)를 없애는 것인데, 이는 목표 위치를 아주 정확하게 오랜 시간 동안 유지해야 하는 응용에 대해서는 중요하겠으나, 기민하면서도 적당히 안정된, 그리고 빠른 반응이 중요한 응용(e.g., humanoid, dexterous manipulation, drone 등)에서는 큰 역할을 수행하지 못하고 오히려 불리함을 야기 시킬 수 있습니다. 또한 noisy한 센서나 환경인 경우, 누적 에러가 과도해져서 integral term의 영향력을 증가시키고 이로 인하여 phase shift/lag(input signal과 output signal의 위상 차이)과 같은 문제가 발생하여 시스템 반응성이 나빠지고 오히려 시스템을 불안정하게 만들 수 있습니다(drift, bias issues).
      저도 PID제어를 전부 활용하여 제어해본 경험은 없으나, 예상컨데 강화학습이나 imitation learning으로 학습할 때, policy action을 통해 next step에서 움직여야 할 motion의 반응성이 낮아지거나 불안정해 지면 불안정한 시스템에 의한 불안정한 데이터가 수집될 것이고, 결과적으로 학습에 불리하게 작용할 것으로 생각됩니다.

  • @김월남이
    @김월남이 ปีที่แล้ว

    이번 강의는 트윅님이 수식 정리하느라 엄~~~~~청 힘들었을 것 같네요. 좋은 영상 올려주셔서 감사합니다.

    • @tweak-cd6ss
      @tweak-cd6ss  ปีที่แล้ว

      감사합니다 ㅎㅎ