แก้ปัญหากริดเวิลด์เพื่อวางแผนเส้นทางเดินหุ่นยนต์

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ม.ค. 2024
  • คลิปวีดีโอนี้เป็นการศึกษาการควบคุมหุ่นยนต์เคลื่อนที่ระยะไกลโดยใช้ไอโอที ต่อเนื่องจากตัวอย่างของหุ่นยนต์ขับเคลื่อนสองล้อที่จำลองบน Wokwi การวนซ้ำมูลค่า
    (value iteration) เป็นวิธีการโปรแกรมพลวัตที่ใช้ในการแก้ปัญหากริดเวิลด์ เพื่อวางแผนเส้นทางเดินหุ่นยนต์ให้เคลื่อนที่ไปในจุดที่ต้องการโดยหลีกเลี่ยงสิ่งกีดขวางและพื้นที่ต้องห้ามที่นิยามเป็นรางวัลด้านลบ ปัญหานี้จัดอยู่ในประเภทการโปรแกรมเชิงพลวัต (dynamic programming) เป็นพื้นฐานของการศึกษาด้านการเรียนรู้เสริมกำลัง (reinforcement learning) หุ่นยนต์จะเคลื่อนที่ตามนโยบายเหมาะที่สุด (optimal policy) ที่ได้จากเส้นทางที่ทำให้ได้รางวัลสูงสุด
    ในการศึกษาใช้กริดเวิลด์ขนาด 6x6 ซึ่งมีความยืดหยุ่นในการนิยามกริดตามต้องการ สามารถขยายขนาดเพื่อใช้วางแผนการเคลื่อนที่หุ่นยนต์ในสถานที่ที่มีพื้นที่มากขึ้น ทางด้านตัวควบคุมหุ่นยนต์ต้องเพิ่มคำสั่งการเคลื่อนที่ตามกริด คือบังคับ 4 ทิศทางแทนการเคลื่อนที่อย่างอิสระ ซึ่งจะเกิดปัญหาการชนกับสิ่งกีดขวางหรือพื้นที่ต้องห้าม

ความคิดเห็น •