การเรียนรู้ของเครื่องจักรหุ่นยนต์

สิ่งที่ยากสำหรับมนุษย์คือการทำให้หุ่นยนต์สับสน แต่ด้วยความช่วยเหลือของการเรียนรู้ของเครื่องจักรหุ่นยนต์เรียนรู้ที่จะเดินในเวลาเพียงไม่กี่ชั่วโมงดีกว่ามนุษย์โดยเฉลี่ย 12 เดือน โดยปกติแล้วนักหุ่นยนต์จะต้อง hardcode ทุกขั้นตอนของหุ่นยนต์หรือสร้างโลกจำลองที่หุ่นยนต์สามารถทำการทดลองและข้อผิดพลาดได้ แต่วิธีการทั้งสองนี้ใช้เวลานาน

ดังนั้นนักวิจัยในเครือของ Google จึงใช้การเรียนรู้เสริมเพื่อให้หุ่นยนต์สามารถสอนตัวเองว่าจะเดินอย่างไรในโลกแห่งความจริง สาขาการเรียนรู้ของเครื่องนี้ใช้ซอฟต์แวร์เพื่อรวบรวมข้อมูลเพิ่มเติมเกี่ยวกับสภาพแวดล้อมผ่านการทดสอบซ้ำอย่างต่อเนื่องและให้รางวัลความพยายามที่ประสบความสำเร็จ การจำลองยังคงเป็นส่วนประกอบที่สำคัญของการเรียนรู้การเสริมแรง แต่นักวิจัยได้ทำการทดสอบในระดับต่อไป ซึ่งหมายความว่านักวิจัยปล่อยให้หุ่นยนต์มิโนเทารัสเดินเตร่ไปรอบ ๆ สภาพแวดล้อมทางกายภาพก่อนที่จะซัดสาดข้ามภูมิประเทศที่ต่างกันของการทดลองเช่นพื้นราบที่นอนนุ่มและพรมเช็ดเท้าที่มีรอยแยกทางเรขาคณิต