機械人學習

機械人學習(英語:Robot learning)是機械人學機器學習的交叉研究領域[1]。較之其他機器學習算法的應用領域,機械人系統具有訓練成本高、包括傳感器在內的硬件限制、與外界進行物理交互、交互環境持續動態變化等難點,因而對機械人學習提出了特定的要求[2][3]

目前,對於機械人學習算法的涵蓋範圍,各研究組織沒有統一界定,有的認為機械人學習旨在設計算法使得各類機械人本體實現「學習」[2],有的則認為將各類機器學習算法集成於機械人上都算作機械人學習[4][3]。同此隨着機器學習領域的快速發展,機械人學習也不斷出現新的研究方向[4]

研究方向

對於機械人學習,IEEE機械人和自動控制協會英語IEEE Robotics and Automation Society下屬的機械人學習技術委員會總結的研究方向為[1]

  • 學習機械人本體、機械人任務或機械人環境的模型
  • 學習下至傳感器、電機等硬件,上至抽象任務的層次表示
  • 使用模仿學習(imitation learning)或強化學習的方法來學習機械人的任務決策或控制策略
  • 將學習算法與機械人本體的控制架構結合
  • 使用統計推斷方法分析多模態傳感器信息
  • 對機械人的時空信息進行表徵學習
  • 發展型機械人英語Developmental robotics和基於進化算法的機械人學習

自2017年起,Sergey Levine(加州伯克利)、肯·戈德堡(加州伯克利)、Vincent Vanhoucke(谷歌大腦)等一眾高校和研究所學者開始組織機械人學習會議(英語:Conference on Robot Learning),其中第一屆的徵稿主題範圍包括[5][6]

  • 強化學習
  • 模型學習和控制
  • 狀態估計;地圖構建計算機視覺
  • 多模態感知與傳感器融合
  • 基於學習的人與機械人交互;處理自然語言指令
  • 在機械臂、移動機械人、自動駕駛、無人機等領域的應用
  • 仿生學習與控制

參考文獻

  1. ^ 1.0 1.1 Robot Learning - Scope. IEEE Robotics and Automation Society. [2023-03-08]. (原始內容存檔於2023-03-21). 
  2. ^ 2.0 2.1 Buhmann, M. D.; Melville, Prem; Sindhwani, Vikas; Quadrianto, Novi; Buntine, Wray L.; Torgo, Luís; Zhang, Xinhua; Stone, Peter; Struyf, Jan; Blockeel, Hendrik; Driessens, Kurt; Miikkulainen, Risto; Wiewiora, Eric; Peters, Jan; Tedrake, Russ; Roy, Nicholas; Morimoto, Jun; Flach, Peter A.; Fürnkranz, Johannes. Robot Learning. Encyclopedia of Machine Learning. 2011: 865–869. doi:10.1007/978-0-387-30164-8_732. 
  3. ^ 3.0 3.1 A Summary of the First Conference on Robot Learning. Google AI Blog. 2017-12-13 [2023-03-08]. (原始內容存檔於2023-03-08). 
  4. ^ 4.0 4.1 Recent Technical Innovations In Robot Learning. IEEE RAS. [2023-03-08]. (原始內容存檔於2023-03-08). 
  5. ^ CoRL2017 - Conference on Robot Learning 2017. CoRL Conferences. [2023-03-08]. (原始內容存檔於2023-03-08). 
  6. ^ CoRL 2017 : Conference on Robot Learning. wikicfp. [2023-03-08]. (原始內容存檔於2023-03-08). 

外部連結