Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research

好久没看论文了orz,这篇是从 gymnasium-robotics关于shadow hand的操作里翻出来的。借助gymm这个平台给单个灵巧手做强化学习。

(15/100)

论文链接arxiv

阅读这篇文章之前,我的几个问题,希望从这篇文章中得到解放。

  1. 怎么操控shadow hand的?
  2. 怎么知道操控的效果的?

没有再像以前那样一章一章地看了,效率不够高。

RL三要素

即使是 1. reward:achieved?通过distance和quat vs 目标 2. action:20d 3. observation:这就多了

问题

  1. cartesian position 就是笛卡尔坐标系啊
  2. DDPG+HER w/ sparse reward 效果最好
  3. Hindsight Experience Replay(HER):一种对抗稀疏奖励的经验回放技术 好用吗,在机器人任务上

启发

  1. 看genesis强化学习接口
  2. 找任务task,明确3个要素
  3. 确定用什么强化学习算法
  4. 在genesis上训练