Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research
好久没看论文了orz,这篇是从 gymnasium-robotics关于shadow hand的操作里翻出来的。借助gymm这个平台给单个灵巧手做强化学习。
(15/100)
阅读这篇文章之前,我的几个问题,希望从这篇文章中得到解放。
- 怎么操控shadow hand的?
- 怎么知道操控的效果的?
没有再像以前那样一章一章地看了,效率不够高。
RL三要素
即使是 1. reward:achieved?通过distance和quat vs 目标 2. action:20d 3. observation:这就多了
问题
- cartesian position 就是笛卡尔坐标系啊
- DDPG+HER w/ sparse reward 效果最好
- Hindsight Experience Replay(HER):一种对抗稀疏奖励的经验回放技术 好用吗,在机器人任务上
启发
- 看genesis强化学习接口
- 找任务task,明确3个要素
- 确定用什么强化学习算法
- 在genesis上训练