机械手解决魔方 Solving Rubik’s Cube with a Robot Hand
本文证明了仅在模拟中训练的模型可以用于解决实际机器人上前所未有的复杂性的操纵问题。这可以通过两个关键组件来实现:新颖的算法(我们称为自动域随机化(ADR))和为机器学习而构建的机器人平台。ADR自动在难度不断增加的随机环境中生成分布。经过ADR训练的控制策略和视觉状态估计器可以极大地改善模拟传输。对于控制策略,在ADR生成的环境分布上训练的内存增强模型在测试时显示出明显的元学习迹象。ADR与我们的定制机器人平台的结合使我们能够用人形机器人手解决魔方,这既涉及控制问题,又涉及状态估计问题。
论文链接:https://arxiv.org/pdf/1910.07113.pdf