科技魔方

Meta用深度学习为Avatar再现复杂多角色交互

AR/VR

2023年07月10日

  人与人之间的身体交互是日常生活中的重要元素,例如通过握手打招呼,以及一起跳萨尔萨舞。显然,如果能够以可信方式在虚拟角色之间重现这种交互,这将会在游戏、电影或AR/VR等应用中提供一种高度沉浸式体验。

  在名为《Simulation and Retargeting of Complex Multi-Character Interactions》的论文中,由佐治亚理工学院,苹果,Meta,卡内基梅隆大学和首尔大学组成的团队就着手进行了研究,并提出了一种使用深度强化学习为物理模拟的人形角色再现复杂多角色交互的方法。

  所述方法学习不仅模仿个人动作,而且模仿角色之间的交互,同时保持平衡并匹配参考数据的复杂性的控制策略。他们使用了一种新的基于interaction graph的奖励公式,而它可以测量interaction landmark对之间的距离。这种奖励鼓励控制策略有效地模仿角色的动作,同时保留参考动作中交互的空间关系。团队在各种活动中评估了所提出的方法,包括击掌问候,跳萨尔萨舞和搬箱子等。实验表明,它能够产生物理上合理的交互。

  在论文中,研究人员对将复杂的多角色交互从参考运动转移到物理模拟角色感兴趣。这种角色需要在空间和时间领域内仔细协调。对于业界,对物理模拟角色之间交互的研究远远少于对单个角色的研究,部分原因是为多个角色之间的交互学习控制器非常具有挑战性。

  与单个角色一样,你必须保持平衡,但交互约束必须同时解决。尽管社区已经出现了一定的突破,但所展示的交互的复杂性依然与人们日常生活中的常规操作相去甚远。

  对于佐治亚理工学院,苹果,Meta,卡内基梅隆大学和首尔大学组成的团队,他们展示了一种新的基于学习的方法,并为多个角色的复杂交互提供了一种基于物理学的重定向。更具体地说,给定捕获交互的参考动作,他们通过不仅模仿个体运动,而且模仿他们之间交互的深度强化学习来学习模拟角色的控制策略(又称控制器)。

  当角色的大小和运动学存在较大变化时,学习到的策略可以产生可信的和语义上等同的交互。如果模拟角色的大小与原始运动捕获数据中的角色相匹配,产生的运动与参考数据则几乎没有区别,并且通过确保现在的交互在物理上可信,可以消除捕获过程中的任何错误。

  为了解决学习多角色交互的挑战,团队开发了基于interaction graph(IG)的新奖励,它测量角色指定位置对之间的距离,特别是反映角色之间的距离。基于IG的奖励令控制策略能够为物理模拟角色有效地部署复杂的交互,同时保留参考数据中包含的交互语义(即空间关系)。

  研究人员目标是建立令物理模拟角色能够相互进行复杂的物理交互的控制器。对于每一种行为,他们都会采用代表所需的多角色交互的参考动作捕获片段,并制作允许模拟角色能够模仿相关交互的控制器。

  他们希望产生与参考动作中存在的语义相似的角色交互。为了实现这一目标,团队使用了多代理深度强化学习。与其他方法不同的是,这一方案可以应用于动态角色。

  对于环境,角色建模为铰接式刚体物体。每个角色有22个链接和22个关节,每个关节有三个自由度,并由给定目标关节角度的稳定PD伺服系统进行驱动。他们使用一个开源的框架来实现和模拟角色。

  研究人员将问题表述为一个多代理的马尔可夫决策过程(MDP)。考虑到

+1

来源:映维网

延展资讯