说起迪士尼,你会想到机智勇敢的公主们。
城堡上绚丽的烟花空?
或者......迪士尼机器人???
最近,在机器人学顶级国际会议2020 IEEE智能机器人与系统国际会议上发表了一篇论文,介绍了上述机器人,看起来像人,机器确实是机器。
这篇论文的题目是《真实互动的机器人凝视》——的确,这个机器人的凝视是如此生动!
仔细看看它的眼球。
在迪斯尼乐园遇到机器人
这个机器人有着逼真的人眼和牙齿,可以模仿人类面部动作,尤其是眨眼和细微的头部动作更像人类行为。这个机器人的特点非常明显,一是没有皮肤,二是可以和眼睛互动。
在维基百科上,人形机器人的定义是:一种机器人,具有类似于人类外貌的特征,如头部、躯干、手和脚,但不一定具有毛发、五官、牙齿、皮肤等细微特征。
这是一个人形机器人。
它的主要应用领域是娱乐——迪士尼下一步会把它发展成一个卡通人物,它会根据剧本和游客互动。
对于这个奇怪的机器人,迪士尼官方的脑洞是:
机器人的角色是一个在图书馆或公园长椅上看书的老人。他听力有困难,视力也在下降,但经常被路人分散注意力。大多数时候,他会瞥一眼匆匆路过的人,友好地向熟人点头,但当有人侵占包间时,他会盯着他们空。
也许下次去迪士尼乐园会遇到这个“老人”,但还是希望工作人员能在上面贴上人工皮肤。现在,不知道有多少孩子会哭。
很多网友对此评论:太现实了!看着它的眼睛让我毛骨悚然。
眼神交流,真相最重要
这款机器人的研究团队阵容可以说是强强联合:
迪士尼研究中心,设计了很多机器人;
华特·迪士尼奇幻项目,迪士尼业务部门,负责世界上所有迪士尼公园和度假区的设计和建设;
加州理工学院,世界顶尖的私立研究型大学;
伊利诺伊大学香槟分校,被称为“公立常春藤”。
他们设计的机器人有哪些亮点?让我们看看报纸怎么说。
文章指出,以往对“人机凝视交互”的研究主要集中在技术层面。这一次,迪士尼团队展示了一个总体框架——打造“凝视互动”,不仅从技术角度出发,还注重机器人眼球运动的逼真度和可信度。
对此,IEEE网站的评价是:
可以认为是专门针对凝视的老式图灵测试——如果不能区分机器人和人类的凝视,那么迪士尼的设计是现实的。
也就是说,迪士尼不希望机器人看远处,但当人类靠近它,看向它的眼睛时,它会用眼睛回应。
包容性建筑的传承
通常科学家是通过研究人脑的运行机制来设计控制系统的,但这一次,迪士尼团队采用的方法是他们最擅长的——动画。
因此,机器人的硬件部分实际上是一个“音频动画半身像”。
毕竟迪士尼就是不希望机器人在看人类的时候出错。这种所谓“视觉吸引”方法的背后,其实是多年的人机交互研究积累下来的。
迪士尼希望让“人机凝视互动”达到真人面对面眼神交流的水平。为此,他们的设计是机器人可以感知环境中的人,根据人的动作来判断是否对机器人感兴趣,然后机器人会选择合适的方式来执行高度逼真的动作。
具体来说,机器人具有以下状态:
读数:机器人的默认状态。
扫描:利用RGB-D摄像头识别目标,当注意力引擎显示人的好奇心分数超过一定阈值时,机器人会相互瞟一眼。
吸引力:当注意力引擎显示刺激达到一定阈值时,机器人会将头转向另一侧看。
确认:当机器人决定看到“熟人”时,会从吸引状态或扫视状态直接进入确认状态。
但是,除了上述情况之外,还有一些较低级的行为,如呼吸、轻微的头部运动、眨眼和快速动眼期。
据了解,这些行为实际上涉及包容性架构。
简单来说,包容性架构是一种自下而上的组织结构,从简单、分散、低级的行为到更复杂的行为。
20世纪80年代,包容架构的概念由美国著名机器人制造专家、麻省理工学院CSAIL前负责人、斯坦福大学博士罗德尼·布鲁克斯提出。作为“现代机器人之父”,罗德尼·布鲁克斯还是iRobot和Rethinks Robotics的创始人,也是Robust.ai的联合创始人和首席技术官
10月30日,罗德尼·布鲁克斯还在推特上表达了自己对迪士尼团队设计的看法:
人们低估了机器人从学术论文到现实世界所需要的时间。迪士尼花了25年的时间在人形机器人的眼睛控制中使用包容性架构,比我1995年在Cog和Kismet中的应用更好更流畅。
下图是麻省理工学院创造的机器人Kismet,它是最早实现与人类社交和情感互动的机器人。
虽然看起来有点傻,但Kismet比迪士尼的机器人要善良得多。