发布时间: 2017年06月28日
你考虑购买的新家附近有多少个公园?一家餐厅里的最佳晚餐和酒的搭配是什么?回答这些日常问题需要进行关系推理,这种更高级思维的构成部分对于人工智能(AI)来说很难操控。现在,谷歌公司深度思维分公司下属的研究人员设计了一个简单的算式来处理类似的逻辑推理——而且它已经在一个复杂成像理解测试中战胜了人类。
人类在关系推理——用逻辑联系和对比位置、序列及其他实体的一种思维——方面通常较为擅长。但AI的两个主要种类——统计和符号发展出类似能力的速度却很缓慢。统计AI或机器学习擅长于模式识别,但却并不擅长使用逻辑。而符号AI能够利用已经决定的规则推理关系,但却不擅长动态学习。
新研究提出了跨越这一沟壑的方法:一种进行关系推理的人工智能神经网络。类似于神经在大脑中连接的方式,神经网络会将微小的程序连在一起,通过协作在数据中寻找模式。它们可以拥有处理图像、剖析语言或者甚至是学习游戏的特别架构。在这种情况下,新的“关系网络”可以被连接以对比各个场景中的每一对物体。“我们正在明确地让这个网络发现事物之间存在的关系。”该论文共同作者、伦敦深度思维分公司计算机学家Timothy Lillicrap说。
他和团队用若干任务验证了它们的关系网络。第一个网络是回答一个单一图像中事物之间的关系,如立方体、球和圆柱。例如:“蓝色物体前有一个物体,它的形状和灰色金属球右边蓝绿色的小物体形状相同吗?”对于这一任务,关系网络可以与另外两种神经网络相结合:一个是识别图像中的物体,另一个是解释问题。在很多图像和问题上,其他机器学习算式的正确率是42%到77%。人类得分是92%。而新关系网络联合体的正确率是96%,已经超过了人类的推理分数,研究人员在近日发表于预印本服务器 arXiv的文章中报告了这一成果。
深度思维团队还在基于语言的一项任务中测验了该神经网络,其中它会收到诸如“Sandra捡起足球”“Sandra去办公室”等表述。随后它会收到一些问题,如“足球在哪里?”(办公室)。它在大多数类型的问题上表现得与多数AI算式一项出色,而且在所谓的推理问题方面尤其出色。例如,“Lily是一只天鹅。Lily是白色的。Greg是一只天鹅。Greg是什么颜色的呢?”(白色)。对于此类问题,关系网络得分可达98%,而其竞争者的得分在45%左右。最终,该算式分析了10个球在周围弹跳的动态模式,其中一些球被隐形弹簧或木棒连接在一起。关系网络能够利用这个动态模式,识别90%以上的连接。它随后后同样的训练方法识别移动点及其他为代表的人类形式。
“他们的方法的一个优势是在概念上特别简单。”纽约波士顿大学计算科学家、并未参与此项研究的Kate Saenko说,她也开发了一个能够回答关于图像复杂问题的算式。Lillicrap说,这种简单性——大多数进展被囊括在一个方程式中——使其能够与其他网络相结合,正如在物体比较任务中所做的那样。论文将此称为“一种简单的即插即用模块”,可让该系统的其他部分聚焦其擅长之处。
“我对这些结果感到震撼。”加州斯坦福大学计算机学家Justin Johnson说,他共同开发了物体对比任务。Saenko 补充说,神经网络未来有一天将有助研究社会网络、分析监控录像或是指导自动化汽车。
为了获得像人一样的灵活性,Johnson说,它将需要学习回答更多具有挑战性的问题。做到这一点可能不仅需要对比一组事物,而是要有效地对比三个事物、两对事物,或是一个更大集合中的几对事物。“我对开发能够想出其自身策略的模型非常感兴趣。”他说,“深度思维正在建设一种特殊的推理模型,那将不是进行更加普遍意义上的关系推理。但目前它依然是朝着正确方向迈出了极重要的一步。”