Google智慧搜索里的人类世界
- 2012-8-27 12:14:03
- 类型:原创
- 来源:电脑报
- 报纸编辑:邓晓进
- 作者:
【电脑报在线】当我们在Google的搜索框敲下一个个越来越复杂的问题时,一场逐级变难的智力较量开始了。背后接招的是Google科学家兼高级副总裁阿米特·辛格哈尔(Amit Singhal)以及他的搜索团队。
“官方促销:足不出户看报纸,订阅高清版一年电脑报仅需98元”
当我们在Google的搜索框敲下一个个越来越复杂的问题时,一场逐级变难的智力较量开始了。背后接招的是Google科学家兼高级副总裁阿米特·辛格哈尔(Amit Singhal)以及他的搜索团队。
阿米特想出的办法:“如果人类拥有像电影《星际迷航》里的Kirk船长那台能够即刻回答任何问题的计算机的话,所有问题就迎刃而解了。”听上去,这是一个以不变应万变的好办法,可是靠谱吗? 近日,Google将搜索新功能Knowledge Graph推广到了所有英语国家,阿米特在接受本报记者采访时说:“我们离这个梦想又近了一些,而且比我在自己工作生涯中曾经预想过的还要近。”
学会现实世界的思维方式
让搜索引擎能够理解现实世界,这是阿米特开发智慧搜索的第一步,也是Knowledge Graph“秘笈”里的第一式。
多年来,搜索都是字符串的匹配,所以在搜索的“眼”里,“KEY”这个单词不过是一个由3个字母组成的字符串,而并不是一个在现实世界中具有“钥匙”含义的单词。而“Kings”这个单词,搜索引擎也并不明白“Kings”不仅可以解释为“国王”,也可以指代NBA一支名叫“Sacramento Kings(萨克拉门托国王队)”的篮球队,还可以表示洛杉矶一支曲棍球队——Los Angeles Kings。
“计算机擅于将文件中的一系列字母或字符串进行匹配。”于是,在搜索框输入“Kings”之后,搜索引擎返回的是一系列但凡包含“Kings”的文章,里面既有表示“国王”的意思,也有指代Sacramento Kings篮球队和Los Angeles Kings曲棍球队。这不是用户想要的结果,也不是Google工程师想要的。“在研究中我们慢慢发现,用户要求结果更直接、更准确,而Google也一直希望能够为用户更直接、更准确地提供相关的内容和答案。” Google搜索产品经理丁晨说。
解决的办法就是让搜索引擎能够理解现实世界里各类实体的意思。阿米特说:“我们要教搜索引擎像人类那样理解。”为此,Google通过建立Knowledge Graph知识体系来让搜索引擎看起来像人类的大脑。Knowledge Graph就像维基百科一样建立词条,它也从Freebase、维基百科和其它来源获取专业的信息词条。目前,Knowledge Graph知识体系中包含超过5亿个词条,不同事物之间的关系超过35亿条。
于是,今天输入“Kings”这个单词之后,搜索引擎仍会返回包含“Kings”的网页链接,虽然看上去没有差别。不过,当用户第二次选择明确“Kings”是指代其中一个意思时,搜索引擎就会自动筛除其它两个意思的网页。因为搜索引擎已经明白了你的意思。
 
给你最直接的回答
搜索引擎能够理解现实世界中的实体,而不仅仅把它当成一个字符串,然而这对于出招的人们来说显然还是初级的。正如丁晨所说:很多时候用户的搜索不仅是一个单一的概念,他可能是想查找一系列的电影或人物,这时候这种类型的搜索请求就会变得更加复杂。
不过,在已经理解了实体的基础上,回复复杂的问题对于阿米特的团队来说虽然有难度,但是并不是毫无破绽。以“2012年的动画电影”这一搜索请求为例,用户想找到的是2012年的动画类的电影,是一个包含了多个实体,具有多个定语的问题,用户希望得到更直接的回复。
通过对“2012年的动画电影”的举一反三,搜索请求不仅局限于电影领域。但是,像其他的人物、动物、建筑物、旅游景点等等,Knowledge Graph都已经有所涉及。柴颖说:“Knowledge Graph给了我们一种力量,它不单对简单的数据进行处理,而且理解了这些事物之间关系的理解,这种强大的力量是能够使我们的搜索变得越来越重要。”
人工智能的未来
当搜索引擎理解了现实世界的实体,回答了一些简单的问题,更大的挑战在于:当问题变得更加复杂后该怎么办?
“所谓的将数据转化成信息,我们指的是从原始数据的海洋中找到表面相关联的事实。Google搜索已经开始在这么做了——我们提取网页、视频、图像等原始数据,将它们整理成与你的查询相匹配的相关信息。”阿米特说,“接下来,我们希望能够提取信息,并使其更容易消化。在未来,你问Google一个问题,我们会直接提供答案,而不只是仅仅给你相关的链接。”
这也就是Knowledge Graph这本“秘笈”的最高境界,阿米特承认:现有的搜索技术无法处理“带有防虫喷雾的蚊帐是不是比不带防虫喷雾的蚊帐更有效?”这样的问题。如果从未有人问过一模一样的问题,那么就得不到理想的答案。因为这类问题的回答不仅仅要求编写这些信息——而且需要现实世界的“实体”知识,以及它们的相互关联性。 “人类的大脑天生就能处理这些,但对于电脑,这就涉及到人工智能的问题。” 阿米特说。
阿米特•辛格哈尔(Amit Singhal)负责Google搜索的开发工作。他从一名学术研究员成长为 Google 工程师,在搜索领域积累了20多年的工作经验。阿米特的研究领域涵盖信息检索及其在网络搜索中的应用、网络图形分析以及搜索用户界面。
记者:Google现在所做的与语义搜索有何不同?
阿米特:Knowledge Graph可以使我们在搜索结果中展示具有含义的,在现实世界存在的实体。比如你搜索“taj mahal”,它可以指泰姬陵,也可以是一位印度的音乐家。在Knowledge Graph中点击音乐家,你便会获得一位名为“taj mahal”的音乐家的相关信息。要缔造未来的搜索引擎,我们要教搜索引擎像人类那样理解。Knowledge Graph便是我们做出的一次努力,让搜索向智慧模型更近一步。
记者:我们现在所谈的是初步进展,那接下来会有哪些改进?
阿米特:语言理解仍是未解之题,语音识别也是极具挑战性的,我们还需要做出很大改进。
记者:推出中文或其它语言版本的Knowledge Graph有明确时间表吗?
阿米特:我们想让全球用户都可以使用Knowledge Graph,但是要开发所有的语言版本是非常具有挑战性的。比如:在印度,关于电影的最多搜索请求的应该是宝莱坞电影,而在英文中,最多搜索结果应该是好莱坞电影。当新语言介入时情况便会更加复杂,我们正在努力突破国界。愿景是美好的但是过程是艰辛的。
记者:有了Knowledge Graph后的Google与Yahoo等其它搜索引擎相比进步了多少呢?
阿米特:我们正在全速前进以构建搜索的未来——其他公司也在朝着他们的愿景奋斗。我们的梦想是打造星际迷航式计算机,我们相信,有了Knowledge Graph,我们离这个梦想又近了一些。
记者:我们希望Knowledge Graph能够回答提出的所有问题,请问这个目标是否需要很长一段时间才能够实现?
阿米特:答案就在互联网知识库内。有了Knowledge Graph,你不用苦苦搜索信息,眨眼之间你就能找到自己想要的信息,这是我们的愿景。
当我们在Google的搜索框敲下一个个越来越复杂的问题时,一场逐级变难的智力较量开始了。背后接招的是Google科学家兼高级副总裁阿米特·辛格哈尔(Amit Singhal)以及他的搜索团队。
阿米特想出的办法:“如果人类拥有像电影《星际迷航》里的Kirk船长那台能够即刻回答任何问题的计算机的话,所有问题就迎刃而解了。”听上去,这是一个以不变应万变的好办法,可是靠谱吗? 近日,Google将搜索新功能Knowledge Graph推广到了所有英语国家,阿米特在接受本报记者采访时说:“我们离这个梦想又近了一些,而且比我在自己工作生涯中曾经预想过的还要近。”
《星际迷航》中的智能电脑给了谷歌很大灵感
学会现实世界的思维方式
让搜索引擎能够理解现实世界,这是阿米特开发智慧搜索的第一步,也是Knowledge Graph“秘笈”里的第一式。
多年来,搜索都是字符串的匹配,所以在搜索的“眼”里,“KEY”这个单词不过是一个由3个字母组成的字符串,而并不是一个在现实世界中具有“钥匙”含义的单词。而“Kings”这个单词,搜索引擎也并不明白“Kings”不仅可以解释为“国王”,也可以指代NBA一支名叫“Sacramento Kings(萨克拉门托国王队)”的篮球队,还可以表示洛杉矶一支曲棍球队——Los Angeles Kings。
“计算机擅于将文件中的一系列字母或字符串进行匹配。”于是,在搜索框输入“Kings”之后,搜索引擎返回的是一系列但凡包含“Kings”的文章,里面既有表示“国王”的意思,也有指代Sacramento Kings篮球队和Los Angeles Kings曲棍球队。这不是用户想要的结果,也不是Google工程师想要的。“在研究中我们慢慢发现,用户要求结果更直接、更准确,而Google也一直希望能够为用户更直接、更准确地提供相关的内容和答案。” Google搜索产品经理丁晨说。
解决的办法就是让搜索引擎能够理解现实世界里各类实体的意思。阿米特说:“我们要教搜索引擎像人类那样理解。”为此,Google通过建立Knowledge Graph知识体系来让搜索引擎看起来像人类的大脑。Knowledge Graph就像维基百科一样建立词条,它也从Freebase、维基百科和其它来源获取专业的信息词条。目前,Knowledge Graph知识体系中包含超过5亿个词条,不同事物之间的关系超过35亿条。
于是,今天输入“Kings”这个单词之后,搜索引擎仍会返回包含“Kings”的网页链接,虽然看上去没有差别。不过,当用户第二次选择明确“Kings”是指代其中一个意思时,搜索引擎就会自动筛除其它两个意思的网页。因为搜索引擎已经明白了你的意思。
 
给你最直接的回答
搜索引擎能够理解现实世界中的实体,而不仅仅把它当成一个字符串,然而这对于出招的人们来说显然还是初级的。正如丁晨所说:很多时候用户的搜索不仅是一个单一的概念,他可能是想查找一系列的电影或人物,这时候这种类型的搜索请求就会变得更加复杂。
不过,在已经理解了实体的基础上,回复复杂的问题对于阿米特的团队来说虽然有难度,但是并不是毫无破绽。以“2012年的动画电影”这一搜索请求为例,用户想找到的是2012年的动画类的电影,是一个包含了多个实体,具有多个定语的问题,用户希望得到更直接的回复。
Google搜索技术领队柴颖介绍说:“如果有人做了一个关于2012年的动画电影的统计,然后把它放到网上,你就有可能直接获得这个网页的链接,从而获得答案。但是如果没有人做这样的统计,用户就得不到一个很精确的答案。”在这样的情况下,Google搜索引擎就会通过Knowledge Graph采集互联网上讲到不同的动画电影,并且在建立数据库的时候集中对事物进行理解。比如说:某个人、某个电影它有哪些属性,它有哪些跟其他事物之间的关联。
于是,当用户输入“2012年的动画电影”的搜索请求时,基于对实体的理解,搜索引擎完全理解“2012”、“动画”、“电影”这三个关键词的意义。通过后台的一些分析和处理,搜索引擎会了解到用户想查找的是动画类的电影,而且是在2012年上映的。柴颖说:“搜索引擎会跟据对这些事实的理解,对内容和结果进行筛选,自动整理出一个可能并不存在的信息汇总的东西给用户,这是在网页上生成的最后的答案,而非一个预先写好的网页。”通过对“2012年的动画电影”的举一反三,搜索请求不仅局限于电影领域。但是,像其他的人物、动物、建筑物、旅游景点等等,Knowledge Graph都已经有所涉及。柴颖说:“Knowledge Graph给了我们一种力量,它不单对简单的数据进行处理,而且理解了这些事物之间关系的理解,这种强大的力量是能够使我们的搜索变得越来越重要。”
人工智能的未来
当搜索引擎理解了现实世界的实体,回答了一些简单的问题,更大的挑战在于:当问题变得更加复杂后该怎么办?
“所谓的将数据转化成信息,我们指的是从原始数据的海洋中找到表面相关联的事实。Google搜索已经开始在这么做了——我们提取网页、视频、图像等原始数据,将它们整理成与你的查询相匹配的相关信息。”阿米特说,“接下来,我们希望能够提取信息,并使其更容易消化。在未来,你问Google一个问题,我们会直接提供答案,而不只是仅仅给你相关的链接。”
这也就是Knowledge Graph这本“秘笈”的最高境界,阿米特承认:现有的搜索技术无法处理“带有防虫喷雾的蚊帐是不是比不带防虫喷雾的蚊帐更有效?”这样的问题。如果从未有人问过一模一样的问题,那么就得不到理想的答案。因为这类问题的回答不仅仅要求编写这些信息——而且需要现实世界的“实体”知识,以及它们的相互关联性。 “人类的大脑天生就能处理这些,但对于电脑,这就涉及到人工智能的问题。” 阿米特说。
这似乎又回到了阿米特最初的梦想:拥有一台像电影《星际迷航》里的Kirk船长那台能回答任何问题的计算机。阿米特和他的团队正在将Google搜索引擎打造成为这样一台机器。“这就是我们目前正在尝试的方向,将搜索引擎变成一个知识引擎——未来的某一天实现智慧引擎。”
 
对话阿米特
我们的梦想是打造星际迷航式计算机
阿米特•辛格哈尔(Amit Singhal)负责Google搜索的开发工作。他从一名学术研究员成长为 Google 工程师,在搜索领域积累了20多年的工作经验。阿米特的研究领域涵盖信息检索及其在网络搜索中的应用、网络图形分析以及搜索用户界面。
记者:Google现在所做的与语义搜索有何不同?
阿米特:Knowledge Graph可以使我们在搜索结果中展示具有含义的,在现实世界存在的实体。比如你搜索“taj mahal”,它可以指泰姬陵,也可以是一位印度的音乐家。在Knowledge Graph中点击音乐家,你便会获得一位名为“taj mahal”的音乐家的相关信息。要缔造未来的搜索引擎,我们要教搜索引擎像人类那样理解。Knowledge Graph便是我们做出的一次努力,让搜索向智慧模型更近一步。
记者:我们现在所谈的是初步进展,那接下来会有哪些改进?
阿米特:语言理解仍是未解之题,语音识别也是极具挑战性的,我们还需要做出很大改进。
记者:推出中文或其它语言版本的Knowledge Graph有明确时间表吗?
阿米特:我们想让全球用户都可以使用Knowledge Graph,但是要开发所有的语言版本是非常具有挑战性的。比如:在印度,关于电影的最多搜索请求的应该是宝莱坞电影,而在英文中,最多搜索结果应该是好莱坞电影。当新语言介入时情况便会更加复杂,我们正在努力突破国界。愿景是美好的但是过程是艰辛的。
记者:有了Knowledge Graph后的Google与Yahoo等其它搜索引擎相比进步了多少呢?
阿米特:我们正在全速前进以构建搜索的未来——其他公司也在朝着他们的愿景奋斗。我们的梦想是打造星际迷航式计算机,我们相信,有了Knowledge Graph,我们离这个梦想又近了一些。
记者:我们希望Knowledge Graph能够回答提出的所有问题,请问这个目标是否需要很长一段时间才能够实现?
阿米特:答案就在互联网知识库内。有了Knowledge Graph,你不用苦苦搜索信息,眨眼之间你就能找到自己想要的信息,这是我们的愿景。
本文出自2012-08-27出版的《电脑报》第34期 A.新闻评论
(网站编辑:吴融)
读者活动
48小时点击排行
编辑推荐
论坛热帖
网站地图 | 版权声明 | 业务合作 | 友情链接 | 关于我们 | 招聘信息
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sina.com 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号