展会信息港展会大全

谷歌三大法宝:知识图谱、语音搜索和Google Now
来源:互联网   发布日期:2015-01-19 10:53:31   浏览:14039次  

导读:谷歌为保持其在搜索领域的主导地位,不断开拓革新,发展形成了知识图谱、语音搜索和Google Now这三个重要的组成部件。...

谷歌为保持其在搜索领域的主导地位,不断开拓革新,发展形成了知识图谱、语音搜索和Google Now这三个重要的组成部件。

1月18日消息,美国网站medium.com日前刊登文章,讲述谷歌为保持其在搜索领域的主导地位,不断开拓革新,发展形成了知识图谱、语音搜索和Google Now这三个重要的组成部件。以下为文章主要内容:

天空为什么是蓝色的?这是小孩常常会提出的一个问题,而大部分家长都无法独立解答。在不太久以前,寻找正确的答案至少需要求助于百科全书,甚至意味着跑一趟图书馆。在最近这几年,父母只需要跑到电脑前,登陆谷歌(Google),评估与该问题相关的链接,快速浏览解释,深入理解这个问题,从而给孩子们满意的答复。

但是到了2015年,即使这个看似已经提速的过程还是未能达到预期。一方面,问题不只是被拼写到搜索框中,更多是直接向移动设备口头提出。另一方面,虽然从经过排列的链接清单中选择最具相关性的一条仍然是大部分问题的有效解决办法,但那些获得明确答案的提问者开始希望迅速得到答案。一旦谷歌不能做到,他们就感到失望,甚至生气。

因此……“谷歌,为什么天空是蓝色的?”(注:语音提问)

Android手机只花了不到一秒钟就对这个口头问题作出回应——以一种可以让人理解但又明显自动化的音调。

“在晴朗、无云的白天,天空之所以是蓝色的是因为大气中的微粒对来自太阳的蓝色光散射能力高于红色光。”

谷歌搜索团队负责人阿密特·辛格哈尔(Amit Singhal)利用这个解释来帮助证明,迄今为止全球最受欢迎的搜索引擎在过去几年是如何进行自我改革的。在过去几年我对他进行的采访中,辛格哈尔将推行重大调整比喻为在半空飞行过程中更换发动机,因为谷歌将其算法“飞行计划”更改为改善排名、增加新的信息材料(如图片、书本或者旅行),或者在用户还没有输入完问题之前就开始进行搜索。不过,在过去几年,谷歌不仅改变了飞机的发动机,还改变了驾驶舱的大部分。移动端不可阻挡的势头(在2015年手机和平板电脑搜索量可能超过PC搜索量)促成了一些更为重大的变革:鉴于出现如此重大的变化,需要对未来的使命进行重新考虑。

他表示:“我们都必须深入地考虑,在已经进入移动化的世界里,搜索真正意味着什么。想到这个问题的时候,我们头都大了。”

谷歌三大法宝:知识图谱、语音搜索和Google Now

谷歌三大法宝:知识图谱、语音搜索和Google Now

不断变革

在过去17年历史里,谷歌搜索不断进化,在这个过程中该公司经常发表庆祝性的博客文章并偶然进行新闻发布会(不过一旦要对这些变革进行量化,谷歌又恢复到一贯的“惜字如金”——多年来,该公司对其用于帮助排列搜索词条的提示的数量描述为“超过200条”)。因为搜索仍然是该公司的旗舰产品——并且支持搜索广告的平台仍然是谷歌的主要收入来源——谷歌一直在努力改善这个数十亿人用以寻找信息的途径。在过去几年,通过短期和长期努力,该公司加快了这种节奏,以期领先于竞争对手。

用户不应错过部分变革。搜索速度更快,内容更加新鲜,也更具社交性(不过这是在Google Plus推出后,当时该公司大力推广“社交搜索”,现在大家已经很少听到这个口号了)。谷歌搜索的页面也不一样了。谷歌搜索体验负责人之一塔玛尔·耶霍舒亚(Tamar Yehoshua)表示: “在早期,页面较为简洁——只有主页面和搜索结果。现在,在搜索结果页面上有很多不同的功能和产品。”

展望未来,谷歌一直在扩展人工智能的边界,从而打造一个巨型“大脑”——能够更好地理解用户和世界、甚至在人们还没提问之前就列出准确结果。

但是部分批评者指出,谷歌搜索正在走下坡路。他们埋怨垃圾结果太多,或者对较新信息的过分强调导致较早前出现但更具相关性的结果被阻挡。大家都听说过,谷歌自夸的“10个蓝色链接”( ten blue links)已经被大量令人迷惑和谋求私利的功能(如购物、新闻及多媒体结果)所污染(另一方面,谷歌在美国最大的竞争对手微软必应吹嘘称,谷歌仍然非常依赖于10个蓝色链接)。美国新闻聚合网站Buzzfeed去年一则新闻的标题指出,“我们正进入现代历史最糟糕的时期”,接着直接指责称“谷歌的实用性正在降低”。

辛格哈尔对此作出严词回应。“事实完全相反,”他表示。“我调查了这些投诉,发现当中存在一些怀旧情绪。我们现在的搜索远好于去年或者两年前。”

辛格哈尔的评论表明了谷歌搜索的关键人物现在所具有的自豪感和信心。在几年前,尽管谷歌认为其搜索质量无人能比,但也存在真实的忧虑——担心该公司的统治地位可能被削弱。谷歌当时处于Facebook恐慌的阵痛之中。“我们不拥有这些联系,”辛格哈尔在2011年告诉我,显然他指的是Facebook的网络(Facebook禁止谷歌抓取其数据)。“我不知道信息在这些网络里如何流动。”在这种躁狂症最严重的时期,辛格哈尔在谷歌担当类似于凶事预言家的角色,在某个时刻拦住该公司的社交业务负责人维克·冈多特拉(VicGundotra),高声指出这些封闭网络可能会威胁谷歌的存在。辛格哈尔在接受采访时跟我说,如果有人他向提出这种威胁与谷歌在搜索领域无人能敌的威力不可相提并论,他会回答说:“在我小时候,泛美航空公司(Pan Am,1991年倒闭)也是看起来非常强大的。”

不过实际上这些担心有点过头了;现在不可能有人将谷歌比喻为这家已经破产的航空公司。Facebook的“图谱搜索"(Graph Search)仍然是刚起步的产品,但发展势头缓慢,对谷歌造成的冲击较校必应虽然在搜索质量上可称得上是受人尊敬的竞争对手,但所持市场份额仍然不足五分之一。虽然Google Plus的成绩未及公司预期,未能最终形成一款轰动的社交网络产品,但的确成功地吸引了很多搜索用户注册加入。

统治地位

谷歌现在面临的威胁并不是由强劲对手所组建的封闭网络,而是搜索现在似乎已经从网络迁移至各款应用程序(向移动端转移也代表了谷歌的搜索广告收入受到挑战)。谷歌认为这种应用内部信息的崛起是可以被其征服的——毕竟,移动开发者也希望自己的信息能够被世人了解。自从2013年秋天以来,谷歌启动了一个名为App Indexing的项目,希望将移动应用程序内的数据集中到其总索引。不过应用索引目前并不包括iOS应用,这是一个比较大的问题。App Indexing产品经理劳伦斯·张(Lawrence Chang)表示:“仍然有一条很长的路要走。不过我们已经打造了基础性的结构单元。”

不过现在,网络应用世界的挑战并没有影响谷歌在搜索领域的统治地位。数据仍然大得令人惊讶。谷歌每天接受超过30亿条搜索词条。在美国,三分之二的搜索使用谷歌——在全球范围内,该公司仍然享受类似的统治地位(最近市场份额降低主要不是因为搜索质量问题,而是雅虎与火狐达成协议,取代谷歌成为该浏览器的默认搜索引擎)。甚至更为令人印象深刻的是,谷歌处理超过80%移动搜索。2013年谷歌遭遇持续5分钟的宕机事件,网络流量减少40%。

没有任何一家搜索领域竞争对手能达到谷歌的基础设施、人才储备或者经验。没多少企业能有谷歌的雄心壮志。因此尽管有关谷歌的新闻报道出现了监管问题、谷歌眼镜的幸运与不幸以及YouTube的青少年超级巨星,搜索一直进行着稳定且高强度的革新。

从某些方面看,这些革新只是延续谷歌自最初以来对搜索所进行的变革。在微观基础上,谷歌对其算法进行了一些细微调整,在每周一次的搜索质量发布会上对其大加称赞。之后,每2年或3年,其排名系统会出现重大更新,从而在那些与关键字高度相关的企业之间产生赢家和输家。最近一次是在2013年,推出代号为Hummingbird的算法。过去10年,本·戈麦斯(Ben Gomes)一直在搜索部门担任辛格哈尔的副手,他指出谷歌在过去3年对搜索排名进行的调整超过了此前13年。

从各个方面看,最大的挑战一直在于针对从PC向便携设备转移的趋势进行调整。正如很多互联网企业一样,谷歌搜索采用一种以移动为中心的办法。谷歌搜索的主设计师琼·威利(Jon Wiley) 表示:“移动端对我们如何考虑设计产生巨大影响。”在执掌搜索设计领导职位后,他首先做的一样事情是将移动和PC团队整合在一起。最初,这个想法是将大量努力投入到手机端——现在,他表示,完全是关于将搜索视为一种多设备的体验。

知识图谱

重大变革当中,哪项最为意义重大的?谷歌搜索团队对此毫不掩饰。搜索业务负责人辛格尔明确表示:“当然是知识图谱(Knowledge Graph),只要你开始进行打造,就能慢慢了解现实世界。第二是语音输入——因为我不能在这里打字,”他一边说着,一边向手腕上的三星智能手表打手势。“我们还意识到,除了预测外还需要一些科学,这样的话人们就不必总是提出问题,因此我们开发了Google Now。”

知识图谱将全世界的知识打造成一个广大的数据库。语音搜索将语音带到搜索。Google Now在用户提问之前就告知答案。所有这三项都与谷歌对移动端的关注密切相关。这些组成部分——以及它们运作的方式——已经在过去三年帮助对谷歌搜索进行改造:从一个“10个蓝色链接”的投递系统到某些几乎超自然的东西——这个系统的行为并不像计算机,而是一个智能的知识储备库,能够聪明地解译和满足你的信息需求。在你还没有开始予以寻找的时候,它已经完成一切。

谷歌在2010年收购一家名为MetaWeb的公司,该消息并没有引起太多关注。但事实证明这笔并购成为了谷歌搜索史上一项最意义重大的变革的关键。

MetaWeb在2005年由丹尼·希利斯(Danny Hillis)创办,他是一位知名的计算机科学家和企业家。在经营他的公司Applied Minds时,希利斯构想了大量创造性项目,不过他认为MetaWeb项目非常意义重大,因而将其剥离出来成为一家独立公司。MetaWeb公司在2007年成立,是所谓的Semantic Web的首批重大利用成果之一。Semantic Web实际上是一种处理多数据库的办法,经整合后数据库中的信息可被轻松阅读。希利斯说:“我们尝试创造一个全球性的数据库,包含全世界的信息。”由于Metaweb可以扫描互联网来回答问题,因而被广泛视为是谷歌的竞争对手。不过在经过几年的经营以及超过5000万美元融资后,希利斯意识到只有加入一家规模更大的公司——即谷歌——这个想法才能开花结果。

当时,谷歌已经在向用户提问提供一些直接的回答:如果你输入“奥巴马生日”,它会在搜索结果的顶部显示“1961年8月14日”。不过,正如谷歌在2010年7月一篇宣布收购Metaweb的博客文章上解释说,谷歌的搜索引擎未能回答像“美国西岸学费低于3万美元的大学”或“至少夺得过一个奥斯卡奖项的40岁以上艺人”这样的问题。该篇博客承诺Metaweb将帮助谷歌提供这些答案。

产品经理艾米丽·莫斯利(Emily Moxley)从2011年就开始参与到Metaweb项目,她表示:“谷歌收购Metaweb的时候,知道‘物’的概念将成为搜索一个非常重要的部分。我们认为这是快速呈现一些简要事实以及人们所关注事物的有关信息的良好途径。”

在2012年5月,谷歌推出了这些Metaweb材料,将其称为“知识图谱”(Knowledge Graph)。该项目从1200万实体发展至5亿。该产品可以在自认为合适的时候对搜索结果提供补充性的答案:多项有关所搜索主题的关键事实,其位置位于平常的搜索排名的右侧。这看起来有点“手气不错”(I’m feeling lucky)的感觉。

在介绍谷歌如何考虑哪些词条应该获得知识图谱结果时,莫斯利引用了弗吉尼亚州里奇蒙德(Richmond, Virginia)地区的洲际高速公路系统。从西北向佛罗里达州进发的游客应该非常清楚这种情况——在里奇蒙德背部,95号公路出现分叉,驾驶员可以选择继续沿南北主干道行驶并途径市中心,或者选择295号公路,在外围绕过该城市并在里奇蒙德南部再进入95号公路。

她解释说,如果用户提供一个搜索词条,谷歌将其扩展为替代性的形式以及同义词等,之后提供一个算法测试,从而了解它是否与“知识图谱”结果具有相关性。“然后,用户可能会选择295号公路的出口,说‘好,有什么可能的知识图谱内容会对这个词条有用?’——我们搜索所有的文件,给出相关的内容。之后用户再次回到95号公路,我们说‘好,我们认为这些内容足够有用,让我们更显著地呈现这些信息吧’。”

谷歌搜索与“知识图谱”整合的2年多里,该公司继续改善这款产品(谷歌并未正式公布设计“知识图谱”回答的词条比例,不过似乎大约为25%)。最初,“知识图谱”较为动态。不过这款产品逐渐掌握谷歌搜索本身所具有的学习能力,能够分析用户的习惯。莫斯利举了“谁在电影《太空炮弹》(Spaceballs)中扮演Barf?”作为例子,“知识图谱”已经接触了非常多词条,因而知道如何提供涉及演员和电影的图解——并且以非常快的速度完成。

“知识图谱”也在另一个重要领域——新鲜度——取得较大进步。由于谷歌假定对一个问题提供一个正确答案,因此其信息必须与时俱进。否则,答案会是错误的,对用户造成的影响会比没有答案更糟糕。莫斯利表示,“知识图谱”在2012年推出的时候,其中一个实体的变化——例如大众汽车(Volkswagen)决定聘请新的首席执行官——该系统可能要花长达2周来反映这种变化。现在该系统能够在几分钟内处理这些新闻并进行调整。但是她承认,对“知识图谱”而言,这种特定的“大众汽车首席执行官”词条既是成功也是失败。新任首席执行官要几个月后才会正式上任。“知识图谱”仍然展示当前的领导人,不过很多在谷歌输入“大众汽车首席执行官”词条的用户可能寻求的是有关继任者的信息。因此,尽管“知识图谱”是正确的,其回复可能不会令用户满意。

谷歌还需要进行很多改进。首先是增加更多领域和行业;该项目最近增加了汽车、视频游戏及雨果奖(Hugo Award)获奖者的知识。不过她表示,谷歌正尝试找出如何提供更加复杂的结果——不再只是快速事实,还提供更主观、更模糊的联想。“人们不只是对事实感兴趣,”她说。“他们对一些主观性的东西也感兴趣,如该电视节目是否好看。这些东西能帮助将‘知识图谱’提升至新的级别。”这就像谷歌并不希望让用户感觉自己在进行机械搜索,而是咨询一位圣人,这位圣人不仅无所不知而且在文化方面还具有自己的独立见解。


赞助本站

相关热词: Google Now 语音搜索 谷歌

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港