东拉西扯:自然语言搜索又来了
在网上混了10年,“自然语言搜索”这个炒作专用词,早就让人麻木。从Excite,到Ask Jeeves,到Accoona,再到最近嚷嚷得很大声的Powerset,画饼一张摞一张,自然语言搜索从来没真正实现过。资深搜索引擎观察家Danny Sullivan说,自然语言搜索总能引起两类人关注:完全不懂搜索的人或从来没听说过自然语言这一咒语的人。鼓噪者通常会这么做:
Powerset当然不例外,它先告诉你,现有的搜索引擎根本无法区分“为孩子写的书”、“孩子写的书”和“有关孩子的书”("book for children", "book by children", and "book about children")之间的区别。该公司CEO Barney Pell在自己的blog上很有力地批判了现有搜索引擎的“坏”,当然也顺便讴歌了自然语言搜索的“好”。
Powerset的炒作不限于此,他们还握有大量吸引眼球的武器。比如,Powerset正在秘密研发,其目标是打败Google,改变搜索产业的内核,他们已经拿到了1000万美元投资,他们的投资者中有Esther Dyson这样的如雷贯耳的名字……
我并非完全不信任自然语言搜索,我只是不相信“革命”这种东西的有效性。基于关键词的搜索技术的确不完美,但这种技术却是迄今为止最有效、成本最低的信息查询方式。输入几个关键词,回车,结果就列在那儿了。Sullivan把这种搜索用户的行为模式称之为“搜索的DOS”(DOS Of Search),它已经成为人机对话的一种基本模式。输入一个长长的句子,或者在显示结果之前先要从一长排列表中选取某个范围,显然违反了用户的行为习惯。
而且我不相信,让用户输入一个语句,搜索引擎就能更好地理解用户的意图。对搜索结果来说,语镜很重要。但一个句子相比几个关键词,恐怕并不能提供一个更好的语镜。如果是为了更好地理解用户意图,干吗不让用户就其想搜索的内容写一篇论文呢?为了让用户输入更多的内容,搜索框是不是该改成一个大大的文本框呢?
Sullivan说得好,Google打败它之前的搜索引擎,靠的是改变机器一端,而不是改变用户一端。Google只是让搜索结果变得更有用,而没有试图改变用户的搜索行为本身。
而且,自然语言搜索在某种意义上,就像机器翻译一样,需要改变一个算法打天下的思路。当你有了大量的已索引数据和用户行为数据,基于对这些数据的统计、归纳、分析,你就能更好地理解用户的搜索意图。所以,即使就自然语言搜索本身来说,我也认为,优势在Google一边,而不是Powerset一边。
我猜想,Powerset可能确实有它的独门绝技,但VC投资它,肯定不会是指望出现另一个Google。更大的可能,是作为对现有搜索引擎的一种补充,它有可能被GYM中的某个大头收购。不过,Powerset产品还没拿出来,就先炒,很有可能适得其反。
归类于: 0.1: 东拉西扯 — keso @ 07:39
19条评论
自然语言,大概就是像爱问这样的了。
要是靠机器来回答的话,有点扯
nings —— 2006-10-07 @
自然语言是人工智能的一个分支。
人工智能又是搜索的一个方向。
当自然语言发展的时候,我们的人机界面将能更友好,不须手动输入,可以在不方便手工输入的情况下进行搜索。比如机器人专家…
ocde —— 2006-10-07 @
to ocde:
像你说的那样,是三五十年后的事吧。
nings —— 2006-10-07 @
老大,有错别字……
Raine —— 2006-10-07 @
Powerset?瞎撤!
这才是真正的自然语言搜索,可惜有些政府不让推,http://media.news.hexun.com/1980_1796141A.shtml
http —— 2006-10-07 @
等着人工智能的发展吧
华子 —— 2006-10-07 @
自然语言搜索是个伪命题。
Hong Xiaowan —— 2006-10-07 @
语镜
asd —— 2006-10-07 @
check feedback
沧海笑一声 —— 2006-10-07 @
疑问:
一。洪哥为什么说自然语言又回来了呢,因为Powerset在闹?Powerset产品没出来,怎么评判呢?(好象我和您讲客观了,哈)
二。自然语言是人工智能的一个分支,人工智能又是搜索的一个方向;那么社会化搜索呢,模糊搜索呢,谁给着大致的轮廓。
三。那么searchmash呢,人说这是google的?
点解(手牵手) —— 2006-10-08 @
说自然语言是伪命题的?谁又将为这种胡说八道的后果承担责任呢?
http://www.aisou.com是早都提供过公开测试,而且有不少人用过,故意涂抹真相的人真不知道什么用心.
http —— 2006-10-08 @
传说中的"第三代搜索"
比Google还"牛"
互联网已经跟娱乐圈差不多了
Bestwyw —— 2006-10-08 @
咕谷
,个性上网,颠覆上网习惯,建立完全是自己的上网主页
RSS订阅,播客多媒体订阅,个人网址收藏,音乐收藏,实用功能定制,拖拉管理模块
asd2 —— 2006-10-09 @
反恐24小时看下来,人傻了不少;里面关于搜索的行为大有文章可做,如里面的嫌犯肖像比较功能,如果计算机处理速度成本大白菜到能实现剧集里的那样,未来在网上图片智能比较引擎会是搜索的一个重要发展方向,图片比较不仅仅是现在的exif参数而是象素上的匹配度识别
pi —— 2006-10-09 @
不评
vazi —— 2006-10-09 @
衡阳百姓论坛欢迎你
衡阳人自己的论坛,雁城动态,影音娱乐,情感天空,同城交友.
斑竹开放申请中.
注册会员并向朋友宣传本论坛赠送QQ币,抽奖中纪念品.
衡阳百姓论坛欢迎你 www.hybx.com —— 2006-10-09 @
实际上很多时候我自己都不知道要搜索的到底是孩子的书还是孩子写的书,自然搜索还真是“善解人意”。。。
mhye —— 2006-10-10 @
自然语言是未来的一种趋势,不应该去否定它的存在!
如果把自然语言表现在计算机语言上,主要是看分词、语义、句法上做一些技术上的改成;我认为这是有可能发生的事;现在都可以以关键词作为主流,那么以后以语句做为主流的一种搜索方式;也未尝不可呀!
真正能改变科技的发展,不是十年就能解决的;有可能需要更长的时间去等待!
否则,科学的发展,就是显示出自己的浅短的眼光!
天使心 —— 2007-02-09 @
是孩子的书还是孩子写的书?建议把所有可能都列出来,或者列为语病,或者以后都发明一种通用的机器世界语
bravo_0532 —— 2007-03-22 @