展会信息港展会大全

AI进化受阻:搜索引擎仍未等到举杯时刻
来源:互联网   发布日期:2024-11-23 06:40:25   浏览:65次  

导读:文 | 逐浪生活中,越来越难找到打开搜索引擎的理由了。吃饭有点评软件,出行有导航地图,看新闻有资讯APP,购物有网购平台,聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的APP。传统搜索引擎的优势荡然无存,处境尴尬。而AI浪潮的来临,让传统搜索有了新的进化方向。OpenAI正式上线ChatGPT的实时搜索功能;谷歌宣布其“双子座”AI模型将整合谷歌搜索功能; ......

文 | 逐浪

生活中,越来越难找到打开搜索引擎的理由了。

吃饭有点评软件,出行有导航地图,看新闻有资讯APP,购物有网购平台,聊天有社交媒体。越来越多搜索行为正从传统搜索框转移向一个个独立的APP。

传统搜索引擎的优势荡然无存,处境尴尬。而AI浪潮的来临,让传统搜索有了新的进化方向。

OpenAI正式上线ChatGPT的实时搜索功能;谷歌宣布其“双子座”AI模型将整合谷歌搜索功能;百度的AI智能回答,对文心大模型日均调用量超6亿次。

一场AI时代的搜索新“战事”正在上演,但AI搜索能否在用户生活中,提供足够“必要”的价值,仍是一个值得商榷的问题。

AI进化受阻:搜索引擎仍未等到举杯时刻

被抛弃的传统搜索引擎

一直以来,百度都长时间占据着中国互联网搜索领域的主导者位置。但随着用户搜索行为的多元化,传统搜索引擎的用户正在逐渐流失。

年轻人们在微博搜明星动态、热点新闻,在抖音和快手消耗琐碎时间,在小红书寻找经验攻略。

今年6月,钉钉总裁叶军曾在一场企业家论坛上谈到搜索变革,他表示,搜索场景已经被变革掉了,百度也得马上跟进,如果再不跟进,大家也不会用百度了。

搜索的前提,是平台有足够的内容,满足用户的信息需求。PC时代,所有内容通过网页展示,传统搜索引擎依赖爬虫技术,抓取互联网上的网页,然后进行清洗和排序。当用户输入查询的词条后,搜索引擎会根据其算法对网页进行排序,并将结果展示给用户。爬虫抓取的信息数量越多,质量越好,传统搜索引擎的体验就越高。

而在移动互联网时代,互联网入口变为手机上一个个APP,各APP厂商不愿意再将左右生死的流量权,交给搜索引擎,便高筑墙,深挖沟,将爬虫挡在门外,并加强运营机制,将优质内容、独家内容留在门内。于是,移动互联网时代,各APP内容孤岛化严重,信息从此不再“互联”。

流量的走向,重塑着新的互联网格局。但传统搜索处境下滑的同时,各独立APP的搜索量与日俱增。

小红书有将近70%的月活用户有搜索行为,1/3的月活用户打开小红书的第一件事就是直奔搜索;2023年,抖音生活服务搜索GMV增长254%,商品搜索GMV增长143.8%;2024年第二季度,使用快手搜索的月活跃用户近5亿,同时单日搜索次数同比增长超20%。更不用说微博的热搜,凭借搜索,缔造了一个又一个顶流话题。

就目前而言,传统搜索引擎已经落后于时代,其本质原因,在于搜索引擎并不生产内容,只是内容的搬运工,而搜索内容的需求已经被内容方满足。

生成式AI的诞生,给了传统搜索引擎更沉重一击,人们不再需要在搜索结果中,寻找所需信息,AI已可以通过自然对话方式,代替思考,提供答案。

人们直接跳过“搜索”,直达信息的彼岸。

之于搜索引擎,这是鹤顶红,却也是回魂丹。受威胁最大的传统搜索引擎,成为生成式AI最忠诚的拥趸。

2023年初,微软宣布与OpenAI合作,推出了由AI驱动的Bing搜索引擎和Edge浏览器。

同年5月,谷歌推出由生成式AI驱动的搜索引擎。谷歌称,这是谷歌搜索引擎多年来最大规模的一次革新。

2023年8月,昆仑万维推出了国内第一款AI搜索引擎,2个月后,百度也将旗下的简单搜索升级为AI互动式搜索引擎,在搜索页面内置文心一言大模型技术。

今年6月,360公司正式发布了“360AI搜索”和“360AI浏览器”;同一个月,知乎发布AI搜索产品“知乎直答”;7月,夸克升级了“超级搜索框”,推出以AI搜索为中心的一站式AI服务。

行业出现了“无AI,不搜索”的趋势,并且各大厂商为AI搜索赋予重任。

生成式AI,正在生成传统搜索的未来。

AI搜索难当大任

AI搜索引擎与传统搜索引擎有着显著的区别。

传统搜索引擎像一个图书馆的目录卡,用户需要提供书的具体书名或作者,才能找到书的位置。AI搜索引擎更像一个图书管理员,用户只需要告诉它大概的信息,它就能找到相关的书,并总结书中的主要内容。

而且,AI搜索还不局限于文字,能理解和索引视频、图片、语音等内容。还能实现了AI写作、AI文件总结等操作。

但AI搜索的发展似乎并不顺利。以上一切全新体验的前提,在于搜索的结果,务必精准。

谷歌 AI搜索上线不久后就闹出了不少笑话。很多用户都反映,AI搜索在“胡言乱语”。

一位用户向谷歌AI搜索提问“我每天应该吃多少块石头”,得到的回答是“根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头”。

在今年的百度世界2024大会上,百度发布检索增强的文生图技术iRAG,可结合百度搜索的图片资源,消除大模型,生成各种超真实的图片,“去除了机器味儿”。

而在媒体复刻发布会所展示的“爱因斯坦与天坛合影”指令时,大模型仍然出现错误幻觉:原本三层护栏,变成了四层甚至五层。

AI进化受阻:搜索引擎仍未等到举杯时刻

就目前而言,AI搜索生成答案的准确性和可靠性依旧难以保证、容易出现事实错误,且生成的内容缺乏深度、无法提供有效的溯源。

诺贝尔经济学奖得主保罗克鲁格曼曾在社交媒体上批评了当前的人工智能,称它比没用还糟糕,“有很多关于谷歌和其他搜索引擎退化的消息。这是真的,让我的工作变得困难”。

同时,AI的滥用还在加剧互联网信息的混乱,产生很多无效信息、虚假信息,混淆了正常搜索的结果。

今年1月,江西南昌的一家MCN利用AI工具日产7000篇文章。文章内容真假混杂,甚至引发了网传西安有巨大爆炸声的谣言。

温州公安最近也抓捕了一位网络作者。该作者利用AI工具批量改写网络文章,发布到信息平台从而获得文章收益,最终造成了诸多不良的社会影响。

伴随着AI工具的普及,AI制造的无用、虚假信息的数量也越来越多。

清华大学新闻学院的报告称,近一年来,经济与企业类AI谣言,增速高达99.91%。谷歌研究人员也发现生成式AI造成的虚假信息正在互联网上泛滥成灾。

虽然,目前AI引发的内容风险还没有上升到“威胁生存”的地步,但按照AI的发展趋势来看,这种伪造或篡改的信息会越来越多。

最终导致互联网的信息更加混乱,使得真实与虚假之间的界限模糊。

甚至AI自己,也将在越发低质的语料库中停止进化与生长。

信息荒漠时代

随着 AI 生成的错误和无意义的信息会不断累积,互联网的错误、无用信息占比会逐步增加。

清华大学新闻学院新媒体研究中心主任、跨学科知名学者沈阳说,AI生成的内容急剧增加,大量自媒体文章的内容由AI自动生成,而AI幻觉产生的错误就夹杂在这些文章当中,这也会造成整个互联网的内容质量进一步下降,导致数据质量的整体下降。这种现象被称为“数据退化”。

AI的训练和学习需要大量的网络信息,但大量虚假和无意义的信息只会让AI陷入混乱,产生错误观念。

不止如此,AI除了要面临劣质内容的侵害,还面临优质底层信息的短缺。

研究公司 Epoch AI表示,到2028年,文字资料将会被消耗殆尽。而这些数据是人类在在过去几个世纪里,创作的大量文字、视频。

也有人试图用AI生成的信息训练AI,但结果并不美好。国外的科学家发现,如果 AI 只学习其他 AI 生成的内容,那么经过几代训练后,AI 将输出无意义的垃圾信息。

他们把这种现象称为“模型崩溃”。

当前正处于信息大爆炸时代,我们所有人都被大量的信息所包围,但是对于AI而言,这是一个数据匮乏的时代。

对AI而言,谁能帮助AI摆脱信息匮乏的窘相,谁就掌握了AI发展的未来。为此,OpenAI、Anthropic、百度等公司都在积极开发更优质的合成数据,以此克服挑战。但大多数学者都持悲观态度。

今年11月,有外媒报道,OpenAI下一代旗舰模型“猎户座”(Orion)的性能提升幅度,小于GPT-4相对GPT-3的提升。

其创始人奥特曼曾表示,可能不会把新模型命名为GPT-5。

多位专家劝说AI公司停止训练大模型,“如果当前趋势持续,人工智能很快就会耗尽其可用的训练数据。面对这种情况,AI公司可以选择停止追求规模更大、更复杂的模型。”

AI是当前互联网进步的主要动力之一,尤其是对搜索引擎而言,谁能突破AI的限制,谁就掌握了搜索市场的未来。

只是,这杯庆功酒遥遥无期。

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港