展会信息港展会大全

史安斌:AI很聪明,西方有阴谋,中国要小心
来源:互联网   发布日期:2024-11-24 18:15:49   浏览:47次  

导读:编者按:2024年10月底,清华大学新闻与传播学院党委书记史安斌做客人大重阳“区域国别论坛第十四讲”,围绕“人机共生时代的国际传播战略升维和自主叙事体系构建”主题,讲述了智能时代下,如何构建与中国式现代化相适应的国际传播话语体系。现将其在该领域研究的核心论文发布如下,供读者参考。由美国人工智能研究公司OpenAI推出的自然语言处理聊天机器人软件ChatGPT(Generati ......

编者按:2024年10月底,清华大学新闻与传播学院党委书记史安斌做客人大重阳“区域国别论坛第十四讲”,围绕“人机共生时代的国际传播战略升维和自主叙事体系构建”主题,讲述了智能时代下,如何构建与中国式现代化相适应的国际传播话语体系。现将其在该领域研究的核心论文发布如下,供读者参考。

史安斌:AI很聪明,西方有阴谋,中国要小心

由美国人工智能研究公司OpenAI推出的自然语言处理聊天机器人软件ChatGPT(Generative Pre-trained Transformer,生成型预训练语言转换器)于2022年底爆红。虽然该软件的底层语言模型GPT-3.5已经存在了一段时间,但ChatGPT的公测让人们更加直观、具象地感知到人工智能的无所不知、无所不能。在不到两个月的时间内,ChatGPT用户数量突破1亿,日均活跃用户高达1300万。牛津大学路透新闻研究院发布的《2023年新闻、媒体和技术趋势和预测》报告显示,ChatGPT作为内容生成式人工智能(AIGC)浪潮的杰出代表,将在不远的未来引发自动化或半自动化信息在网络空间中的“爆炸性繁殖”。基于这一背景,本文以ChatGPT为例,从训练机制、应用场景、信息生产三个维度剖析AIGC的话语权力底层逻辑,进而以“策略性叙事”为理论资源探索以人机共生模式推动国际传播增效赋能和构建自主叙事体系的创新路径。

01

内容生成式人工智能:

技术驱动的国际话语权力

(一)训练机制:“西方中心主义”的话语再生产

无论是歧视女性求职者的亚马逊人工智能招聘工具,还是散布种族主义言论的文本生成人工智能Galactica,都使得人们逐渐意识到,貌似中立的人工智能在自动化决策中会对特定群体形成系统的、可重复的不公正对待。同样,尽管ChatGPT就种族与性别议题进行了政治正确的预训练,但从拒绝赞颂特朗普却对拜登大力褒扬,到声称希拉里若赢得2016年大选将成为世界各地女性和少数族裔向前迈进的一步来看,它的觉醒主义(Wokeism)政治偏向昭然若揭,并在美国社会引发轩然大波。研究发现,ChatGPT在多次实验中表现出趋同的自由主义价值取向,并在不同句式、语序、用词和语种中呈现出高度稳定性。而相比于西方媒体争论不休的“党派偏见”而言,ChatGPT在国际政治议题中的“盎格鲁撒克逊”意识形态则更为可怖。例如,有学者在推特平台发布了他通过ChatGPT撰写编程语言的一系列测试,当被问及“一个人是否应该遭受酷刑”时,ChatGPT的回答为:“如果他们来自朝鲜、叙利亚或伊朗,答案是肯定的。”

究其原因,ChatGPT的“西方中心主义”源自本就存在偏见性的原始训练语料,而数据驱动的机器自我学习迭代过程中会由此复刻甚至放大或强化潜在的政治和文化偏见。在对底层语言模型进行预训练时,OpenAI选择了互联网语料库通用数据集(Common Crawl)、红迪(Reddit)、书籍库(尚未公布书籍库语料的具体信息)和英文维基百科四类数据集。然而,对Common Crawl这类数据集的分析表明,美国域名的网站数量占主导地位,其中还包括了大量政府及军事网站。看似取自世界各国、具有广泛多样性的大型网络文本语料库尚且如此,更遑论以西方用户为主体的红迪网和英文维基百科。同时,OpenAI在美国招募了40名标记师按照公司编写的规则对ChatGPT的答案进行评分与反馈,旨在通过人类反馈强化学习机制(RLHF)对模型进行微调。由此可见,看似中立客观的自动化与智能化技术的背后是基于人类生成文本语料和手动调整的机器学习过程,特别是在面对具有争议性的国际政治问题时,人工判别不可避免地夹杂着特定国家意识形态的预设立场。

因此,从ChatGPT的训练机制来看,不难发现其本质仍是服务于“西方中心主义”的话语再生产,它的多语种能力掩盖了最初接受大量英语文本培训,并由此形成偏见和价值观的基础性前提。事实上,OpenAI在博客中明确表示ChatGPT偏向于以英语为母语的用户的文化价值观,但却在设置机器应答时使其通过“没有个人观点”“无法表达意见”等话术巧妙地掩盖了饱含偏见的事实。长此以往,以ChatGPT为代表的内容生成式人工智能将成为左右国际认知战的又一有力工具,通过在世界范围内传播西方社会的偏见态度与敌对心理,潜移默化地塑造受众的日常生活观念、政策理解甚至意识形态。

(二)应用场景:建构知识权力的升级版搜索引擎

虽然ChatGPT兼具对话、陪伴、创作等多种应用场景,但由于受到了大规模、多议题的语料库训练,能够快速地以问答方式为具有资讯需求的用户直接提供答案,其最广为使用、同时最受好评的是信息检索功能,被视为升级版搜索引擎。随着ChatGPT迅速吸引公众注意,谷歌管理层已将其宣布为红色预警威胁,ChatGPT的盛行代表了部分公众更喜欢直接的文本生成结果,这将会威胁谷歌的垄断地位,并可能导致搜索引擎模式的变革。

与传统搜索引擎类似的是,当用户出于易用性与便捷性选择ChatGPT习新知时,其实质是,将基于信息筛选的认知主导权交给了其背后具有偏见的人工智能算法。研究表明,搜索引擎受到技术和商业力量的驱动会有选择地过滤信息或调整结果排序,进而构建知识权力。换言之,当寻求于便捷的认知事物方式成为信息社会的日常惯习时,搜索引擎平台也就不仅仅承担了存档网络资源的功能,更是在把关、筛选、调节网络信息的过程中深刻地影响着用户接触信息的选择,成为了生产知识并规制公众认知的主导工具。以整合了GPT-4模型的测试版“新必应”搜索引擎为例,在回答“谁赢得了美国2020年的选举”时,该聊天式搜索引擎虽未回答错误,却将必应本身和小众网站“270towin.com”作为文本生成的主要“信源”。同时,AIGC“通过了多学科考试”“能够轻松撰写论文”等论调甚嚣尘上,实质上正在帮助其获取公众信任,建构知识生产的合法性,从而隐秘地削弱了用户的主观能动性。

比提供已有文本选择的传统搜索引擎更令人不安的是,ChatGPT得以使用自然语言处理技术判断和提炼与用户需求相关的特定信息内容,依靠语义分析建立信息关联逻辑,形成原创性的文本,甚至为用户提供决策建议和价值判断。其所发挥的“只要信息结果而非搜索网络”的功能,使生成式人工智能一方面得以“合理”地“隐藏”信源,并使得受众无从通过信源的可信度与偏向性对文本信息进行自主评估;另一方面则在简化和处理信息的过程中进一步改变公众理解信息和知识的方式。正如ChatGPT虽然可以将复杂的公共政策简化为易于理解和量身定制的缩写版本,但若公众对其形成路径依赖,则会忽视未被ChatGPT选择的潜在政策重点。从国际传播的角度看,随着文本生成人工智能应用进一步消解受众的主体性,这类新型信息技术将拥有更为强化却更为隐蔽的中介性权力,从而进一步突破以人主导的传统信息传播生态。

(三)内容生产:“真假难辨”的“谬讯制造器”

相比于以往的智能化聊天机器人,ChatGPT在社交媒体上形成病毒式传播的主要原因之一在于其令人惊叹的语言处理能力。该应用软件可以在短时间内生成流畅自然的拟人化口语或书面表达,甚至能在指令或提示下模仿某一机构或作者写作风格生成诗歌、小说、论文、社交媒体帖子等多元文本类型。一项实验显示,普通公众根本无从区分GPT系列生成的和人类撰写的社交媒体评论。特别是在面对新闻文章、政府公文、编程语言等拥有固定格式的结构性写作时,ChatGPT生成的文本内容更是真假难辨。换言之,生产看似专业的信息将变得前所未有的容易,但也使得识别误讯(misinformation)、谬讯(disinformation)等问题信息变得比以往任何时候都更困难。

一方面,由于OpenAI在开发过程中尚未培养起精准识别谬讯的能力,在面对生成虚假叙事的用户指令时,ChatGPT往往会顺应需求,成为低成本、高仿真的谬讯制造器。2023年1月,美国新闻可信度评估与研究机构新闻卫士(Newsguard)以储存于数据库中的100个虚假叙事样本对其进行了测试,结果显示ChatGPT的识别率仅为20%。在面对剩下80个误导性指令时,其延续了阴谋论的论调,就疫苗接种、学校枪击案件等社会议题侃侃而谈,并进而撰写了详细的媒体报道、非虚构写作与论文,通过引用部分“疑似编造”的科学研究使文本看似专业、甚至权威。

另一方面,即使用户并未有意下达误导性指令,ChatGPT的回答也时常夹杂误讯。近日,程序员在线社区堆栈溢出(Stack Overflow)宣布将禁止用户分享ChatGPT生成的代码,他们发现此类编程虽然在外观上看似令人信服,但在实践中却是漏洞百出,为社区管理员的人工维护造成了极大困难。种种案例使得研究人员与公共决策者意识到了这类似是而非文本的危险性,其通过形式的完备迫使公众陷入“唯有知晓正确答案才得以判断虚假性”的悖论。

从国际传播的视角而言,此类生成技术可以使谬讯传播者以极低金钱、时间、知识成本编造大规模的虚假信息,并得以通过模仿主体特征打造量身定制、符合行文规范、无人工错误的文本内容,形成极具说服力的传播效果,进而引发信息失序困局。然而,OpenAI所提供的防范措施极为有限,其虽然自2023年1月起提供文本检测工具用以识别是否为ChatGPT所生成,但该识别器仅有26%的概率得以成功判断出人工智能生成文本,同时还存在9%将人类文本误认为人工智能文本的可能性。同时,官方说明还显示该检测器难以用于1000个字符以下或英语以外语言的文本内容。虽然科技行业尚未准备好应对方案,但硅谷各大巨头仍迫于市场竞争压力相继推出尚未成熟的ChatGPT竞品,全然不顾这些匆忙面世的人工智能文本生成应用将会持续不断地传播误讯。

02

人机共生视阈下的自主叙事体系构建

随着ChatGPT揭开内容生成式人工智能浪潮的序幕,以达利(DALL-E)、中途(Midjourney)为代表的视觉化软件也引发了学界和业界的广泛讨论,并使人们反思其对版权法律、智媒发展、信息保护等领域所带来的挑战和机遇。可以想见,当人工智能被大规模应用,全球新闻传播生态将迎来震荡性的变革。在世界百年变局的重要背景下,中国国际地位的崛起将导致其毫无疑问地被迫卷入国际叙事之战的中心并成为核心主体。从国际传播的角度看,主导群体根深蒂固的叙事优势会导致国际社会的弱势成员进一步被边缘化,但叙事同样也可以被用作挑战强者的有力工具,改变“中心-边缘”的旧有传播秩序。

美国“互联网自由神话”叙事的双轨战略一方面通过在社交媒体平台的垄断地位保障了自由主义价值观在当下主要国际信息交流空间的竞争优势,进而塑造公众认知并操纵国际舆论;另一方面,孕育于新自由主义的硅谷意识形态赋予了互联网开放、无国界的想象,使“数字资本主义”得以合法、合理地跨国扩张,稳固其在信息科技领域的霸主地位。叙事的构建需要一个关乎人类命运走向的国际性契机。与世纪之交先后兴起的初代互联网和社交平台一样,智能传播时代的人机共生既是国际传播的模式更迭,也将成为全球话语场的关键议题。

作为国际传播的未来样态,当内容生成式人工智能以技术驱动争夺国际话语权力,意图更迭甚至取代搜索引擎成为互联网核心应用,我们需要打造自主可控的跨国信息基础设施以保障叙事的自主性;作为国际传播的关键议题,ChatGPT作为一个现象级的人机交互应用,将被国际社会广为关注的科技治理议题推向新的高峰,“21世纪的科技应当何去何从”这一人类共同关切为中国构建叙事体系带来了机遇。

(一)叙事自主性的重要支点:自主跨国数字基础设施

作为全球信息流动的重要载体,跨国数字基础设施一方面成为国家形成、投射、竞争战略叙事的基础条件与主要场所,另一方面通过网络社会的再中心化机制暗中设定着国家叙事竞争的规则,以愈发凸显的中介性权力深刻地塑造着受众“是否能够”以及“如何”接收与认知这些叙事,从根本上影响了叙事的流动方式和传播效果。尽管ChatGPT在其他语种的文本处理表现远不如英文一般娴熟,但OpenAI近年来在多语种功能中的大规模资金投入已然彰显了其雄心。

与数字平台等跨国信息基础设施一脉相承的是,人机共生的国际传播模式将依旧延续着以市场与资本为主要代理人、以大数据与人工智能算法为核心技术竞争力、以信息为主体业态、以地缘政治为顶层设计的平台化国际传播生态。美国科技巨头对俄乌冲突的深度介入更是充分证明了网缘政治格局的出现。无论是推特、脸书等社交媒体平台全面封禁俄罗斯主流媒体与亲俄民众的社交媒体账号,还是马斯克投资的太空探索技术公司(SpaceX)为乌克兰提供通信保障支持,都彰显着跨国信息基础设施与地缘政治意义下国家利益的紧密相连。同样,ChatGPT也绝非政治中立的国际主义者。正如前文所言,当国际用户因便捷性与易用性使用ChatGPT时,它将基于“西方中心主义”的训练语料库从根本上把关话语,以看似中立的信息供给规制公众认知,确保“盎格鲁撒克逊”意识形态与美国国家叙事在信息流通空间的主导权。当全球南方国家再度沦为被书写、被阐述的异质性存在,甚至出现以误讯、谬讯混淆真实叙事的可能,隐蔽的殖民主义话语将致使西强东弱的全球秩序再度分化。

因此,以新闻产品与媒介机构“走出去”为主的媒介逻辑已然无法适配深度平台化的传播规律,更是无法保障国际数字空间中的国家话语权与自身解释权。在国际传播新生态中,实现叙事自主性的前提在于自主可控的国际信息基础设施,而内容生成式人工智能应用无论是作为信息生产工具单独使用,还是作为搜索引擎的伴侣,都将成为新兴信息基础设施的又一样态。目前,百度、阿里巴巴、腾讯、网易、京东等科技公司已接连宣布将在不远的未来测试、正式推出类ChatGPT应用。从各公司的表态口径来看,虽已纷纷提前布局,但都旨在打造适合本土受众、中文语言处理能力的智能语言模型,很大程度上忽视了国际用户。近年来,诸多中国平台“出海”的成功实现意味着打破美式国际互联网的基本定势不再仅仅是美好愿景。当认知战、舆论战、叙事战已成为当前国际竞争中虽然隐蔽但非常重要的一种形式,中国互联网公司不应固守于庞大的国内市场,而应在未来的谋划中以“一带一路”共建国家切入,主动纳入地缘政治意义下的国际视野,打造技术创新、功能复合的内容生产式人工智能产品和服务,发挥经济动能在国际传播中的作用,为在全球多语言舆论场中构建中国自主叙事奠定基础,纠偏“西方中心主义”的国际话语生态。

(二)叙事体系构建:国际体系、政策、身份

作为一种构建共同意义的整体性框架,叙事体系得以连通过去、现在与未来,最终在国际范围内实现“共意”目标。人机共生这一全球议题建立起了在地性与世界性之间的联系,将国际体系、政策、身份三个策略性叙事体系要素有机地串联在一起,为中国在国际传播中构建叙事体系带来了新机遇。

第一,以国际体系叙事再框架化互联网世界秩序。国际体系叙事主要指政治行为体如何解释与构想国际秩序。随着中国本土互联网企业的崛起,中美数字平台各占半球、分庭抗礼的论调不绝于耳。特别是在ChatGPT推出后,西方媒体利用国内科技公司的回应构筑中国将与美方开展人工智能军备竞赛的话语陷阱,通过新冷战叙事营造中国“利维坦”式的扭曲形象。事实上,虽然中国头部互联网“大厂”组成的蝙蝠联盟(BATJ)与美国硅谷巨头组成的超级联盟(MAAGA)在市值总量与用户数量平分秋色,但从包括软件与服务、硬件与设备、电子产品、科技投资的整体行业情况来看,美国仍然占据绝对性的利润优势地位。因此,中国应以“现代化的另一种可能”“再框架化”世界秩序的构想,破解美利坚秩序(PaxAmerica)叙事中威胁式的存在。同时,围绕人类命运共同体,强调“科技向善”的“共同发展”(Rise with the Rest)理念,构建更为公正的全球政治经济秩序。特别是在信息科技产业中,硅谷巨头以不平等的劳动分工剥削处于信息技术产业链底端的全球南方国家。ChatGPT一方面帮助OpenAI一跃成为世界上市值最高的人工智能公司,另一方面以不到两美元时薪雇佣了非洲“幽灵劳动者”大量浏览和标记极端暴力等互联网中“最黑暗”的文本片段。

第二,以政策叙事传播数字之治的中国智慧。平台化互联网阶段的到来致使网络社会再度陷入中心化,并由此打破公权力与私权利的传统结构。随着科技巨头私权力与公共利益的根本性矛盾逐渐浮出水面,世界各国对用户隐私、行业垄断、问题信息等数字困境的忧虑取代了互联网狂热情绪,形成“技术后冲”(Techlash)思潮。ChatGPT的横空出世更是凸显了内容生产式机器人的自动化歧视、情感聊天机器人的用户隐私困境等人工智能应用所可能引发的数字权利问题。然而,OpenAI仅在声明中警告称ChatGPT“可能会偶尔生成有害指令或有偏见的内容”,将希望寄托于公测用户零敲碎打地建立信息防护机制,同时将权利保护责任从管理者转移到用户自身。与之形成鲜明对比的是,中国科技部在推动技术创新的同时,先后推出《新一代人工智能治理原则》与《新一代人工智能伦理规范》,成立人工智能治理专业委员会,强调构建安全可控的人工智能发展体系。毋庸讳言,美国自上世纪90年代以来主导的行业自治政策叙事已然无法满足当前的治理需要。而中国对数字行业长期以来更为审慎的政策态度指引着政府在多利益攸关方共治体系中发挥主导作用。当国家监管已然成为互联网治理的世界趋势,我们更应以数字科技政策叙事贡献中国智慧。

第三,以“身份/认同叙事”(identity narrative)引领具有包容普惠性的数字实践。身份/认同叙事指以剖析本体身份投射政治行为体的核心价值观。换言之,它不仅仅关乎于回答“你是谁”,更关乎于解释“你将会推动人类走向何方”。区别于帝国时代根植于殖民的“英式全球化”与“后帝国时代”诉诸于培养“政治代理人”的“美式全球化”,中国不论是实践层面的“一带一路”还是价值层面的人类命运共同体,都着力于构建怀抱“共同善”的价值意涵。16置身于人机共生的国际语境,从内容生成式应用背后的零信任社会危机,到科技能源消耗影响下的生态可持续性,再到以机器服务于人转型为以人配合机器发展的自动化工作趋势,现代性的另一面逐渐显现,成为人类社会即将面临的共同困境。因此,“持久危机”(Permacrisis)这一新时代特征不仅考验着人类未来该如何与机器共生,更需要世界各国摒弃非此即彼的二元对立,秉持以彼此作为参照的包容互惠性,在“人机共生”的语境下创造超越西方中心论和欧美现代性的人类文明新形态。

史安斌:AI很聪明,西方有阴谋,中国要小心

▲本文原文刊发在核心期刊《对外传播》2023年4期总第319期。作者史安斌系清华大学伊斯雷尔爱泼斯坦对外传播研究中心主任、教授,俞雅芸系清华大学伊斯雷尔爱泼斯坦对外传播研究中心助理研究员

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港