11月底的拉斯维加斯从来都不冷清,但今年更热闹。
亚马逊云科技在2023年re:Invent大会期间开设了2000多场主题讲座和技术会议,沿着拉斯维加斯大道的数个大型酒店和设施,迎接约6万名客户、分析师、媒体和科技从业者的前来。
以ChatGPT上线算起,生成式人工智能之战已经打响了一整年。但科技巨头亚马逊云科技在布局什么?这是所有参会者想要探寻的答案。
而这个答案,有点与众不同。
01 企业级AI全生态:三层架构全面布局
亚马逊云科技用四个整天、五场主演讲的内容传递出一个强烈的信号:拥抱AI的不是任何单独的一个部门,而是全架构、全服务的转型。
在CEO Adam Selipsky的演讲中,他明确演示了亚马逊云科技进攻AI的三层架构:从最下面的基础架构层,到中间的基础模型服务层,再到最上面的应用层,亚马逊云科技都在全面布局和进攻。
1.1 更强算力的底层:自研芯片、超级计算机以及与英伟达的强强联合
在基础架构层,亚马逊云科技首先是发布了针对训练大语言模型和基础模型的自研芯片Amazon Trainium2,比前一代快四倍,适用于参数超过一万亿的神经网络模型,以及通用Amazon Graviton4处理器。同时,英伟达创始人兼CEO黄仁勋也是来到了现场,宣布亚马逊云科技与英伟达达成新的战略合作。
“亚马逊云科技是世界上第一个真正认识到GPU加速运算重要性的云服务商”,黄仁勋穿着他一贯的黑皮衣在舞台上加入亚马逊云科技CEO Adam Selipsky,共同宣布两家公司将扩大合作。
亚马逊云科技和英伟达将合作推出全新的超级计算基础设施,软件以及服务,这包括了,首款结合英伟达Grace Hopper 超级芯片与Amazon UltraCluster拓展功能的云AI超级计算机,同时,英伟达的DGX Cloud首次在亚马逊云科技上提供AI训练即服务AI-training-as-a-service,以及Project Ceiba打造配置了16384颗英伟达GH200超级芯片的全球最快的GPU驱动AI超级计算机。
虽然两家公司已经合作了好几年,但这是黄仁勋第一次出现在亚马逊云科技的年度大会上,也说明他对于布局AI时代云计算的重视程度。
简单来说,在AI算力服务上,无论是对算力要求极强的大企业,还是对成本控制需求高的中小企业,亚马逊云科技的布局可以说是全力在加速。
在一场AI创业公司的媒体会中,3D视频初创公司Krikey.ai和图文生成公司Leonardo.ai都是全部在亚马逊云科技上部署,给用户的界面和创作工具就直接是网页,数字资产可以实时生成。
Krikey.ai的创始人Jhanvi Shriram在回答硅谷101提问时说,“我们加入了亚马逊云科技的‘生成式AI加速器计划’,这对我们这样的初创公司来说简直就是game-changing(改变游戏规则)的一步。”
但显然,AI训练的费用依然是不便宜的,VC投资人们和分析师们预期,随着市场竞争的加剧,算力成本在2024年会显著下降。
1.2 更包容的中间模型层:提供给客户多模型选择
在中间模型层,与微软和OpenAI的深度绑定不同,亚马逊云科技的AI策略显然更包容。
虽然亚马逊此前宣布投资OpenAI的大模型竞争对手Anthropic 40亿美元,但亚马逊云科技给客户提供的远不止Anthropic模型,这是与微软截然不同的策略。
亚马逊云科技CEO Adam Selipsky在现场一再强调的另一个重要观点是:对于企业们,今后的选择可能不仅仅是一个大模型公司,而是数个不同的、各有优势的、有大有小的模型提供方,而显然,亚马逊云科技正在布局这样的一个更加强调安全、值得信赖、有创新性的多元模型生态。
如今,Amazon Bedrock上会集成AI21labs的Jurassic 2模型,亚马逊云科技自己的Amazon Titan模型,Anthropic的Claude模型,Cohere的Command文本生成模型和Embed文本理解模型,还有Meta的LLAMA 2开源模型,以及Stability.ai贡献的Stable Diffusion XL开源文生图模型。
美国Esoterica Capital(济容投资)首席执行官Bruce Liu在接受硅谷101采访时就坦言,亚马逊云科技更强调把选择权给客户这一点很重要,也是其与微软在选择策略上的不同。
他表示:“亚马逊云科技在AI军备竞赛的策略选择上与微软的不同。它更强调的是说我把选择全给客户,但我能做什么呢?我就确保我的基础架构 从最底层的大模型再到中间层的微调模型,再在模型上提供相关工具 我都是以这么一个心态和姿态来保证,无论你选择什么样的模型什么样的工具,我都能提供很好的技术上的支持和服务保证客户你有选择、能选择,我觉得这一点也挺重要的。”
在现场,Anthropic的创始人兼首席执行官Dario Amodei也来到现场,宣布企业级模型Claude 2.1也将通过亚马逊云科技的全托管服务Amazon Bedrock的API对客户开放,目前包括LexisNexis,桥水基金和Loney Planet等公司都已经开始建立合作。同时,亚马逊这40亿美元也不是白投给Anthropipc的,Anthropic反之也会帮助亚马逊云科技在芯片架构Inferentia2和Trainium2上进行优化。
1.3 重磅上层应用:Amazon Q
在最上面的应用层,亚马逊云科技这次宣布了重量级更新:Amazon Q。
这款企业级的聊天机器人是亚马逊云科技在ChatGPT一周年之际给出的聊天应用答案,在谷歌的Google Duet和微软的Copilot之后,亚马逊云科技终于出牌。
但相比其它两家云计算巨头,亚马逊云科技的动作虽然不是最快的,但与生态结合是非常明确的:Amazon Q专门用于满足企业应用场景需要,可以根据客户业务进行定制。
比如说,这款企业级聊天助手会根据不同部门和权限对员工进行个性化定制,帮助阅读、查看文件,测试优化代码,一键生成汇报的PPT或者可视化图表。同时,Amazon Q还被引入亚马逊云科技的多种服务和应用程序,包括云支持业务分析服务Amazon QuickSight,云联络中心Amazon Connect,还有Amazon Supply Chain和AI代码生成器和配套应用程序Amazon CodeWhisperer ,让客户在分析数据,客服培训以及供应链追踪上更加智能和效率。
但亚马逊云科技也强调,企业数据绝不会用于Amazon Q的底层模型,再次向客户保证对数据安全上的重视。可见,随着亚马逊云科技推出Amazon Q,Copilot模式的企业级聊天助手市场的竞争将会更加激烈,而确定的一点是,因为AI助理,未来的工作方式或许将被彻底改变。
02 AI安全:私密环境,RAG及隐形水印
在三层架构上全面进攻AI云计算的亚马逊云科技所展示出来的,是一个更加开放、客户选择更多、更多元、更全面的企业级AI生态蓝图。但“安全”二字,是各个主演讲keynote中反复被提及的关键词。
如果要让客户更放心地拥抱AI应用,从底层的基础模型多样性,到结合数据训练所需要的私密环境,到简单易用的工具来搭建和部署应用,再到为机器学习专门构建的基础设施,这中间所需要的安全保障生态是复杂且精细的。
比如说,在中间工具层,Amazon Bedrock中配置了AI安全产品Guardrails作为进一步提高人工智能模型安全性的一种方式。简单来说,Guardrails for Amazon Bedrock能够允许客户根据其负责任的AI政策配置模型来避免某些特定主题、词语或响应。
同时,亚马逊云科技也展示了企业级AI服务中目前最前沿的安全路线,叫RAG。大语言目前目前最主要的一个问题就是“信誓旦旦的胡说八道”,学术上叫hallucination(幻觉)现象,这导致准确性和商用性都大打折扣。
目前较流行的新做法,包括这次亚马逊的Amazon Bedrock上也采用的应对措施叫“检索增强生成”,简称RAG。
RAG 是一种混合模型,基于检索的方法,将一些需要高准确度的答案从外部的知识源(knowledge-base),比如说数据库、文章或网站这些有更准确答案的地方,去访问和提取信息。而Amazon Bedrock知识库功能就转向RAG,来为聊天机器人和问答系统提供更准确、针对特定上下文的响应。这也是降低了大模型商用壁垒。
此外,亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian在发布亚马逊云科技Amazon Titan的图像生成器以及多模态嵌入功能时候强调了一个重要安全细节:AmazonTitan的每一张图像生成就会自动包含隐形水印,这将有效应对AI资产带来的潜在假新闻和版权争议,同时这也是包括亚马逊在内的七大美国AI公司为了响应美国白宫对AI安全担忧而做出的自愿承诺。
03 四万亿美元增长机会与“俭约”用云
咨询公司麦肯锡预测,生成式人工智能对生产力的影响,会带来每年2.6万亿至4.4万亿美元的增量,亚马逊云科技的客户 担心在此轮AI浪潮中错失先手的世界前500强企业 已经做好了预算,对AI转型跃跃欲试。
亚马逊云科技的长期资深客户Accenture(埃森哲)在现场宣布,将全面配置亚马逊云科技的AI服务来进一步优化企业效率。
“我们是Amazon CodeWhisperer的早期采用者并实现了30%的性能提升,” Accenture Cloud First主管Andy Tay在现场表示,在接下来两年中,Accenture将承诺将Amazon Q和CodeWhisperer功能开放给公司多达五万名开发工程师,计划将亚马逊云科技的生成式AI整合到其综合自动化平台中。
不仅大企业从亚马逊云科技这样的AI全生态中获益,硅谷AI独角兽们也渴望更高效的算力和服务支持。然而,在如今利率上升、流动性紧缩的经济大周期中,亚马逊云科技如何向客户们展现其性价比、如何帮助客户“更省钱更高效”地进行AI转型,将是接下来布局市场的重点。对此,亚马逊云科技也发布了一系列针对“AI训练”的产品更新,比如说Amazon SageMaker HyperPod通过为大规模分布式训练提供专门构建的基础架构,将基础模型的训练时间缩短多达40%。
Perplexity公司的联合创始人兼CEO Aravind Srinivas在台上分享道:“Amazon SageMaker HyperPod使大模型训练的调试更加简便,并有效处理分布式容量。我们使用了亚马逊云科技的Amazon EC2 p4de容量进行训练,这使我们能对Llama 2和Mistral等先进的开源模型进行精细调整。自我们转向Amazon HyperPod并启动Amazon EFA,我们观察到训练吞吐量显著增加了2倍。”
而“俭约”两字,或者说“如何帮助客户降低成本”,也是亚马逊云科技此次的re:Invent大会传达出的重要信息。
Amazon.com首席技术官Werner Vogels在他非常具有个人特色的主演讲中,并没有大谈科技细节,而直接给大家上了一本“书”。名字很直接,就叫The Frugal Architect(俭约云架构):并且从设计,测量以及优化三个层面教大家如何俭约。
显然,Werner的信息在如今的时间节点非常的重要:在全球经济放缓、仍然在加息紧缩周期之际,企业们在拥抱生成式人工智能的策略上将在GPU算力和云计算上投入大量资金和资源。美国咨询公司Gartner就预测,在明年2024年,云终端用户的支出将达到6780亿美元,比今年的5630亿美元大幅增长。
而随着全球企业进一步布局AI应用,模型训练的进一步变大,无论大企业还是初创公司,算力成本的优势差异将在企业未来竞争力上得以体现,所以,如何“有效”且“聪明”的控制云成本、并且以创新思维去寻求改变,便是现在“俭约架构师们”需要去思考的了。
而Werner也督促企业和架构师们去拥抱改变。他用PPT明显地标注出这样一句话:“在英语中最危险的短语是‘We’ve always done it this way.’(我们一直以来都是这样做的。)”
而亚马逊云科技也在持续提供新工具帮助客户们去监督成本和运营,包括在管理控制台推出myApplications产品,让用户能够更轻松地管理和监控应用程序的成本、运行状况和安全状况。同时,Werner还宣布发布Amazon Cloud Watch Application Signals,旨在让客户自动检测应用程序,以最大限度地提高效率和成本效益。
04 2024年的AI大战,准备好了吗?
就在圣诞装饰和年底节日气氛已出现在拉斯维加斯金碧辉煌的酒店大堂之际,在硅谷,科技公司们的裁员潮仍在继续。
在今年稍早的财报会上,亚马逊CEO Andrew Jassy表示,亚马逊在2023年资本支出约500亿美元,其中相当部分用于亚马逊云科技上的基础设施投资,包括生成人工智能和大型语言模型工作相关业务投资均在上升。
然而,虽然亚马逊云科技这一系列的产品发布给已经火爆的生成式AI再添了一把旺火,但无论是企业级(2B)还是消费级(2C)赛道,生成式人工智能的前景都面临着巨大不确定性。
“亚马逊云科技内部看到如何的数据才能定义企业级生成式AI的正式起飞?”这是硅谷101在re:Invent期间媒体群访时抛出的问题。
亚马逊云科技大中华区战略业务发展部总经理顾凡回答:“(生成式AI服务)能否做到为客户增效,是衡量业务成功的指标。”
而能否增效?能增效多少?能如何增效?增效收益能否超过AI转型的支出?全力押注生成式AI是一场**。现在,巨头们都入局出牌了,而这些问题,我们也许在2024年就会有一个更明晰的答案。