允中 发自 凹非寺
量子位 | 公众号 QbitAI
引言:AI大模型,并不是一个赢家通吃的市场。
自OpenAI在2022年发布ChatGPT以来,无论是科技巨头还是初创公司,各个玩家可以说是纷纷加大投入,试图在模型性能上超越彼此。
似乎追求单一、性能卓越的AI大模型已然成为一种趋势,各类Benchmark上的夺冠也好似一张得到市场认可的入场券。
然而在如此打法成为主流的同时,一个在AI大模型时代以来一直看似低调,也鲜有大声量地高喊“大模型性能第一”的科技巨头,却在时隔两年多之久,以截然不同的方式在大模型市场里惊艳亮相。
它就是云计算一哥亚马逊云科技。
值得一提的是,Llama 405B和Llama 70B低延迟优化版本,在亚马逊云科技上展现出超越其他云提供商的出色表现。
最后,通过自动推理检查功能和多智能体协作等创新,进一步增强AI安全性并推动智能体发展。
Amazon Q Developer则是引入了三款先进的智能体。
它们能够自动执行单元测试、生成文档和进行代码审查,同时通过与GitLab的深度整合,拓宽了应用范围。
此外,它还推出了新的转型特性,旨在加快Windows.NET、VMware和大型机工作负载的迁移与现代化进程,有效减少转型周期和成本。
同时,Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加强,简化了复杂工作流程自动化的实现方法。
云计算,也全面升级说完大模型,我们再来看下亚马逊云科技的“老本行业务”云计算。
这次升级主要围绕三大核心领域展开:计算(Compute)、存储(Storage) 和数据库(Database)。
每一项都可以说是展现出了前所未有的性能提升与成本优化。
在计算(Compute)层面,亚马逊云科技推出了性能全面升级的Amazon EC2 Trn2实例。
Trn2实例搭载第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:
训练速度提升4倍,显著缩短模型训练时间,助力企业更快落地AI应用;
内存带宽提升4倍,满足复杂模型对于数据高并发处理的需求;
内存容量提升3倍,为大规模参数模型提供强大支持。
更重要的是,Trn2实例的性价比提升显著,相比传统GPU实例(P5e和P5en)高出30-40%,大幅降低了算力成本。
对于超大规模计算需求,亚马逊云科技还推出了Trn2 UltraServer。
每台UltraServer集成了64颗Trainium2芯片,并通过NeuronLink高速互联实现2TB/s带宽和1微秒级延迟。
这款产品为超大规模AI模型训练提供了理想的算力平台。
除此之外,在芯片层面上,亚马逊云科技宣布将在2025年推出Trainium3芯片。
据悉,Trainium3将采用3纳米工艺制造,提供两倍于Trainium2的计算能力,并提升40%的能效。
在存储(Storage)层面,亚马逊云科技发布了专为表格数据设计的Amazon S3 Tables,性能和效率再次升级。
Amazon S3 Tables引入了一种创新的存储解决方案,专门针对表格数据优化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查询工具,以便用户能够便捷地执行数据查询操作。
作为S3的第三种存储类别,表存储桶与通用存储桶和目录存储桶相辅相成,它被设计为一个分析型数据仓库,适合存放多种模式的Iceberg格式表格。
S3 Tables在性能上相较于传统的自管理表格存储有显著提升,查询速度可提高至3倍,事务处理速率可达10倍,且享有全面托管的服务带来的操作便利。
在数据管理中,元数据的作用日益凸显,例如,手机中存储的大量照片能够通过元数据快速定位,使用自然语言即可迅速检索到特定照片。
为满足此类需求,亚马逊云科技推出了Amazon S3 Metadata的测试版,旨在提供更加智能和高效的元数据管理功能。
Amazon S3 Metadata 提供了一种智能化、便捷的元数据管理方案,实现了近乎实时的元数据更新,帮助用户高效地组织、识别和利用S3数据,支持业务分析和实时推理等应用场景。
该功能支持对象元数据管理,既涵盖系统生成的详细信息(如文件大小和来源),也允许用户自定义元数据。用户可以通过标签为对象附加额外信息,如产品SKU、交易ID或内容评级,进一步提升数据的分类与检索效率。
此外,这些元数据信息被无缝整合到 S3 Tables 中,进一步强化了数据的管理与分析能力。
最后一层,便是数据库(Database)了。
亚马逊云科技发布了新型无服务器分布式数据库Amazon Aurora DSQL,旨在解决传统数据库在扩展性和性能方面的挑战,目前可以实现:
跨区域强一致性和低延迟;
无限扩展,可轻松处理TB至PB级数据;
超高可用性,达到99.999%的可靠性。
与此同时,Amazon DynamoDB global tables也增加了多区域强一致性支持,进一步增强了其分布式数据库服务能力。
数据分析能力也是Up Up Up此次发布的最后一部分,便是分析板块。
亚马逊云科技所发力的点,便是其一站式数据、分析与AI解决方案中心新一代Amazon SageMaker。
新一代SageMaker的核心是SageMaker Unified Studio。
这是一个单一的数据和AI开发环境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及现有的SageMaker Studio中的工具和功能。
其次是Amazon SageMaker Lakehouse,可以统一Amazon S3数据湖、Amazon Redshift数据仓库和第三方及联合数据源。
除此之外,还包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能,以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。
这些功能将帮助客户更快开始训练流行模型,通过灵活训练计划节省数周时间,并将成本降低高达40%。
以上就是今年亚马逊云科技给予大模型时代客户们的种种新的选择了。
而这种“以客户为中心,逆向工作(work backward)”为基因的云计算巨头,还将以“提供选择权”的方式在这个时代给我们带来怎样的惊喜,是值得期待一波。