3月初,国家正式定调大力发展“新基建”,人工智能成为新基建的重要发展领域之一。一个多月后的4月30日,亚马逊云服务(AWS)把它的人工智能“杀手级工具”Amazon SageMaker正在落地中国,由西云数据运营的AWS中国 (宁夏) 区域和光环新网运营的AWS中国(北京)区域上线运营。
SageMaker是什么?从英文字面上可翻译为“魔法生成器”或“智者制造机”。Amazon SageMaker是AWS在2017年12月举办的年度盛会re:Invent上首次推出的,是一项完全托管的机器学习服务。
Amazon SageMaker的功能是帮助开发者和数据科学家快速构建、训练和部署机器学习 (ML) 模型,推动人工智能走入现实。应该说,如“SageMaker”名称所隐喻的,它自推出以来成为推动机器学习乃至人工智能应用的“利器”,受到较高关注和良好评价。
虽然AWS此时把Amazon SageMaker在中国落地,不一定是冲着“新基建”来的,但不可否认的是看重了“新基建”背景下中国人工智能发展的大市尝大趋势。正如AWS全球副总裁及大中华区执行董事张文翊所表示的:在中国,越来越多的公司在探讨机器学习和人工智能的潜力,思考如何把这些技术融入到日常应用当中。Amazon SageMaker在AWS中国区域的上线,将帮助更多中国客户胜任构建、训练和部署模型的工作。
值得注意的是,此次在中国上线的Amazon SageMaker,涵盖了2019年12月AWS在re:Invent大会上发布的全部功能,发布速度几乎与全球同步。显然,AWS把中国作为发展人工智能、机器学习的重要市常
SageMaker 让人工智能落地更轻松
据Gartner发布的2019人工智能新技术成熟度曲线显示,以机器学习为代表的许多人工智能的技术正在快速成熟。Gartner预测,到2023年,超过40%的开发团队将使用自动化机器学习服务,来构建向其应用程序中添加AI功能的模型,而在2019年这一比例还不到2%。
机器学习使用数学模型从数据中提取知识和模式,可以解决诸如个性化的客户服务、供应链推荐、医疗诊断和反洗黑钱等业务问题,随着组织面临的数据量的指数增长和计算基础设施的提升,ML的使用也在增加。
AWS首席云计算企业战略顾问张侠博士认为,上云、大数据、人工智能是数字化转型的关键,机器学习是下一阶段引领企业转型和创新的抓手、突破点。可以看到,在疫情期间,机器学习在医疗健康、在线教育等很多行业领域在发挥越来越重要的作用。
尽管很多企业都认识到机器学习的价值,但应用机器学习仍存在不小阻力:
一方面,人工智能、机器学习知识比较高深,相关专业人才不足。专业人才培养速度跟不上人工智能发展速度,所以,我们常会看到百万年薪招聘人工智能人才的新闻。尤其对于传统行业企业来说,人工智能等专业技术人才更为稀缺。
另一方面,怎么样构建、扩展这些人工智能技术的产品,把这些技术真正应用到现实的生产工作流程中,还有一定复杂性和挑战性,在部署人工智能应用也存在费时且成本高等问题。
传统 ML 开发是一个复杂、昂贵的迭代过程,而没有适用于整个机器学习工作流程的集成工具使得这一过程更加困难。而使用Amazon SageMaker将完全消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。
例如,Amazon SageMaker的自动构建模型功能Amazon SageMaker Autopilot,是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。之前的机器学习自动化方法,可以为开发者自动创建一个初始模型,但是对于模型是如何创建的、模型中包含什么内容,并不能提供给开发者。而Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优。缺乏机器学习经验的人可以使用Amazon SageMaker Autopilot轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型。
Amazon SageMaker还创建了首个面向机器学习的集成开发环境Amazon SageMaker Studio,使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。
Amazon SageMaker不仅功能强大易于使用,还可以降低机器学习的总体拥有成本并提高工作效率。以大宇无限为例:大宇无限是一家专门从事移动应用程序开发的公司,主要为中东、东南亚和拉丁美洲等市场提供移动短视频服务。大宇无限机器学习技术总监苏映滨表示,实现视频内容的在线推荐,对于内部开发团队是一个巨大挑战,而SageMaker极大简化了整个机器学习的构建、训练和部署流程,训练成本比自己搭建要便宜,还基本上不用投入运维人力。
Amazon SageMaker也帮助合作伙伴,极大地减少了用户的开发时间与运营费用。伊克罗德是AWS的核心级咨询合作伙伴,伊克罗德中国区副总裁桂梓捷表示:运用Amazon SageMaker平台加速了企业导入行业AI解决方案,如标签标注、文本分析、语意理解、预测分类、推荐系统与诈欺侦测等,针对客户实际遇到的商业问题,更快速量身打造真正解决问题的端到端AI应用。
无疑,Amazon SageMaker在中国上线,将加速机器学习和人工智能的推广应用,助推企业的数字化转型。
AWS凭什么成为机器学习的领导者?
很多人知道AWS是全球云计算的引领者,却不一定不了解它也是机器学习领域的领导者。
在Gartner发布的2020年《云上AI开发者服务魔力象限》中,AWS被评为领导者象限最高位置,主要是因为Amazon SageMaker受到了广泛好评。那么,相比其他竞争者,Amazon SageMaker的核心优势是什么?在张侠博士看来,至少有三大优势:
第一, SageMaker平台具有开放性,对于各类开源框架和开源算法都兼容。如Amazon SageMaker中的Amazon SageMaker Python SDK提供了开源 API 和容器,可以轻松使用多种不同的机器学习和深度学习框架来训练和部署模型。
第二,遵循“平台+生态”发展理念,通过与不同合作伙伴的合作,搭建了多元化的行业应用与案例,从而打造了丰富的生态系统。通过与合作伙伴合作过程,也可以得到大量用户的反馈,不断更新迭代产品功能和服务。
第三,不断利用本地资源进行更多创新,比如通过AWS上海人工智能研究院开发推出了针对图神经网络(GNN)的DGL(Deep Graph Lipary)框架。DGL是一个开源代码库,可以简化图神经网络的实现和部署。
当然,AWS的机器学习和人工智能服务绝不止Amazon SageMaker。AWS根据不同类型客户的需求,提供了全方位的机器学习和人工智能解决方案,这是一个包括三层的全栈服务,Amazon SageMaker只是AWS全栈机器学习服务的中间层。
三层服务堆栈的底层,为想要自己构建算法或开发新框架的客户提供灵活选择,客户可以选择使用TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras等机器学习框架。在这一层,任何用户都可以使用最新基础设施,对多种框架进行试验。
在三层服务堆栈的顶层,AWS提供了训练好的人工智能服务。如计算机视觉、个性化推荐等服务,客户可以直接在其应用中调用这些人工智能服务,而无需关注服务背后的机器学习模型。
张侠强调:AWS 赋予自己的使命就是要把机器学习的能力交到每一位创建者的手中。
了解亚马逊的人会知道,它是一家低调务实的企业,几乎见不到亚马逊公布AI战略和理念,实际上,亚马逊在人工智能领域已投入20余年,在AI应用创新上走在前面。
作为全球最大的电子商务企业,亚马逊从1998年上线了电商平台智能推荐系统开始,机器学习(ML)算法驱动了亚马逊的许多内部系统:从Amazon运营中心的路径优化到Alexa提供技术支持的Echo、无人驾驶飞机Prime Air以及新的零售体验Amazon Go。应该说,机器学习已经成为亚马逊的重要引擎。
正是因为亚马逊拥有长久的机器学习历史,在深度学习方面积累了非常丰富的经验,才能更好地把机器学习技术发放给用户和开发者。
当前,在云上实现的机器学习应用,绝大多数都构建在AWS之上,使用AWS机器学习服务的客户数以万计。知名的客户包括通用电气、西门子、道琼斯、Autodesk、拜耳、英国航空、盖洛普、洛杉矶快船队、松下航空电子、环球邮报和T-Mobile等,还包括虎牙、大宇无限、嘉谊互娱、华来科技等中国客户。
可以说,作为全球云计算的开创者和引领者,AWS已经在机器学习和AI服务上构筑了差异化竞争能力。