《科创板日报》7月4日讯(记者 黄心怡)随着“百模”大战拉开帷幕,各个领域的人工智能大模型先后涌现。亚马逊云科技全球产品副总裁Matt Wood在接受《科创板日报》采访时表示,一个万能、单一的大型语言模型确实无法应对各种任务。
“现在很多都是通用型的模型。坦率说,这些模型广泛适用于各种类型的问题,但是深度不够,即博而不渊。对于一定的使用场景是比较合适的,比如说聊天机器人、普通搜索等。但是绝大多数的用户,还是希望模型在特定领域能有更深入的理解和解决问题的能力,也就是使用面不那么广博,但是深度要足够的产品。”
并不会有一个万能大模型
不少业内观点认为,一个以大模型为核心的人工智能新时代正在开启,每一个产品都值得重做一遍。Matt Wood认同,生成式AI将是整个技术行业的巨大突破。“亚马逊云科技对于生成式AI的发展感到非常兴奋。甚至可以说,这是自浏览器问世以来最大的跨越式前进。”
当前,不少大厂和初创公司都争先下场布局大模型。对此,Matt Wood表示,实际上,并不会有一个所谓的万能大模型。
“我们认为正确的做法是,客户可以访问多个模型,然后根据自己的需求和数据来定制自己的模型,在大模型的基础之上,确保以私密和安全的方式让用户能够定制自己的模型。”Matt Wood说。
目前,除了自研的预训练Amazon Titan基础模型外,亚马逊云科技也提供第三方提供的生成式AI模型,包括Anthropic、AI21Labs和Stability AI等合作伙伴。客户可以根据自身需求,在大语言模型的基础之上,使用自己的数据进行专门化模型的构建。“在过往一段时间,我们已经看到有客户以各种不同的方式,构建出了根据自身需求决定的模型。”
数据是大模型竞争关键要素之一,训练大模型需要高质量、大规模、多样性的数据集。对于数据量的挑战,Matt Wood回应称,尚未遇到训练数据不够的问题。
“实际上客户手里面掌握到的数据,甚至比现在亚马逊云科技上面已有的数据还要多。这可能会令人惊讶,一些大企业,甚至是成功的创业企业,他们在亚马逊云科技上拥有的数据已经达到XB级别。”
不过,若想要构建通用人工智能,更为海量的数据无疑是必须。“对于实现通用人工智能,现在的数据是否足够,实话实说,我不知道。”Matt Wood提到。
“不过,生成式AI有一种能力,就是使用得越多,性能就会越好。换句话说,当越来越多的企业、初创公司甚至个人来越来越多地使用这些模型的时候,随着使用量的增加,反馈和回答都会变得越来越好。所以现在见到的是一个基储是一个起跑线,而不是天花板。”
生成式AI仍处于早期阶段
亚马逊云科技近日宣布成立亚马逊云科技生成式AI创新中心,将帮助客户构建和部署生成式AI解决方案。据了解,亚马逊云科技为该中心投资一亿美元,其团队由战略专家、数据科学家、工程师和解决方案架构师组成。
“这个创新中心集结了亚马逊在机器学习方面最聪明的科学家来开展工作,很多人在机器学习和人工智能领域有超过20年的工作经验。与此同时,我们也会和客户进行合作,帮助他们构想、设计和推出新的生成式AI产品、服务和流程。”
Matt Wood本人参与了亚马逊云机器学习解决方案实验室创建并负责管理,他介绍,该实验室所提供的解决方案涉及健康医疗、生命科学、金融服务、保险等几乎所有行业。
“我们的机器学习在体育行业里也得到了应用,帮助改善运动员的身体健康、安全,这方面在美国的主要合作伙伴是NFL职业橄榄球大联盟。在欧洲我们与德甲开展合作。”
Matt Wood坦言,就生成式AI而言,目前仍处在一个非常初期的阶段,这是一场长期的竞争,是一场长跑。
“在某些用例当中,生成式AI是有局限性的。例如在生成文本的时候,人工智能可能会给出完全错误的答案,但是表现得非常自信,让人产生一种完全错误的幻觉。这是一个相当困难的问题,尤其当用户本身不知道答案的情况下,很难辨别人工智能提供答案的准确性,无法判断语言模型给出的结果是对还是错。”
Matt Wood透露,亚马逊云科技在内容筛查和过滤方面,已经做了很多努力。
“使用Amazon Bedrock,用户可以使用自定义数据,让这种自信满满回答全错的情况,发生的概率大大降低。同时,我们努力确保人工智能模型,给出的答案和解决方案不会对用户产生伤害。包括对输入的信息和数据进行过滤和检查,以及非常认真地核对模型产生出的答案,以确保给出的回复是健康无害的。”
(科创板日报记者 黄心怡)