多知网2月9日消息,近日,随着ChatGPT在全球范围内的迅速走红,有投资者在投资者互动平台向科大讯飞(002230.SZ)提问:语言模型的落地抢滩在全球范围内已经是白热化状态,随着ChatGpt火出圈,谷歌马上推出自已的Bard,百度三月要出文心一言。科大讯飞要怎么办?公司在中文对话系统上是怎样考虑的?将技术置入公司的教育学习和医疗服务产品中是否已启动了?
对此,科大讯飞回应道,ChatGPT主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,科大讯飞在该方向技术和应用具备长期深厚的积累:科大讯飞主导承建了认知智能全国重点实验室(科技部首批20家标杆全国重点实验室之一),多年来始终保持关键核心技术处于世界前沿水平(例如,科大讯飞于2022年就获得CommonsenseQA 2.0、OpenBookQA等12项认知智能领域权威评测的第一),同时已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一(在Github平台的中文预训练模型的星标数达13346位列第一,是第二名的2倍)。
公司已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布,该技术突破将在AI学习机的中英文作文辅导、中英文口语学习等方面带来显著提升。
同时,科大讯飞还表示,2023年会持续升级该系列技术,并陆续应用于公司在教育、医疗、汽车、消费者等多个行业赛道的既有产品,持续提升核心技术效果和产品体验。
这是科大讯飞就类ChatGPT技术相关布局的再次回应。在此前1月31日披露的投资者关系活动记录表中,针对“讯飞在自然语言理解等认知智能技术中取得了非常好的效果。目前来看,海外已经产生了ChatGPT等一些爆款应用,请问公司是否已经有所布局?”这一问题,科大讯飞便已表示:
2018年起,预训练模型范式就逐步开始在自然语言处理领域应用,包括谷歌、微软、OpenAI、科大讯飞、智源、鹏城等单位陆续推出预训练模型。科大讯飞在预训练模型方面,有坚实的相关技术积累,成为业界最广泛流行的中文预训练模型之一。
2017年,科技部正式批复依托科大讯飞建设认知智能国家重点实验室,这也是我国在人工智能高级阶段认知智能领域的首个国家级重点实验室。2022年在国家重点实验室重组后的首批20个国家标杆实验室中,讯飞是唯一一家承建认知智能全国重点实验室。同时,讯飞面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,开源3年模型库月均调用量超1000万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达13346位列第一。2022年,讯飞进一步发布了面向多模态领域的两个轻量级预训练模型,实现多尺度层级预训练、有监督强化聚类表征、多预训练任务联合优化框架等创新点,在参数量远小于业界公开模型(参数量小20倍以上)的情况下识别效果提升了20~30%,效果上实现了业界领先,同时也获得全球多模态阅读理解评测冠军等优异成绩。
科大讯飞同时表示,其有信心在预训练认知智能大模型上代表中国实现突破。首先,科大讯飞承建了中国唯一的认知智能国家重点实验室,具备算法实现和持续创新的能力,已经在众多国际比赛中夺得冠军;其次,公司的训练服务器、推理服务器在国产自主平台运行至关重要;第三,预训练模型在专业领域,诸如在教育领域,医疗领域,如果能够和行业场景深度结合,潜在商业价值的机会空间巨大。