晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI
艰难的2020年即将结束,回首这一年,疫情带来痛苦与不便,而AI等技术却带来了新的希望。
史上最强大的自然语言模型GPT-3诞生,AlphaFold、LinearFold等用AI解决生命科学难题。
在国内的产业界,AI技术也达到了空前的应用规模。
作为国内的AI“头雁”企业,最近百度发布了《百度AI的2020》,总结回顾百度的一年,展示了其在AI新型基础设施、产业智能化、AI服务社会和人才培养等方方面面的进展和成果。
百度CTO王海峰谈到:
世界的2020,是充满不确定性的变局之年;中国的2020,是团结一心、共克时艰、于变局中开新局的希望之年;百度AI的2020,是坚定信念,拥抱变化,践行“科技为更好“的实干之年。
回望2020年,抗击疫情中,百度AI第一时间贡献了科技抗疫、保护生命安全的温度和力量;复工复产和高质量发展中,百度AI是促进创新、构建新格局的新动能;我们的工作和生活中,百度AI在你搜索的每一条信息和知识里、在地图导航的叮咛声中、在国际会议的同传字幕上、在工厂的无人质检设备上、在自动驾驶出租车持续拓展的里程上……百度AI在我们身边每个角落,让我们的工作更高效、生活更便捷。
2020,百度AI的实干之年继续自己的特色之路:持续创新突破,探索科技前沿;自主可控、开源开放,夯实软硬一体AI大生产平台,打造AI新型基础设施;云智一体,使能行业,赋能生态,加速产业智能化。
立足新发展阶段,以新理念建新格局,科技创新是关键。百度AI的2020,与时代共前行。
这份成绩单向我们展示了百度AI是如何影响我们生产生活方方面面的。下面就让我们逐一展开。
夯实技术基础
作为国内最早深耕AI技术的公司,百度过去一年继续靠研发夯实AI基础:
百度大脑6.0不断坚持底层创新,已经具备“知识增强的跨模态深度语义理解”能力;
飞桨平台持续迭代升级,成为最大的国产AI生态社区,继续坚持走自主可控道路;
AI芯片在产业中规模化应用;
顶会论文、国际冠军层出不穷,在全球学术领域展现中国力量。
在万难的局面下,百度AI依然能继承2019年的高速发展,持续向全行业释放AI能力,让AI真正成为“新基建”的基石。
百度大脑6.0
百度从2010年开始布局AI,目前已经深耕十年,百度大脑也走过了十年的历程。
今年在百度世界大会上,王海峰携百度大脑6.0亮相。
近5年来,百度大脑几乎一年一次重大升级,形成了包括基础层、感知层、认知层、平台层和AI安全在内的完备技术体系。百度大脑6.0现已成为能力全面、软硬一体的AI大生产平台,实现了“知识增强的跨模态深度语义理解”能力,其结合了知识图谱和深度学习技术,使得人工智能不仅能具备知识,还能持续学习。通俗来说,就是像人类一样将各类技能融会贯通、持续学习。
百度世界大会上展出的李彦宏与康辉两个虚拟人“小李”和“小康”对话,能听、能说、能看、会思考,集中体现了百度大脑的综合能力。
在图像和语音的语言一体化理解方面,百度大脑的OCR识别准确率提升了24%,语音识别准确率和交互成功率大幅提升。
语音识别层面,百度推出端到端信号声学一体化建模;语音合成层面,则是Meitron和单人千面合成个性化。
视觉计算方面,百度大脑6.0让视觉计算走向极致效率,为算法开发者开源Slim系列模型,为业界提供最小的文字、人脸识别等模型。
百度大脑中的NLP框架“文心”(ERNIE)取得进一步提升,尤其在中文语义理解上,文心在业界依旧处于领先地位。
相比去年,在8项NLP任务中,其语义理解的准确率相比去年提升了2.07%。
今年,百度还提出了基于多流机制的预训练语言生成技术ERNIE-GEN和知识增强跨模态语义理解技术ERNIE-ViL。
ERNIE-ViL首次将场景图知识融入到跨模态的预训练模型中,在视觉问答、图像检索等5个典型的跨模态任务上取得了SOTA效果,并在跨模态语义理解权威榜单VCR上登顶榜首。
今年发布的文心语义理解平台,将全面的NLP算法集、端到端的开发集和平台化服务于一体,提供数据处理、模型训练、模型评估、模型部署等环节提供一整套工具,一站式帮助企业实现智能化转型。
百度大脑是百度多年AI技术积累和业务实践的集大成,它不仅仅是百度AI的“大脑”,还正在通过百度智能云输出给社会各界,支持各行各业智能化升级,成为全行业的“AI大脑”。
百度飞桨
据最新数据,百度深度学习平台飞桨至年底已拥有265万开发者,服务了10万家企业,支持超过200个产业级AI算法,创造了34万个模型。
去年此时,飞桨的开发者数量还是150万,如此快速地增长,可谓一骑绝尘。
相比国外平台,百度飞桨虽然起步稍晚,但大有后来居上之势。
4年前飞桨刚刚上线时,没有人会想到飞桨会有如此大的影响力。
数日前,IDC发布了一份中国深度学习平台市场综合份额的报告。报告指出,谷歌、百度、Facebook稳居前三,占据70%以上市场份额。其中,百度占比提升3.38%增速第一,综合市场份额位列第二。
究其原因,飞桨这一年做了太多“接地气”的工作:
百度非常重视培养国内开发者,更了解国内工业界的需求,开发者也乐于选择飞桨平台。
飞桨开源框架V2.0RC版本,带来“编程一致、动静统一”的全新开发体验。飞桨动态功能走向成熟,并实现动态图转静态图训练和部署的能力;API全面升级,分为19大类,结构更体系化,功能更强大。此外,飞桨硬件生态伙伴达到20家,适配或者正在适配的芯片/IP型号29种,提供自主可控的坚实底座,加速AI产业生态构建。
面向工业界,百度的企业版零门槛AI开发平台EasyDL,一站式支持智能标注、模型训练、服务部署等功能,携手70万用户服务20+行业场景,让企业智能化转型更高效。
现在EasyDL内置了视频、图像、文本、语音等六个技术方向的预置模型,今年上线的智能数据服务平台更是将数据标注的时间平均减少了74%,大大提升了企业效率。
面向教育界,百度加大在学习平台AI Studio上投放教学资源、算力资源的力度,并于近日公布了5亿元的高校人才培养计划,为技术圈输入“新鲜血液”。
自疫情以来,AI Studio举办线上直播课程176次,累计学习人次290万。
未来三年,飞桨将投入总价值5亿元的资金与资源,支持全国500所高校,重点培训5000位高校AI教师,联合培养50万AI未来人才。
难能可贵的是,百度飞桨能同时在产业界、学术界两方面收获了不错的口碑,站稳企业市尝完善开发生态,不得不说飞桨在用最实际的行动助力AI应用落地。
AI芯片
在AI芯片方面,百度实际上十年前就已经开始探索。早在2010年,百度就已经在用FPGA研发AI架构,2011年就部署上线。
如今,百度昆仑芯片的生态环境已初步建立,支持多款国产处理器,适用于语音、图像、NLP等多个场景。
百度方面披露,截止到今天,昆仑1已经量产超过2万片,在百度搜索引擎和百度智能云生态伙伴等场景广泛部署,赋能互联网、工业制造、智慧城市、智慧交通、科研等领域。
相比英伟达T4 GPU,百度昆仑1的性能在不同模型下有1.5-3倍的提升。
另外,百度“昆仑2”芯片已提上日程,相对第一代性能提高了3倍,将于明年上半年量产。
百度在软件上积极支持其他国产厂商的AI芯片。
目前,飞桨硬件生态伙伴达到20家,适配或者正在适配的芯片/IP型号29种,并且在国产芯片支持上一直处于遥遥领先的状态。
顶会论文与专利
今年百度被国际顶会收录论文达260多篇。
其中有11篇入选ACL 2020、22篇入选CVPR 2020、6篇入选EMNLP 2020、7篇入选ICML 2020……
在诸如 CVPR、ACL、ECCV、NeurIPS、INTERSPEECH等全球顶级的人工智能学术会议和相关竞赛上,百度AI问鼎冠军30余次。
尤其是国际顶会ACL见证了百度NLP技术十年的发展。
十年前,百度迎来NLP领域专家王海峰,此后,王海峰出任ACL五十年来首位华人主席,为中国NLP在国际上“破圈”做出重要贡献。今年,百度领衔组织了ACL大会上首场同声传译研讨会。
百度凭借自身的实力,成为了国际AI学术圈一支不可忽视的力量。
2020年12月,在人工智能专利申请量和授权量方面,百度以9364件专利申请和2682件专利授权处于第一位。这也是百度连续三年在该人工智能领域专利分析报告中总申请量蝉联第一,展现出中国AI“头雁”的实力。
此外,百度在深度学习技术、自然语言处理、智能语音、自动驾驶、知识图谱、智能推荐、交通大数据多个领域位居专利申请量和授权量首位。
应用全面开花
坚持AI技术为产业服务,也是百度AI在2020年的另一大主题。
2020年,百度AI一方面通过搜索、地图、输入法、小度、Apollo等产品和平台服务大众,让生活更简单、更便捷;另一方面通过百度AI to B的重要承载者和输出者百度智能云,为各行各业大规模输送百度的AI技术成果与平台能力,支持产业智能化升级,促进智能经济的到来。
尤其在自动驾驶领域,百度Apollo这一年成绩斐然。
自动驾驶
今年,百度Apollo自动驾驶获得超过十项中国第一,技术实力领跑行业。
在今年与央视新闻合作直播的“百度世界大会”上,Apollo首次展示了全无人驾驶技术,即人工智能系统在没有车内安全驾驶员的情况下独立驾驶。
全无人驾驶是百度Apollo历时7年的研发成果,在全无人驾驶+5G平行驾驶的技术支持下,去掉车上的安全员的这一步,实现了Robotaxi商业闭环中的必要条件,将加速中国自动驾驶大规模商业化部署。
Apollo已经获得全国首批智能网联汽车主驾无人测试许可,长沙的自动驾驶车队可正式去掉主驾安全员,在长沙开放道路上开展完全无人驾驶的路测。
5月26日,百度位于北京亦庄经济开发区的全球最大的自动驾驶和车路协同应用测试基地Apollo Park建造完成,这将加速推进Apollo自动驾驶、车路协同技术产品的成熟和应用。
这一年,百度Apollo先后在长沙、沧州、北京开放自动驾驶出租车服务。10月12日当天北京地区呼单量突破2600单,百度也成为中国唯一一家在多城开启Robotaxi试运营的公司。
除无人驾驶外,Apollo智能车联与超过70家车企合作,合作车型超过600款,伴随1500万车主累计行驶156亿公里,已实现超过100万台的小度车载OS前装量产搭载,在2020年智能新车市场占比第一。
据IHS Markit最近发布的《中国智能网联市场发展趋势报告》显示,2020年小度车载在智能网联汽车领域搭载量已经稳居世界第一。
百度以《Apollo 智能交通白皮书》形式,发布了国内外首个车路行融合的全栈式智能交通解决方案“ACE 交通引擎”。
“ACE交通引擎”扎根中国智能交通新基建,目前已获近20个城市的智能交通新基建订单。其中,百度Apollo中标的“广州市黄埔区广州开发区面向自动驾驶与车路协同的智慧交通‘新基建’项目”,项目金额接近4.6亿元。
根据百度在北京、广州、长沙、沧州、重庆、合肥、阳泉、南京等城市开展的实践经验,以车路协同为基础的智能交通基础设施建设,将能够提升15%-30%的通行效率,这意味着对于GDP绝对值2.4%-4.8%的增长,对国家经济的发展具有重大意义。
智能云
作为百度AI to B的重要承载者和输出者,百度智能云融合了云计算、百度大脑、大数据等百度核心技术,推出 “以云计算为基础,以AI为抓手,聚焦重要赛道”的全新战略,推动产业智能化发展,成为新基建大潮中加速AI工业化大生产的关键力量。
百度智能云持续对外输出百度大脑的AI技术,为智慧城市、金融、医疗、工业互联网等行业提供技术支持。
在智慧城市领域,百度目前已在北京海淀、重庆、成都、苏州、宁波等10+省市落地应用。
在金融领域,百度智能云已经服务了近200家金融客户,其中包括国有6大银行、9大股份制银行、21家保险机构,涉及营销、风控等十几个金融场景。
百度智慧医疗“灵医智惠”已经服务300+家医院和1500+家基层医疗机构,辅助数万名医生,惠及超过千万患者。
百度工业互联网助力企业及上下游产业实现数字化、网络化、智能化,用智能制造覆盖14大行业,30+家企业,16个合作伙伴,触达32类垂直场景,在3C、汽车、钢铁、能源等行业已规模落地。
突发的疫情激活了企业对于在线办公的需求。百度依托“AI 中台”和“知识中台”,发布新一代智能工作平台“如流”,助力企业提效创新,加速企业智能化转型。
AI产品与平台
百度AI不仅在为全行业服务,在过去一年中还大大提升了百度移动端应用的体验。
基于自然语言处理、知识图谱、语音、视觉、深度学习等AI技术能力,百度搜索也在持续智能化。
今年9月,百度基于百度大脑核心技术驱动,底层采用小度助手对话式人工智能操作系统,推出虚拟助手“度晓晓”App。
度晓晓拥有二次元虚拟人物形象和独特的情感交互系统,可以像真人一样跟用户沟通,解决用户的问题。而且度晓晓可以根据不同用户的性格和爱好,实现个性化体验。
百度输入凭借AI功能、语音输入等方面的领先优势,进一步确立了行业的领先位置。
现在百度语音输入实现了98.6%的语音识别准确率,并具有离线识别、方言识别等功能技术突破;手写识别准确率提升至96%居行业首位、AI滑行输入精准率超越行业最高水平15%。
2020年,百度地图延续并坚守了“新一代人工智能地图”的AI优势和创新能力,升级出行服务,上线熟路导航模式、车道级导航功能、AI室内通和红绿灯倒计时功能。目前,百度地图90%数据生产环节实现AI化;中国领先的智能化位置服务平台升级生态全景2.0,输出九大行业解决方案;全景地图覆盖全国95%以上的城市,覆盖里程超过300万公里; 智能语音交互场景也实现迅速增长,百度地图智能语音助手用户量已破4亿
2020年,小度助手和小度智能硬件产品成绩一如既往的亮眼。
今年3月,小度助手语音交互次数达到65亿次,是去年同期的近3倍;小度第一方设备语音交互次数达到33亿次,是去年同期的近5倍。
硬件方面,Canalys的统计数据显示,2020年Q1小度全品类370万台的出货量位居国内第一、全球第二;前三季度,小度智能屏出货量稳居全球第一。
结语
百度CTO王海峰在回顾总结百度AI的2019年时曾说道:
“2019年,百度AI前行的每一步,走得稳健而笃定。我想,或许可以用三句话来描述2019百度AI人的成果与努力:
我们打造了扎实的底座;
推动了真实的改变;
创造了值得信赖的未来。”
对比2019年,百度AI这一年没变,不变的是坚持将AI技术研发和应用推行到底的决心。无论是作为AI新型基础设施的百度大脑6.0、云智一体的百度智能云和已经跑在多城的Robotaxi,我们都能看到百度在延续2019年的足迹。
这一年百度AI也在变,变的是未来图景更加清晰,AI技术更为全面与强大,落地应用更加深入大众生活。
这让人想起一句诺奖得主菲利普安德森的一句名言:More is Different。
当百度将更多的AI技术与产业应用组合在一起时,未来释放的威力是难以估量的。