2月21日,中国AI初创公司DeepSeek公开表示将加大开源AI模型的力度,于下周起再开放5个代码存储库,称此举是“小而真诚的进步”,并将完全透明地分享技术。
DeepSeek在社交媒体平台X上表示:“没有象牙塔只有纯粹的车库能量和社区驱动的创新。”
DeepSeek创始人梁文峰去年7月接受采访时曾表示,该公司并不优先考虑其人工智能模型的商业化,而是通过开源获得“软实力”。
就在DeepSeek加码开源的同时,包括上海交通大学、深圳大学、浙江大学在内的多所高校本月都宣布开设DeepSeek课程。
上海交通大学在其官方微信上表示,已部署DeepSeek升级课程的AI学习工具;深圳大学称,此类课程将帮助学生了解关键技术以及安全、隐私、道德和其他挑战。
自上个月以来,DeepSeek的用户群呈爆炸式增长。据跟踪AI产品的网站Aicpb.com数据,在中国,截至1月11日,DeepSeek每日活跃用户数为2220万。
DeepSeek人工智能突破也被誉为中国的“斯普特尼克时刻”,引起了广泛关注。而这背后,培养出梁文锋这样全球顶尖人才的浙江大学AI发展模式备受关注。浙大模式也成为与孕育出Kimi大模型的清华系人工智能发展模式并驾齐驱,成为中国新一轮AI发展的两大关键力量。
近日,梁文锋和月之暗面创始人杨植麟论文“撞车”更是引发热议。前者发论文关注原生稀疏注意力(NSA),后者提出块注意力混合(MoBA)新方法,二者都直指算法优化。
据介绍,清华依托“姚班”、“智班”等顶级实验室,聚焦通用人工智能底层技术突破,以计算机系、自动化系、交叉信息研究院为三大支柱,重点攻关大语言模型、强化学习、芯片架构等领域。
清华系人才占据了目前国内头部AI公司的半壁江山。月之暗面的杨植麟、智谱AI的张鹏、百川智能的王小川都毕业于清华,面壁智能创始人刘知远也是清华副教授。此外,旷视科技CEO印奇、小马智行联合创始人楼天城都出自清华姚班;Lepton AI创始人、原阿里副总裁贾扬清,以及被美团收购的光年之外创始人王慧文和王兴也都是清华校友。
而浙大模式则以竺可桢实验班(“竺院”)为核心,强调“学科交叉+场景驱动”,以计算机学院联合医学院、管理学院,推动AI在医疗影像、金融科技等垂直领域的快速落地。“竺院”也是学神云集之地,拼多多创始人黄峥、每日互动董事长方毅、“超材料领军人物”光启科学董事长刘若鹏等人都出自“竺院”。
“竺院”的前身为浙大“混合班”,每届选拔120人,将不同专业的学生“混合”在一起进行培养,培养了DeepSeek梁文锋、浙大原校长吴朝晖,以及从计算机跨界到医疗的树兰医疗创始人郑杰等。
“混合班加强对学生理工科的培养,学生来自不同专业,浙大的计算机系专业生也是混合班的主力。”一位浙大混合班校友告诉第一财经记者。他表示,浙大计算机系已经出了至少4名院士,包括潘云鹤、吴朝晖、陈纯以及路甬祥。
清华大学国强教授、智能产业研究院首席研究员聂再清对第一财经记者表示:“清华和浙大的计算机和相关基础教育都非常扎实,学生的基础素质都特别好,同时学校的行胜于言校风也特别适合AI算法的原创研发。”
他还特别提到,浙大潘云鹤院士很早前就在推动《新一代人工智能发展规划》,令人印象深刻。“这应该对浙大的人工智能人才培养也有很大的正向激励作用。”聂再清告诉第一财经记者。
(本文来自第一财经)