三言科技2月4日消息,昨日,周鸿发文谈到了DeepSeek能够取得巨大技术突破的原因。
周鸿认为,首先人才策略上DeepSeek研究人员都是年轻人,且为国内名校硕博毕业五年内的。
其次,组织架构上,是扁平研究的文化,DeepSeek团队一百多人,就三层,梁文锋、小组长和一线员工,并且很多组长不打绩效,不会过度分工。
第三,梁文锋对创新的渴求很高,鼓励突破式创新。此外,DeepSeek用自己的钱,“不用看任何人脸色”。
第四,目标,DeepSeek最重要的是专注,它的资源很紧张,但是足够聚焦。
以下是全文:
很多人问我说为什么deepseek能取得如此大的技术突破,以至于以一己之力撼动了全球的ai 工业,让美国政府大打出手。别的公司为什么研究不出来?
我觉得分成这么几点吧。
第一,人才策略上,deepseek的研究人员是清一色的年轻人,都是国内名校硕博毕业五年内的。梁文峰也说过自己的招聘标准,聪明加热爱,不要经验多的,与大厂要经验完全不同,没有行业老人,没有十年以上所谓的资深ai研究员。因为大模型17年才出来,国内正式研究大模型23 年才开始,所以以前积累的所谓的人工智能经验,什么自然语言处理经验,基本都是负资产。很多大厂的老研究人员因为有历史的包袱,还停留在哪里不懂就标注哪里的阶段,没有scaling规模化的理念。
不客气的讲,在巨大的技术变革面前,经验更多的是束缚,一张白纸加上第一性原理才是创新的源头。
第二,组织结构上,是扁平化研究的文化,deepseek团队也就一百来人,就三层,梁文峰、小组长和一线员工,并且很多组长也不打绩效,主要协调下面的资源,也不会过度分工,大家一起为最终模型的效果负责。日常都在一些群里讨论,主打一个自由宽松的研究风格。
反观互联网大厂,一线到一把手少的五层多的八层,传话就够累的,更别提高效决策了。分工也分的特别细,就像我要吃个炒鸡蛋,有人打蛋,有人切葱花,有人倒油,有人架锅,有人炒蛋,还有人端盘子。分工分的细呢就导致每个人都不对结果负责,每个人都要背一个自己的kpi,短期压力很大,即使有能力也没有勇气创新,半年没产出就要给你降级了。
那为什么创业公司也不行呢?那就要聊聊文化。
其实公司的文化核心就是老板的文化,在小公司更是如此。梁峰对创新的渴求很高,小创新他根本看不上,会鼓励突破式创新。同时也亲自为高风险负责,失败了也不用你背锅。而其他公司哪个老板能做到呢?
这里还有一个重要的点,deepseek用自己的钱,不用看任何人脸色,就不用被VC或者CEO牵着鼻子转,想咋干就咋干。所以一个懂技术、有理想、财富自由的老板才是核心。
第四个,目标,deepseek最重要的是专注。其实deepseek的资源是非常紧张的,应该也就一万来张卡吧,肯定不止两千张卡了,但是它足够聚焦。
其实这个也不是我总结的,是我在哪个群里看到的总结,我就把它提炼了一下,感谢最早写这个的朋友,这也值得我要去反思一下我们公司的人工智能策略。