Web3天空之城城主
先声明一下,以免有同学认为标题后半段过于耸人听闻,这是一个直接的引用,来自于一位美国学者的视频《DeeSeek不仅在颠覆人工智能领域,也正在撼动美国资本主义》,视频可以在本城B站观看:https://b23.tv/dYalmTH
视频内容不长,文字版先行附上:
"DeepSeek是一家中国人工智能公司,正在挑战美国资本主义的模式。美国经济与大型科技公司紧密相连,没有它们,经济增长将极其有限,股市也几乎不会增长。美国经济的繁荣神话,很大程度上建立在股市屡创新高,而这主要得益于人工智能的炒作价值。
然而,DeepSeek以少量资金,开发出似乎优于ChatGPT的AI模型。它能出色地回答问题,但却采用了一种与众不同的方法:不使用英伟达的高科技芯片,能耗远低于后者,且基于更廉价的大型语言模型。
DeepSeek的作为具有深刻的颠覆性,动摇了美国资本主义的根基。美国资本主义基于三个核心理念:首先,最大限度地保护发明,将财富集中于少数人手中,造就了“科技兄弟”以及相关的财富分配不均;其次,尽可能地反竞争,专利律师成为核心角色,通过法律手段阻碍竞争,从而维持高价;第三,由于缺乏竞争,导致效率低下,没有动力降低成本。
你财力雄厚,可以随意挥霍,拥有舒适区,让很多人为你工作,即便他们并非必需,你仍然能申报巨额利润,感觉像城堡之王,享受员工的感激之情。因此,你缺乏精简、强硬和高效的动力,这与市场资本主义的理想背道而驰,尤其在美国更是如此。
DeepSeek粉碎了这些神话。它成本低廉,市场策略迥异,甚至开源了源代码,任何人都可访问和使用,这与美国模式截然相反。它并非设置法律障碍,而是开放共享,虽然它依然会对大型语言模型和答案收费,但价格远低于美国公司。
这得益于其低端技术和更低的能耗。这实际上推翻了特朗普当选前流行的投资策略,该策略认为数十亿美元投资人工智能将带来增长,从而让特朗普继续执政。
然而,事实并非如此。人们不禁怀疑,这是否是中国政府为削弱特朗普潜在关税战而精心策划的时机。我确实有这种怀疑,所以坦言之。但DeepSeek确实有效,我见过它生成的优秀内容。
无论这是否是中国政府的策略,DeepSeek都成功扰乱了美国人工智能市场,甚至可能阻止美国获得该领域的全球垄断地位,如同微软、谷歌和推特等公司所享有的那样。如果DeepSeek及其中国竞争对手能创造出与OpenAI、微软、谷歌等公司高成本产品截然不同的产品,那么人工智能领域的垄断趋势可能无法复制。
我不知道这将走向何方,也无法预测,我相信其他人也无法预测。这可能只是一场小风波,但让我们假设并非如此。如果DeepSeek的成功属实,那么特朗普对美国市场的号召所建立的整个基础将被摧毁。
更深层次的是,如果以人工智能及其潜力为基础的美国经济力量被摧毁,那么特朗普建立以关税壁垒为后盾的孤立主义美国的计划也将不复存在。DeepSeek的意义远超其作为AI模型的优劣,它正在挑战美国资本主义的核心,以及美国右翼的哲学核心。
中国政府是否选择在特朗普政府上任伊始破坏这些意识形态并不重要,因为它无论如何都会这么做。
这可能产生巨大影响。
DeepSeek在AI圈的震荡还在继续。
而且,看不到结束。”
--
这几天DeepSeek给予美国的大地震仍然在继续,看不到结束。
让我们中立一点, 先不对美国资本进行什么评论。但肉眼可见的是,DeepSeek正在分化美国科技巨头。
DeepSeek黑天鹅出来之后, 首先着急跳出来的就是OpenAI和Anthropic两小强。
OpenAI的表态还是相对含蓄的,甚至在今天,OpenAI被迫提前发布了GPT O3-mini后,奥特曼在线上问答中非常坦诚在表示过去自己可能选错了方向,他承认: DeepSeek 减弱了 OpenAI 在人工智能领域的领先地位,OpenAI 在开源其技术方面“站在了历史的错误一边”。需要“ 找出一种不同的开源策略,”奥特曼还说:“并不是所有 OpenAI 的人都持这种观点,这也不是我们目前的最高优先事项……我们将会推出更好的模型,但我们将保持的领先优势将比以前几年少。”
这个表态对于一心闭源要搞商业化的奥特曼来说是不同寻常的。特别是最近OpenAI被曝出正在进行新一轮数百亿美金融资。
更有意思的是Anthropic,其创始人CEO Dario Amodei发了长篇文章回应。Dario作为前OpenAI首席科学家,号称因不满OpenAI的封闭而自立门户,在以往的访谈里, Dario都以(相对OpenAI)伟光正的科学家形象出现,以打造安全性AI作为自己公司的标签,作为估值超高且唯一能和OpenAI掰手腕的AI大模型创业公司,Anthropic一直都是资本的香馍馍,特别是错过了OpenAI的AWS和Google,之前基本上抢着给Anthropic送钱,只为了搭上AI大模型这趟车。
在这篇万字长文里,Dario不再提如何让AI普惠人类,不再谈人类文明共同进步,而是强调要加强对中国的芯片和显卡管制,要如何限制中国AI大模型发展,要把AI的领导权留在美国。
感觉他急了。
这篇文章实在有点酸,以至于和Anthropic有密切联系的开源社区HuggingFace创始人直接在X上喷这篇文章实在让人“读得很痛苦”。
对此城主只能评论,DeepSeek直接扯下了Anthropic的面具。
如外文评论,DeepSeek的出现,最大的输家莫过于Anthropic,OpenAI好歹手里还有推理模型o系列,最强的满血版o3尽管推理成本奇高,但还是地球最强- 虽然不知道这个最强还能维持多久。Anthropic可是完全没有公开的推理级大模型的,在这个CEO出来发酸文的同时,Anthropic内部技术人员大概率在捧着DeepSeek无私共享的论文拼命复现R1。由于DeepSeek发布了顶级推理模型的技术原理,可以想见Google,微软,AWS,meta这些巨头的技术部门都在如获至宝的依照论文打造自己的推理大模型,在这种局面下,没有拿出推理大模型的Anthropic在AI界的地位就真的很尴尬了,Dario估计在烦恼,如何继续讲好自己公司那么高估值的故事。
之前城主文章有提到过,尽管OpenAI和Anthropic官方都防中国人使用,但程度是不一样的,OpenAI的页面和API只需要简单的翻个墙就可以用了;Anthropic对疑似来自中国的用户的封禁措施只能用发指来形容,是城主见过的最夸张的封禁措施;无责任猜测,Anthropic应该是用上了自家AI来帮助分析封禁。同时,据传Anthropic内部绝对禁止和中国人交流。所以在DeepSee V3和Claude3.5 Sonnet并驾齐驱,且R1妥妥超越之后,Anthropic CEO肉眼可见的着急和口不择言是可以理解的
但撕下了面具,以后带上就难了。基本上可以评论,Anthropic只是一个被资本劫持,被DeepSeek怼得有点慌张的AI先行既得利益者而已。(以上欢迎Anthropic内部人士来指正)
而对于大公司, 就更有趣了。
最新的消息是各大科技巨头,包括微软Azure, AWS,NVIDIA,都第一时间在自己的云服务部署提供了DeepSeeek R1服务。
打不过,就加入。真香定律谁也逃不过。
微软这一边还号称在调查DeepSeek是否从OpenAI“盗窃”数据,一方面自己就部署上了。这个做法不敢说滑稽,只能说真香。首先需要明确指出,某些美媒所谓的‘盗窃数据’只是又一个惯用的混淆视听的舆论做法罢了。作为大模型训练惯例的“蒸馏’(即利用了其他模型的公开输出作为训练数据 -- 况且DeepSeek有没有,用了多少都没有任何定论,全在猜测)和盗窃企业内部保密数据是本质的区别的。
美国网友就直接嘲讽,OpenAI恐怕忘记了自己还身背多个指控,未经许可非法使用《纽约时报》,油管视频等数据来进行自家大模型训练。
当然,我们不能以一方的瑕疵去证明另外一方的正确与否。只是,微软一方面指责DeepSeek R1可能有问题,一方面又怕被抢了API生意赶紧部署在自家Azure云上,这一手就略有喜感了。
然后看看NVIDIA。如果说周一纳斯达克因为DeepSeek载入史册的大跌是反应过度,这几天NVIDIA的股价却并没回升-- 而是一直呈现反复挣扎之态,昨晚继续跌了4%,维持在了DeepSeek黑天鹅后的低位120美金。
平心而论,NVIDIA的芯片+CUDA生态在相当时间里仍然是独一份,但或许这正是这两天NV还在低位的根本原因 - 根据最新的论文解读,DeepSeek为了在H800这个性能一般的GPU上训练大模型,甚至直接绕过了CUDA这个NVIDIA的软件层,直接使用了类似CPU汇编语言的NV硬件编程语言来操作GPU,做出了非同一般的深度优化。
这个事情的意义有点深。NVIDIA的护城河是什么,绝对不是GPU硬件本身,而是构建在GPU之上的CUDA软件生态。业界绝大部分的AI训练推理都深度依赖于CUDA软件层 -- 这也是AMD如此痛苦的原因,即便生产出了同一级别的GPU, 做AI的大模型企业和个人用户也不愿意选择AMD,无他,因为大家都需要在CUDA上运行大模型的训练和推理。
AMD也不是没想过办法,不就是软件吗,只要能兼容CUDA的API接口就可以了。在此前AMD还真的这么做了,利用开源社区开发的CUDA兼容层二次开发以让自家GPU硬件在软件层兼容CUDA,结果是,被NVIDIA告了。。。
那些炒作NVIDIA黄仁勋和AMD苏姿丰是亲戚的帖子毫无意义,这两家基本上水深火热着呢,无怪乎苏姿丰最近直接和媒体说,和黄仁勋关系太远,不熟。
而现在, DeepSeek抛开了CUDA,直接使用底层GPU汇编语言实现了最顶级大模型的训练。这简直就是AMD的天赐良机,AMD已经第一时间官方发布新闻,宣称在自家GPU硬件上跑DeepSeek R1比在Nvidia 硬件更快。
GPU硬件的体系架构基本上是大同小异的,硬件之间的一点点差别, 完全可以依靠底层汇编语言弥补 - 因此Windows DirectX才有可能统一所有显卡图形接口呢。而现在,DeepSeek团队被逼着使用底层汇编语言来操作GPU硬件, 硬生生的在CUDA生态上撕开了一道口子,这对NVIDIA无疑是个公关的晴天霹雳。在DeepSeek之前我们基本没听说过这种操作,一来没必要,二来团队的水平一般也做不到这点。NVIDIA对这个事件估计没有任何思想准备,但幻方做到这么极致也不意外,做量化交易的公司,对性能和延时等都极度敏感,往日的技术积累再加上被严格限制的芯片,使用更底层的算法实现性能的最大程度压榨非常理所当然。如果没有美国的限制,DeepSeek大概率不会在如此的规模上率先实现这种壮举。
当CUDA不再成为壁垒,高兴的显然不止是AMD,国产GPU芯片也终于看到曙光。如果最终大规模的模型训练和推理都可以在底层汇编语言上实现,而不依赖于CUDA,美国对中国的算力封堵,是否问号变得更大了呢。
华尔街的眼睛还是很犀利的,NVIDIA的困境显然被看在资本的眼里,这恐怕也是为什么NVIDIA的股价被打压之后未能直接恢复的原因了。如果美国继续芯片封堵的政策,可以想见,国产算力环境CUDA替代化的运动必将如火如荼的展开,当走到这一步,美国恐怕就真把NVIDIA坑惨了。
所以此前黄仁勋上了新闻的不参加总统就职典礼,也算是一个明确的态度,和米国zf芯片封堵的政策划清界限。
城主对NVIDIA和黄仁勋还是很佩服的,也希望NVIDIA能继续好好的对国内做生意。(5090D这种直接锁算力不让运行AI计算的垃圾就不要卖到中国了。)
在大厂里,Google其实是当下最舒服的一家,Google不像微软那么尴尬,一手要安抚OpenAI一手还要登上DeepSeek R1这艘船,搞得自己打脸。G家完全可以基于自家Gemini AI模型的研究基础,利用DeepSeek发布的论文实现自家的推理模型,按照G家的技术实力, 应该很快。微软本来也有这个本事,无奈自家模型还不太争气,恐怕AI团队建设比G家也差了一些,同时,微软的AI领导人穆斯塔法和G家的AI掌门人诺奖得主Demis Hassabis 虽然同出自DeepMind,但在技术管理水平上是否还有差距。在这个开卷考试(拿着DeepSeek论文去复刻)中,城主认为G家大概率是获胜的,我们不妨拭目以待。
声势浩大的上线DeepSeek R1的还有AWS。对于亚马逊而言,这毫无疑问也是一个好机会。在此之前,AWS仅依靠Anthropic的Claude API在大模型市场上占了一小块版图,如不是花大价钱投资Anthropic换来了在AWS上的Claude API部署,AWS在AI时代就真挺尴尬的。现在AWS第一时间上线DeepSeek R1的动机非常可以理解,毕竟这是唯一一个可以和竞争方OpenAI o1/o3推理模型掰手腕且性价比超高的大模型,哪一家云厂商没有提供这个模型, 就意味着在AI云业务上失去了一大块竞争力;这一点,无论如何云业务负责人都不可以接受。因此,作为Anthropic重要股东的AWS义无反顾要上线DeepSeek R1,作为OpenAI重要股东的微软Azure也要上线R1,即使要打脸自己手中的重要棋子,也必须要这么做,没有选择。
而同为开源旗手的Meta呢?如大家所看到的传闻,Meta内部已经焦灼万分,一方面要努力研究和复刻R1,一方面要想办法和董事会解释GenAI部门的高薪合理性,这个段子网上文章很多,就不重复了。无论如何,对于Meta开源Llama,城主是表示敬佩的,在很长时间里,DeepSeek没出来之前,这是开源AI社区最大的旗帜。Meta开源的方向没有什么可吐槽的,可能唯一的问题只是在投入产出比之上了。
总而言之,对于美国科技巨头而言,针对DeepSeek的“国家安全”叙事看来无法影响任何科技巨头使用DeepSeek R1;在巨大的资本利益面前,“国家安全”的叙事显然是无力和苍白的。美科技巨头的反应,无论是指责DeepSeek的数据使用的"问题"还是第一时间抢先部署DeepSeek R1服务,甚至还有针对DeepSeek的来自美国的大规模网络攻击。所有的一切不外乎一个目的,就是维护美AI科技的领先地位,从而保证这一波以AI为基础的美国科技资本安全。
DeepSeek的故事还在继续,这个注定载入科技史的事件会发展到什么程度,我们都是幸运的见证者。