飞象网讯(源初/文)第二十一届中国国际半导体博览会(IC China 2024)在北京国家会议中心开幕。会上,当嘉宾们谈到半导体行业的发展时,AI已经成为了一个绕不开的话题,它因半导体而获得了算力,算力的猛增又拉动了新的需求。然而,面对复杂的行业外因素,如何寻找突破口也同样是备受关注的话题。
AI与半导体互为推动
AI正在引发新一轮科技革命,从语言模型、多模态模型的单体智能,到能够使用思维链(CoT, Chain of Thinking)进行推理的OpenAlo1,再到使用工具完成复杂任务的智能体(AIAgent),AI基础能力正在快速演进。AlI将成为智能时代的基础设施,融入生产和生活的每个环节,重塑千行百业,引发新一轮科技和产业革命。
AI与半导体已经形成了一种相互促进的关系,共同推动下一轮技术超级周期的到来。
首先,半导体技术为更多的应用场景提供了支持,包括人工智能(AI)、物联网(IoT)、5G通信和数据中心。这些应用反过来又产生了海量数据,为AI的深度学习模型提供了驱动力。一项基于亚洲的数据显示,自2019年以来,AI、物联网和汽车等领域的数据量呈现出71%的年均复合增长率,反映出技术快速演进和广泛的市场需求。
此外,大数据正被称为“新的石油”,推动了AI算法和半导体行业的发展,特别是在AI加速器、高带宽内存(HBM)、存储和网络等关键领域。随着AI技术的进步和大规模应用,半导体将进一步推动这些技术落地,形成互为推动的良性循环。
巴西半导体行业协会机构主任罗萨娜卡赛斯对于两者的话题也表示称,到2030年,仅AI一项预计将为全球经济贡献超过15万亿美元。半导体行业持续突破创新边界,研发更新、更强大的AI加速器。AI具备变革半导体设计和制造的能力。
与此同时,新兴技术的能耗问题引发关注。黄仁勋曾提到:“没有任何物理定律可以阻止AI数据中心扩展到一百万芯片,但其能源供应可能需要核电站。”AI与人脑比较而言,人类大脑的功耗不超过25W,而英伟达8卡DGXB200功耗达14.3kW。考虑冷却系统耗电量,百万卡智算中心能耗将高达3GW。会上,有位嘉宾还做了这样的比较,在京沪高铁线上的每位乘客耗电量约为30度电,而预计全球数据中心在2024年的总耗电量将达7000亿度。
AIDC在支持AI技术高速发展的过程中,逐渐呈现出高频宽、大容量、大能耗三大趋势。首先,AI模型的发展需要处理海量数据,这对数据中心的计算与传输能力提出了更高要求;其次,AI的快速进步导致模型和数据规模显著扩张,推动了存储和处理能力的跃升。最后,随着算力和存储需求的快速增长,AIDC的能耗问题愈发突出,已成为行业的重要挑战。
面对市场的机遇与挑战,寻找行业突破口自然也就成为大家关注的话题。
行业突破口在何方
对于国内产业而言,会上有嘉宾表示,应当重视系统和芯片架构创新,缩小技术差距。应当积极开展芯片架构创新,如采用3D堆叠/Chiplet/存算一体等新架构,努力缩小大算力芯片的技术代差。积极开展异构大算力集群系统的架构和任务调配等方面的优化工作,努力缩小大算力集群系统的性能差距。
同时,还要重视端侧AI技术创新,端侧AI拥有清晰的商业模式,更易实现规模化落地。其芯片对算力(如TOPS数量)和制造工艺(如7nm及以上工艺)的要求相对较低,从而降低了研发和生产成本,为更多企业参与创造了机会。此外,端侧AI应用场景多样化,包括智能设备、车载终端和工业物联网等领域,这些需求驱动了端侧AI的快速发展。面向半导体行业,需要探索多核异构计算架构,提升端侧设备的算力效率与适配能力。开发兼容多种终端应用的AI软件堆栈,以及高效的端侧芯片。端侧AI的未来将以低成本、高效能和广泛应用为目标,推动人工智能在终端设备上的深度集成与创新,构建更加智能化的生活与产业生态。