智界源科技有限公司

热点资讯

行业资讯

口的时候怎么才能不让牙齿伤到它追究官宣！华为昇腾910C芯片得胜完成1.6万亿DeepSeek全参数后磨练国产算力终于跨过最难一关

发布日期：2026-06-08 13:54 点击次数：175

快科技6月7日音信，这两天堂产AI芯片最重磅的音信口的时候怎么才能不让牙齿伤到它，莫得之一。

6月5日上昼，深圳发布官方账号最初发布通报，追究证据了这个让悉数这个词行业立志的音信。近日，深圳河套学院AI磨练平台模样团队，集合哈尔滨工业大学(深圳)、深圳市大数据研讨院、华为联系团队，协同深智城AI算力平台，面向国产算力大模子磨练开展集合攻关。依托昇腾910C国产AI算力集群，完成1.6万亿参数大模子DeepSeek-V4-Pro全参数后磨练。

音信一出，国内科技媒体第一时辰跟进。今日，南华早报等国外主流科技媒体也跟进报说念，称这一发达象征着在好意思国制裁持续收紧的布景下，中国半导体行业正英勇从解救基础AI推理，迈向更复杂的模子磨练阶段。

深圳发布在报说念中明确指出，"这次实施为人人第三方机构在国产算力平台上完成该级别模子磨练的相关探索，积贮了热切警戒，也印证了国产AI芯片可撑持宇宙级超大参数模子磨练职责"。

但在我看来，这不是一次试探性的尝试，而是一次里程碑式的本领突破。它用无可批驳的工程收尾讲明，国产AI芯片如故跨过了那条最难的门槛。

先搞懂这几个词

好多东说念主看新闻只记取了"1.6万亿参数"这个数字，却没搞懂"全参数后磨练"这六个字的重量。

AI大模子从出身到能用，其实就两个中枢阶段：磨练和推理。

推理：运行一个如故磨练完成的模子来处理用户申请。这个过程中模子的悉数参数皆是固定不变的，仅仅讹诈已学到的常识生成输出。推理对算力的条件相对较低，更敬重蔓延、朦拢量和能效比。这亦然国产芯片此前最擅长的规模，国内阛阓上已有大批AI应用选拔国产推理芯片部署。

磨练：通过输入海量数据，不时治愈模子里面参数，让模子学会新常识和外行段的过程。磨练的难度和算力需求与推理不在一个量级，频频需要数千以至数万张芯片构成的集群知道运行数周以至数月。

磨练又分为两个要道阶段：

预磨练：大模子的基础阶段。给模子喂入万亿级别的文本、图像等多模态数据，让它掌持基本的谈话智商、宇宙常识和通用逻辑。

后磨练：在预磨练的基础上口的时候怎么才能不让牙齿伤到它，通过东说念主类响应强化学习(RLHF)、监督微调(SFT)等本领，让模子学会遵命东说念主类教导、谨守安全礼貌、完成特定任务。这是决定大模子履行使用体验的要道模样。

全参数后磨练：指在磨练过程中更新模子的全部参数，而不是只更新其中一小部分。关于DeepSeek-V4-Pro来说，便是要同期治愈它的1.6万亿个参数。与之相对的是"部分参数微调"，只更新模子的终末几层或者少许适配器参数。全参数磨练大致最大限定地普及模子性能，但也对算力、存储、通讯和系统踏实性提议了近乎尖刻的条件。

深圳发布的阿谁譬如杰出形象：若是把磨练一个万亿级参数的AI大模子比作解沿路超等复杂的数学题，那么每一张计较卡就像别称解题员。他们不仅要单干明确、昼夜不竭地连轴转，还不行有东说念主偷懒、不行有东说念主出错，更不行有东说念主掉队。

"昔时的国产算力更多是让大模子'能用'，也便是推理部署，就像给模子修了一条单行说念，输入一个问题，输出一个谜底。"

而全参数后磨练，"是要让模子学会自我反想和治愈，特别于在单行说念的基础上，又加多了复杂的立交桥和多条响应回路，计较量和通讯量顷刻间翻了好几倍。"

况且DeepSeek-V4-Pro用的照旧当前最主流的羼杂群众（MoE）架构，这就更难了。可以把它想象成一个浩大的“群众团”，平日推理的时候，只需要激活少数几个"群众"来往话问题。但磨练的时候，悉数群众皆要同期学习，还要互重迭信同步信息。光是群众之间的数据交换量，便是庸碌模子的几十倍。

这亦然为什么之前业内深广认为，国产芯片根底扛不住这样大的全参数磨练。

这次能成靠的是三个实打实的工程突破

濒临这样大的挑战，这次团队莫得搞什么花里胡梢的倡导，便是靠三个扎塌实实的工程突破，亚洲日韩一区二区把不可能变成了可能。

第一个是"显存拼图"。1.6万亿个参数的数据量极其浩大，不可能塞进任何一张单独的计较卡。团队想象了一套极其精密的散布式承载有筹画，把悉数这个词模子像拼图相同，拆成一小块一小块，精准地分派到每一张芯片上。哪块卡负责哪部分参数，什么时候需要和其他卡交换数据，皆算得涓滴不差。

第二个是"负载平衡"。羼杂群众模子最头疼的问题便是忙闲不均。有的群众任务排成长队，有的群众却闲得没事干。之前好多国产集群跑MoE模子，算力讹诈率深广偏低。这次团队出奇针对MoE架构优化了蜿蜒算法，动态给每个群众分派任务，透顶处置了跨卡通讯拥挤的问题。

第三个是"全程不掉线"。作念过大模子磨练的东说念主皆知说念，最怕的便是跑了几天几夜，骤然一个硬件故障或软件失实，悉数这个词磨练平直崩溃，前边悉数的时辰和算力皆打了水漂。这次磨练一共跑了1500多步，全程莫得出现一次中断或者报错。这背后是一整套好意思满的全链路监控和容错体系，是无数个昼夜调试出来的收尾。

终末官方公布的数据是，模子算力讹诈率朝上30%，要道磨练算子成果普及14%。可能有东说念主以为30%不高，但在大模子磨练规模，这如故长短常可以的工业级水平。要知说念，就算用最顶级的国外芯片，好多团队的履行讹诈率也就在40%傍边。

比本领突破更热切的是咱们终于有了我方的练兵场

好多东说念主商榷这次突破，皆只盯着芯片自己。但在我看来，这次事件最被低估的价值，其实是东说念主才培养。

深圳河套学院这次莫得把这个模样当成一个单纯的本领攻关，而是把它变成了一个活生生的课堂。他们让学生平直插足确凿的磨练场景，从最基础的环境搭建启动，全程参与悉数这个词磨练过程。

限制当前，这个模样如故培养了42名学生，酿成了后生教养调换、博士生中枢攻坚、工程团队撑持的好意思满梯队。这些东说念主不是在讲义上学大模子磨练，而是真刀真枪地跑过万亿级模子的全历程。他们知说念那里会出问题，知说念若何处置问题，这才是国产AI产业最珍藏的资产。

好多东说念主说国产AI缺芯片，其实更缺的是确凿有实战警戒的工程师。大模子磨练是一门工程科学，好多东西是竹帛上学不到的，必须亲手跑过才气赫然。之前咱们莫得我方的高端算力平台，好多年青东说念主连摸一下万亿级集群的契机皆莫得。当前这个所在，终于被龙套了。

写在终末

固然，咱们必须流露地签订到，国产算力和宇宙顶尖水平之间还有不小的差距。无论是单卡性能，照旧悉数这个词软件生态的完善进度，咱们皆还有很长的路要走。

但这次突破的酷好，若何强调皆不为过。它讲明了一件事：在大模子磨练这个也曾被国外把持的规模，咱们不仅能作念，况且能作念得很好。它给悉数这个词行业注入了信心，也给悉数正在这条路上英勇的东说念主，点亮了一盏灯。

深圳发布在通报的终末说，接下来，深圳河套学院将集合生态伙伴持续优化算力集群性能，围绕长文本处理、AI智能体等标的开展本领探索，持续挖掘国产算力应用后劲。

我肯定，这仅仅一个启动。当越来越多的团队启动用国产芯片磨练大模子，当悉数这个词生态冉冉训练起来，国产AI产业一定会迎来属于我方的时期。

【本文竣事】如需转载请务必注明出处：快科技

牵累剪辑：朝日口的时候怎么才能不让牙齿伤到它

著作内容举报

]article_adlist--> 　　声明：新浪网独家稿件，未经授权不容转载。 -->

上一篇：免费刺激视频华为 nova 16 系列手机首销情况出炉，Pro 同时约为上一代的 170%

下一篇：吃瓜官网黑料创比利时史上最大纯电订单！良马一次性卖出1000台电动车

口的时候怎么才能不让牙齿伤到它 追究官宣！华为昇腾910C芯片得胜完成1.6万亿DeepSeek全参数后磨练 国产算力终于跨过最难一关

口的时候怎么才能不让牙齿伤到它追究官宣！华为昇腾910C芯片得胜完成1.6万亿DeepSeek全参数后磨练国产算力终于跨过最难一关