国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关键路径。随着DeepSeek R1开源引爆技术热潮,字节、阿里以及科大讯飞等国内主流大模型企业纷纷加码MoE架构创新,从通信优化到国产算力适配,一场围绕效率与生态的竞逐赛已然展开。

  3月1日,DeepSeek发布了“开源周”后的“彩蛋”,首次公布了模型降本增效的技术细节以及理论上高达545%的利润率。“彩蛋”显示,DeepSeek的671B参数模型在处理每个问题时,实际被激活的专家模型参数仅约37B,算力需求降低至传统架构的约二十分之一。

国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案

  MoE架构虽然能有效降低算力消耗,但在分布式训练过程中,仍然面临着跨设备通信开销巨大的挑战。有鉴于此,字节跳动豆包大模型团队于3月10日推出了针对MoE架构的通信优化系统COMET。据介绍,该系统采用细粒度计算与通信重叠技术,在大规模MoE模型上实现了单层1.96倍的加速效果,端到端平均效率也提升了1.71倍。

  在这场技术角逐中,另一互联网巨头阿里巴巴也通过开源策略持续扩大声量。3月6日,阿里云发布并开源了全新的推理模型通义千问QwQ-32B。阿里云称,该模型采用密集架构(Dense),尽管参数仅为32B,但性能却能与满血版DeepSeek R1这类混合专家模型(MoE)相媲美。

  诚然,DeepSeek等国产大型模型在算法上实现了诸多引领行业的创新,并且都选择了开源,但它们背后所依赖的仍然是英伟达提供的强大算力。而作为发布国内唯一基于全国产化算力训推大模型的企业,科大讯飞则始终将重心放在国产算力的创新突破上。

  近日,科大讯飞与华为在国产算力领域取得重大进展,双方联合团队率先突破国产算力集群上MoE模型的大规模跨节点专家并行集群推理,这是继DeepSeek公布其MoE模型训练推理方案后,业界首个基于国产算力的全新解决方案。

  通过算子融合、混合并行策略和通信计算并行优化等一系列创新,科大讯飞在国产算力上实现了显著性能提升:单卡静态内存占用缩减至双机部署的1/4,效率提升75%,专家计算密度增加4倍,推理吞吐提升3.2倍,端到端时延降低50%。科大讯飞称,这一解决方案将应用于讯飞星火深度推理模型X1的训练加速,预期训练时推理效率将提升200%。

  从DeepSeek点燃开源之火,到字节、阿里争相技术共享,再到科大讯飞实现国产算力突破,国内MoE赛道已形成“效率迭代”与“自主可控”的双重叙事。开源模式虽对企业直接创收有影响,却能通过生态共建降低研发成本、扩大市场份额;而国产算力突破则关乎技术主权与供应链安全,在AI基础设施竞争白热化的当下,战略意义同样毋庸置疑。

本文来自作者[合文科]投稿,不代表四季号立场,如若转载,请注明出处:https://xn--9wys0p7ub.cn/shenghe/2025sop04-4943.shtml

(8)

文章推荐

  • 方琼资料

    网上有关“方琼资料”话题很是火热,小编也是针对方琼资料寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。方琼个人档案出日:1月4日出生地:石家庄市身高:172cm体重:56kg血型:O星座:摩羯座口头禅:天呀家庭成员:妈妈、姐姐、姐夫、小外甥、小乌龟、丈夫、儿子

    2025年01月22日
    868
  • 飞碟的解释飞碟的解释是什么_1

    网上有关“飞碟的解释飞碟的解释是什么”话题很是火热,小编也是针对飞碟的解释飞碟的解释是什么寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。飞碟的词语解释是:飞碟fēidié。(1)未经证实但屡有报告见之于空间并被说成是呈碟状或盘状的各种飞行物中的任何一种(UF

    2025年01月25日
    736
  • 苹果6手机进水了开不了机怎么办?

    网上科普有关“苹果6手机进水了开不了机怎么办?”话题很是火热,小编也是针对苹果6手机进水了开不了机怎么办?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一,苹果手机掉水里,暂时不要开机,容易造成短路烧毁主板,建议立即送到维修点检修,降低损失。二,iPhone

    2025年02月03日
    754
  • 轮胎巨头重大管理层调整!涉及45个职位

    近日,全球轮胎制造业巨头之一横滨橡胶宣布了一项重大管理层重组计划,这是近五年来公司最大规模的人事调整,涉及45个职位变动。此举旨在更好地适应市场变化,巩固其在全球轮胎市场的领先地位。在这次重组中,横滨橡胶对中国区业务进行了重大调整。原中国区董事长结城正博卸任,中国业务或将纳入“东亚区域总部”统一

    2025年02月26日
    8
  • 建发新胜预计2024年度股东应占溢利约1500万至2000万港元

      建发新胜(00731)发布公告,集团预期于2024财年取得公司拥有人应占溢利约1500万港元至2000万港元,而截至2023年12月31日止年度公司拥有人应占亏损则约为1.363亿港元。  预期2024财年公司拥有人应占亏损转为盈利,主要是由于以下因素的综合影响:(i)集团债务重组下未申报债

    2025年03月17日
    6
  • 纽约联储行长等重申通胀暂时论 淡化关税对物价的影响

      两位美联储官员周五淡化了长期通胀预期近期升高的影响,但强调前景存在高度不确定性,该表态与本周早些时候美联储主席鲍威尔的发言基本一致。  纽约联储行长JohnWilliams和芝加哥联储行长AustanGoolsbee都表示,劳动力市场和经济增长一直很稳固,关税对通胀的任何影响都可能是短暂的

    2025年03月22日
    5
  • 面板产业迎来向上拐点:LCD盈利改善 柔性OLED涨价可期

      “得益于良好的终端需求,LCDTV主流尺寸面板价格自2025年1月起全面上涨,3月预计将延续上涨态势。”在近期的机构调研中,京东方透露,LCD行业平均稼动率自去年11月开始回升,今年以来上升态势得到延续,并保持在80%以上。  多位受访人士向证券时报记者表示,LCD市场集中度提升,特别是中国

    2025年03月26日
    5
  • 反关税情绪发酵,地产股尾盘暴走!机构研判:地产对“稳内需”意义重大

      地产ETF(159707)复盘资讯2025年04月08日  周二(4月8日),A股反关税情绪持续发酵,内需题材应声爆发,市场普遍认为地产板块止跌回稳对内需发力意义重大。表征A股龙头地产行情的中证800地产指数暴涨4%,优于大盘跑赢同类。成份股悉数收红,保利发展大涨超7%,中国国贸、陆家嘴涨超5

    2025年04月08日
    4
  • 全球贸易风向标的航运巨头马士基一度大涨11%

      要点  作为全球贸易风向标的丹麦航运巨头马士基的股价在周四上午大幅上涨。这是在美国总统唐纳德・特朗普对部分国家暂停实施为期90天的更高关税之后出现的反弹。  不断升温的贸易战一直是海运和运输行业的一个主要担忧来源。  作为全球贸易风向标的丹麦航运巨头马士基的股价在周四上午大幅上涨。这

    2025年04月10日
    5
  • 五角大楼官员因涉嫌未经授权的信息披露被停职后遭解雇

    登录新浪财经APP搜索【信披】查看更多考评等级  据知情人士透露,美国国防部的三名高级官员因涉嫌未经授权的信息披露被停职,于周五被解雇。  在周六的一份联合声明中,这些官员声称五角大楼“在我们离职之际用毫无根据的攻击诋毁我们的人格”。  美媒此前报道,国防部长皮特・赫格塞斯的高级顾问丹・

    2025年04月20日
    2

发表回复

本站作者后才能评论

评论列表(4条)

  • 合文科
    合文科 2025年04月21日

    我是四季号的签约作者“合文科”!

  • 合文科
    合文科 2025年04月21日

    希望本篇文章《国内大模型竞逐MoE技术高地 科大讯飞推出业界首个国产算力训推方案》能对你有所帮助!

  • 合文科
    合文科 2025年04月21日

    本站[四季号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 合文科
    合文科 2025年04月21日

    本文概览:  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   大模型训练的高成本始终是行业痛点,而混合专家模型(MoE)因其“稀疏激活”特性成为降本增效的关...

    联系我们

    邮件:四季号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们