DeepSeek最新论文:如何让大模型跑得更快?梁文锋署名
当行业焦点仍停留在“谁的最新模型更聪明”时,DeepSeek已将目光转向更具现实意义的论文命题:如何让模型运行得更快。
6月27日,何让DeepSeek在GitHub低调更新了一篇最新技术论文,大模得更正式介绍其推理加速框架 DSpark。型跑该框架旨在突破大语言模型在高并发场景下的快梁推理效率瓶颈。
从作者署名来看,文锋该成果由 DeepSeek与 北京大学联合发布,署名DeepSeek创始人 梁文锋赫然在列。最新论文不仅开源了DSpark模型权重,论文还同步发布了面向推测解码、何让由算法驱动的大模得更训练代码仓库 DeepSpec。

DeepSeek最新论文截图
此次发布延续了DeepSeek一贯的型跑“硬核技术派”风格,论文标题《DSpark:基于置信度调度的快梁半自回归生成推测解码》(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)虽显晦涩,却直指核心痛点。文锋
痛点:自回归生成的效率瓶颈
论文首先剖析了大语言模型(LLM)的核心性能瓶颈。传统LLM采用自回归方式生成文本,即每一个新词元(token)的生成,都需基于所有前置词元完成一次完整的前向传播。这种机制导致:
* 输出越长,等待越久;
* GPU利用率低下;
* 用户等待时间过长。
这在实时对话助手、多轮智能体工作流等对低时延敏感的场景中尤为突出。
目前主流解决方案主要分为两条路线:
1. 自回归草稿模型(如Eagle3)
2. 并行草稿模型(如DFlash)
然而,现有方案均存在生成质量瓶颈、系统效率瓶颈,且普遍缺乏负载自适应校验机制。
方案:DSpark的半自回归架构
针对上述缺陷,DeepSeek提出了 DSpark推测解码框架。该框架采用半自回归架构,通过两套互补机制,巧妙解决了草稿生成与校验环节之间的权衡矛盾,将高吞吐并行生成与自适应负载感知校验机制融为一体。
实测数据:性能显著提升
根据论文披露的受控离线基准测试数据(涵盖数学推理、代码生成、日常闲聊三类任务),DSpark框架相较于自回归草稿模型与并行草稿模型,在单轮平均可接受词元长度上实现了大幅提升。
1. 在线服务实测(DeepSeek-V4)
DeepSeek已将DSpark部署至DeepSeek-V4在线服务系统,基于真实用户流量评估其实际性能。结果显示,在相同吞吐量条件下,相较于现有生产环境基线系统 MTP-1,DSpark将用户端生成速度提升了60%-85%。
2. 跨模型通用性验证
此外,团队将该框架部署于阿里通义千问(Qwen3)系列模型(4B、8B、14B)上,验证了其通用性:
* 对比自回归草稿模型:Qwen3-4B、8B、14B的单轮可接受词元长度分别提升 30.9%、26.7%、30%。
* 对比并行草稿模型:上述模型分别提升 16.3%、18.4%、18.3%。
行业意义:算法创新与开源初心
从技术视角看,这篇论文的核心价值在于通过算法创新显著提升了模型的推理生成速度。在大模型行业逐渐走向落地应用的当下,“更便宜、更快速”的输出能力已成为关键竞争力。
同时,DeepSeek通过全面开源,再次推动了社区发展。社交平台上的开发者评价道:“AI Infra再次被DeepSeek加速了。”
也有用户指出,DeepSeek最令人钦佩之处在于其模型迭代与推理基础设施的同步更新:在发布V4时,不仅提供了论文和代码,还验证了跨模型的通用性。
尽管近期融资消息不断,未来可能面临商业化压力,但通过此次开源,DeepSeek似乎在向业界证明:它仍坚持着开源的初心。
(责任编辑:热点)
-
央视:俄乌冲突至今双方累计伤亡人数接近180万,是二战后国家间冲突中最为惨烈的一次
CCTV4《深度国际》最新报道指出,历经1580余天的残酷拉锯,俄乌冲突的持续时间已超越第一次世界大战。双方累计伤亡人数逼近180万,这一数字标志着其成为自二战结束以来,国家间冲突中最为惨烈的一次军事 ...[详细]
-
2026年6月26日晚,第31届上海电视节白玉兰奖颁奖典礼圆满落幕,杨紫凭借出色表现摘得视后桂冠。而在同场入围最佳女主角的竞争中,吴越虽未捧杯,但凭借在《沉默的荣耀》中饰演潜伏烈士朱枫的精湛演技,以及
...[详细]
-
如果说易立竞是向佐的“天降紫微星”,那么这场舆论反转便是互联网生态中一次罕见的集体共鸣。公众人物在网络上的风评逆转虽不新鲜,但向佐的这次“翻盘”却出乎所有人意料。在《言外之易》长达四小时的深度访谈中,
...[详细]
-
《莫离》结局:太后赐婚叶璃根本不是成全,其中暗藏三步绝杀权谋
追剧《莫离》初期,许多观众极易被太后表面温婉贤淑的人设所迷惑。大众普遍误读,认为太后主动赐婚让叶璃嫁入定王府,是出于对叶璃母亲旧情的念及,或是怜悯叶璃的身世,意图将她从墨景黎的掌控中解救出来,避免其卷
...[详细]
-
6月28日,据猫眼专业版数据显示,电影《四渡》上映仅3天,总票房即突破8000万元。
...[详细]
-
许多观众被《抓特务》这个充满悬疑感的片名误导,误以为这是一部节奏紧凑、惊心动魄的反特谍战大片。然而,观影之后才会发现,这并非一场单纯的权谋博弈,而是一段横跨四十余年、聚焦于两个人、两家人以及一条胡同的
...[详细]
-
《问心2》直到发现欧阳妲的隐瞒,周筱风才知,盛年的算计有多狠
随着剧情层层推进,周筱风终于如愿晋升为心脏科执行主任。这一职位赋予了他调配资源的权力,使他能够切实地为基层患者争取到先进的医疗设备与优质的医护团队。基于此,周筱风大胆提议设立“心内-心外联合门诊”,旨
...[详细]
-
随着丰台区“金融+科技”双核驱动战略的深化,丰台科技园板块已跃升为北京改善型家庭置业的焦点区域。对于预算在600万至800万区间,旨在产业核心区配置高品质三居的购房者而言,如何从众多新盘中筛选出“最优 ...[详细]
-
褶皱,是服装设计中极具诗意的语言。从空中绵密的云层到海浪卷起的波纹,从风吹涟漪到光影投射的窗棂,乃至岁月在脸颊留下的痕迹,自然界无处不在的褶皱纹理,赋予了生活丰富的层次感。在时尚领域,褶皱打破了高级时
...[详细]
-
随着美加墨世界杯激战进入白热化阶段,曾代表巴西队四度征战世界杯并荣膺世界杯历史最佳射手的“外星人”罗纳尔多,接受了法国权威媒体《队报》的深度专访。这位足坛传奇9号球员,围绕本届赛事、姆巴佩、内马尔以及
...[详细]

美媒:就涉伊朗问题,特朗普与共和党籍议员比尔·卡西迪当面发生激烈争吵
功率超809kW 宾利纯电SUV渲染图曝光
重回世界第一,中国超算未来怎么走
史诗大片《奥德赛》定档8月14日,导演诺兰将来中国宣发
机翼出现裂纹 空客紧急检查16架A380客机
