IT之家 6 月 11 日消息,谷歌今天(6 月 11 日)发布公告,宣布推出 DiffusionGemma,是基于文本扩散机制的开放 AI 模型,相比较自回归模型在本地推理速度上提升了 4 倍。
IT之家注:自回归模型(Autoregressive Model)是当前主流的大语言模型架构(如 GPT、Gemini),按照从左到右的顺序逐个生成 Tokens。该架构在云端批处理场景下效率较高,但在本地推理时受限于内存带宽,存在计算资源浪费问题。
而扩散模型(Diffusion Model)通过从噪声中逐步去噪的方式生成输出。与自回归模型逐个生成 token 不同,扩散模型并行处理所有 token,逐步优化整体输出质量,在本地低带宽计算环境下具有显著的推理速度优势。
开源方面,该模型能力与其他 Gemma 4 模型相当,但推理效率显著更高。该模型采用 Apache 2.0 许可证开源,用户可从 Hugging Face 下载模型权重。
质量方面,模型还支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。采样速度达到 1479 tokens / 秒,开销仅 0.84 秒,生成效率显著提升。
性能方面,代码生成上,LiveCodeBench 达 30.9%,BigCodeBench 达 45.4%,HumanEval 达 89.6%,与 Gemini 2.0 Flash-Lite 互有胜负。
数学能力表现亮眼,AIME 2025 取得 23.3%,超越对比模型的 20.0%,展现出扩散架构在推理任务上的潜力。
不过模型在部分基准上仍存短板。科学推理 GPQA Diamond 仅 40.4%,明显低于对比模型的 56.5%;推理能力 BIG-Bench Extra Hard 为 15.0%,同样落后于 21.0%。
速度方面,英伟达在官方博文中指出,该模型的扩散设计,能充分发挥英伟达 GPU 的 Tensor Core 并行计算能力。
在单块 H100 GPU 上,DiffusionGemma 达到每秒 1000 个 token 的生成速度;在 DGX Spark 上为每秒 150 个 token;在 DGX Station 上可达每秒 2000 个 token,约为同等条件下自回归模型的 4 倍。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
新智元 2026-06-10 16:05:48
钛媒体APP 2026-06-10 15:32:15
华尔街见闻官方 2026-06-09 11:05:07
虎嗅APP 2026-06-11 00:48:30
量子位 2026-06-07 04:37:43
英国那些事儿 2026-06-10 23:29:12
机器之心Pro 2025-12-16 14:37:44
大象新闻 2026-06-11 07:11:14
量子位 2026-04-23 11:44:18
华尔街见闻官方 2026-06-11 03:40:24
新智元 2026-06-09 14:22:18
量子位 2026-06-09 14:25:37
每日经济新闻 2026-06-02 06:05:39
机器之心Pro 2026-04-29 17:20:04
摸鱼算法 2026-06-11 00:42:15
界面新闻 2026-06-09 21:30:35
钛媒体APP 2026-06-10 16:14:33
南阳日报 2026-06-10 14:25:49
新大陆影视 2026-06-09 10:33:59
机器之心Pro 2026-03-31 11:09:26
界面新闻 2026-06-10 20:38:30
上观新闻 2026-06-10 14:06:09
我是一个养虾人 2026-06-11 04:21:15
经济观察报 2026-06-11 08:08:33
虹膜 2026-06-10 20:46:19
都市快报橙柿互动 2026-06-10 11:01:41
智慧的小老虎 2026-06-07 20:14:29
每日经济新闻 2026-06-11 07:58:08
每日经济新闻 2026-06-11 07:38:23
SuperStreet超级街 2026-06-09 09:15:13
智东西 2026-06-10 11:02:48
潇湘晨报 2026-06-10 12:18:08
新华社 2026-06-10 18:23:10
财联社 2026-06-10 23:16:18
环球网资讯 2026-06-10 22:08:27
扬子晚报 2026-06-10 18:03:35
上观新闻 2026-06-06 20:28:05
山鬼年少 2026-06-07 12:54:30
环球网资讯 2026-06-11 00:16:10
网易科技态度见闻 2026-06-08 18:03:01
时评
深度阅读
谷歌推出DiffusionGemma文本扩散模型,本地推理速度提升4倍,内行人不会说的技术突破
李政绍
主笔 · 资深编辑
2026-06-11 10:36:06
编辑:李政绍
标签:
李政绍
本文由 辽源市西安区教育局 审核发布