Skip to content

大家好,我是 Ai 学习的老章

看 Apple 刚刚开源了一个 7B 的 DiffuCoder 大模型

模型地址:http://huggingface.co/apple/DiffuCoder-7B-Instruct。论文地址:http://arxiv.org/abs/2506.20639。repo 地址:http://github.com/apple/ml-diffucoder

这个有空再细看,这倒让我想起 5 月 Google 开源的 Gemini Diffusion,当时就申请了 Waitlist,很久没打开 Gmail,发现 5 月 29 就收到 access 的邮件了

![[2_g39OejsDZpktjD.mp4]]

Diffusion 模型

Diffusion 不是新鲜概念,后来 OpenAI 的 DALL·E 2 和 Google 的 Imagen 等文生图模型问世后,Diffusion Models 重新火起来。

但是把生成式模型用于文本生成是最近的小热点,Mercury,LLaDA-8B,Dream 7B,gemini-diffusion,Apple DiffuCoder 都来了

传统的自回归语言模型一次生成一个单词(或词元)的文本,这种顺序过程可能会很缓慢,并且会限制输出的质量和连贯性。

速度有多快呢?Gemini Diffusion 的介绍:

采样速度(不含开销)1479 个词元/秒
额外时间0.84 秒

扩散模型的工作方式有所不同,它们不是直接预测文本,而是通过逐步优化噪声来学习生成输出。

这意味着它们可以非常快速地对解决方案进行迭代,并在生成过程中纠正错误。这有助于它们在编辑等任务中表现出色,包括在数学和代码方面。

![[gemini-diffusion__example-1.mp4]]

Gemini Diffusion

Gemini Diffusion 是 Google Deepmind 团队的产品,官方介绍优势如下:

  • 快速响应:生成内容的速度远超我们迄今为止最快的模型
  • 文本连贯性更强:一次性生成完整词块,这意味着相比自回归模型,它能更连贯地回应用户提示
  • 支持迭代优化:在生成过程中纠正错误,以获得更一致的输出。

目前依然需要 waitlist 才能使用

https://docs.google.com/forms/d/e/1FAIpQLSdsxa-YU25JIPJGmu-pySJEYeTy6lwbdZAzxlZ11x3GPj6DhA/viewform?usp=header

十几天后才收到邮件

使用地址:https://deepmind.google.com/frontiers/gemini-diffusion

实测速度真 TM 的快,眼球👀跟不上

这里我借用 MiniMax 的测试提示词,并给出 minimax 与 Gemini Diffusion 生成结果对比

实测1

Prompt: Create a maze generator and pathfinding visualizer. Randomly generate a maze and visualize A* algorithm solving it step by step. Use canvas and animations. Make it visually appealing.

创建一个迷宫生成器和路径查找可视化工具。随机生成迷宫并逐步展示 A*算法求解过程。使用画布和动画效果,确保视觉效果吸引人。

MiniMax

![[minimax-demo-pathfinding.mp4]] Gemini Diffusion ![[Gemini Diffusion-迷宫.mp4]]

实测2

Prompt: Create an HTML page with a canvas-based animated particle background. The particles should move smoothly and connect when close. Add a central heading text over the canvas

创建一个带有基于画布的动画粒子背景的 HTML 页面。粒子应平滑移动并在靠近时连接。在画布上方添加居中的标题文本

MiniMax ![[minimax-demo-UI Components Spotlight.mp4]]

Gemini Diffusion

![[Gemini Diffusion-particles.mp4]]

实测3

Prompt: Implement a particle explosion effect when the user clicks anywhere on the page. Use canvas and JavaScript to animate colorful particles that fade out.

在用户点击页面任意位置时实现粒子爆炸效果。使用 canvas 和 JavaScript 来制作彩色粒子的渐隐动画效果。

MiniMax

![[minimax-demo-yanhua.mp4]] Gemini Diffusion ![[Gemini Diffusion-烟花.mp4]]

其实我还测试了几个中文相关的非代码类任务,弱鸡的很

目前感觉,它最强优势就是一个字☝️:快!

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!

搭建完美的写作环境:工具篇(12 章)图解机器学习 - 中文版(72 张 PNG)ChatGPT、大模型系列研究报告(50 个 PDF)108 页 PDF 小册子:搭建机器学习开发环境及 Python 基础  116 页 PDF 小册子:机器学习中的概率论、统计学、线性代数  史上最全!371 张速查表,涵盖 AI、ChatGPT、Python、R、深度学习、机器学习等

Generated by Gemini CLI