Appearance

大家好,我是 Ai 学习的老章
看 Apple 刚刚开源了一个 7B 的 DiffuCoder 大模型

这个有空再细看,这倒让我想起 5 月 Google 开源的 Gemini Diffusion,当时就申请了 Waitlist,很久没打开 Gmail,发现 5 月 29 就收到 access 的邮件了
![[2_g39OejsDZpktjD.mp4]]
Diffusion 模型
Diffusion 不是新鲜概念,后来 OpenAI 的 DALL·E 2 和 Google 的 Imagen 等文生图模型问世后,Diffusion Models 重新火起来。
但是把生成式模型用于文本生成是最近的小热点,Mercury,LLaDA-8B,Dream 7B,gemini-diffusion,Apple DiffuCoder 都来了
传统的自回归语言模型一次生成一个单词(或词元)的文本,这种顺序过程可能会很缓慢,并且会限制输出的质量和连贯性。
速度有多快呢?Gemini Diffusion 的介绍:
| 采样速度(不含开销) | 1479 个词元/秒 |
|---|---|
| 额外时间 | 0.84 秒 |
扩散模型的工作方式有所不同,它们不是直接预测文本,而是通过逐步优化噪声来学习生成输出。
这意味着它们可以非常快速地对解决方案进行迭代,并在生成过程中纠正错误。这有助于它们在编辑等任务中表现出色,包括在数学和代码方面。
![[gemini-diffusion__example-1.mp4]]
Gemini Diffusion
Gemini Diffusion 是 Google Deepmind 团队的产品,官方介绍优势如下:
- 快速响应:生成内容的速度远超我们迄今为止最快的模型
- 文本连贯性更强:一次性生成完整词块,这意味着相比自回归模型,它能更连贯地回应用户提示
- 支持迭代优化:在生成过程中纠正错误,以获得更一致的输出。
目前依然需要 waitlist 才能使用

十几天后才收到邮件

使用地址:https://deepmind.google.com/frontiers/gemini-diffusion

实测速度真 TM 的快,眼球👀跟不上

这里我借用 MiniMax 的测试提示词,并给出 minimax 与 Gemini Diffusion 生成结果对比
实测1
Prompt: Create a maze generator and pathfinding visualizer. Randomly generate a maze and visualize A* algorithm solving it step by step. Use canvas and animations. Make it visually appealing.
创建一个迷宫生成器和路径查找可视化工具。随机生成迷宫并逐步展示 A*算法求解过程。使用画布和动画效果,确保视觉效果吸引人。MiniMax
![[minimax-demo-pathfinding.mp4]] Gemini Diffusion ![[Gemini Diffusion-迷宫.mp4]]
实测2
Prompt: Create an HTML page with a canvas-based animated particle background. The particles should move smoothly and connect when close. Add a central heading text over the canvas
创建一个带有基于画布的动画粒子背景的 HTML 页面。粒子应平滑移动并在靠近时连接。在画布上方添加居中的标题文本MiniMax ![[minimax-demo-UI Components Spotlight.mp4]]
Gemini Diffusion
![[Gemini Diffusion-particles.mp4]]
实测3
Prompt: Implement a particle explosion effect when the user clicks anywhere on the page. Use canvas and JavaScript to animate colorful particles that fade out.
在用户点击页面任意位置时实现粒子爆炸效果。使用 canvas 和 JavaScript 来制作彩色粒子的渐隐动画效果。MiniMax
![[minimax-demo-yanhua.mp4]] Gemini Diffusion ![[Gemini Diffusion-烟花.mp4]]
其实我还测试了几个中文相关的非代码类任务,弱鸡的很
目前感觉,它最强优势就是一个字☝️:快!
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!
搭建完美的写作环境:工具篇(12 章)图解机器学习 - 中文版(72 张 PNG)ChatGPT、大模型系列研究报告(50 个 PDF)108 页 PDF 小册子:搭建机器学习开发环境及 Python 基础 116 页 PDF 小册子:机器学习中的概率论、统计学、线性代数 史上最全!371 张速查表,涵盖 AI、ChatGPT、Python、R、深度学习、机器学习等
