RWKV元始智能 10月10日 20:11
RWKV7-G0a2 7.2B模型性能提升与应用展示
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文介绍了RWKV7-G0a2 7.2B模型的最新性能表现,特别是在MMLU Pro、GSM8K和MATH500等基准测试中的成绩。文章展示了模型在处理编程prompt方面的能力,包括生成用户卡片组件和倒计时网页,并探讨了模型在多轮对话中解决代码错误的过程。同时,文章也提及了RWKV模型的训练策略,强调了“蒸”数据的重要性,并预告了未来RWKV-8 ROSA机制的潜力。最后,文章更新了G1a2 1.5B模型在蒸DeepSeek后的指令理解能力提升,并分享了RWKV7 7.2B FP16模型的推理速度。

🚀 **模型性能显著提升**:RWKV7-G0a2 7.2B在MMLU Pro(50% + CoT)达到新高度,并在GSM8K和MATH500等多个基准测试中展现出优异成绩。G1a2 1.5B模型在蒸DeepSeek数据后,指令理解能力也得到了显著提升,预示着模型在不同规模下均有进步空间。

💻 **编程与代码生成能力**:该模型在处理编程prompt方面表现出色,能够根据指令生成现代用户卡片组件和设计精美的倒计时网页。尽管在多轮对话中尝试修复代码错误时遇到挑战,但模型展现了理解并尝试解决问题的能力,显示了其作为辅助编码工具的潜力。

🧠 **“蒸”数据策略与未来展望**:文章强调了“蒸”数据(distillation)在提升模型智能方面的关键作用,并指出RWKV模型正通过蒸DeepSeek等开源数据来增强能力。同时,提及RWKV-8 ROSA机制作为替代Attention的新机制,预示着未来RWKV模型在推理速度和效率上将有进一步突破,并承诺将持续优化模型。

💡 **高效推理与社区贡献**:RWKV7 7.2B FP16模型在单张5090显卡上实现了超过10000 token/s的解码速度,且速度恒定、显存占用稳定,展现了其高效的推理能力。文章还提到全球已有大量论文使用RWKV模型进行训练,显示了其在学术和研究领域的广泛应用和影响力。

RWNG Bo 2025-10-10 16:27 广东

MMLU Pro 50% (+CoT),GSM8K 84%,MATH500 61%,MMLU 64.4%

💡Tips

转自知乎用户 PENG Bo,原文链接:

https://zhuanlan.zhihu.com/p/1959638720270561812

RWKV7-G0a2 7.2B的特点是,我开始蒸DeepSeek,现在蒸了几十G。

RWKV和大厂的真正区别是,大厂都是狂蒸GPT5 / Gemini / Claude(大家自己清楚,进步有多少%靠蒸)。RWKV自己没蒸,几乎都是用HF的各种开源数据(其实现在大部分HF数据也是蒸)。

现在是“唯效果论”,所以我也蒸。先蒸DeepSeek。蒸了多少数据,就有多少智能。

首先回顾之前发布的G1a 2.9B的更多指标(测试代码: https://github.com/Jellyfish042/rwkv_mmlu)。作为纯预训练的2.9B基模,成绩不错(更新:现已加入G0a2 7.2B成绩,注意G0代表7.2B的训练数据量远未饱和,请大家期待它的后续进步):

最近Ling-1T模型的发布稿有一些编程prompt(更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA),下面用这些prompt测RWKV7-G0a2 7.2B,体现公正。

模型下载:https://huggingface.co/BlinkDL/rwkv7-g1/blob/main/rwkv7-g0a2-7.2b-20251005-ctx4096.pth

运行方式:https://github.com/josStorer/RWKV-Runner/releases

(值得一提的是,RWKV-7 7B能达到的推理速度极高,见RWKV-8替代attention新机制名为ROSA,RWKV-7 7B单5090解码10000+ tok/s演示但Runner是旧代码,请等我们逐步优化)


首先:请生成一个蓝紫色主题(主色调为 #6A5ACD,辅助色为白色)的现代用户卡片组件。卡片内必须包含:1. 用户头像(圆形占位符);2. 用户名;3. 一句签名(使用斜体字);4. 一个蓝色关注按钮;5. 整体布局居中。

然后我把输出放到 https://html.onlineviewer.net/ 看效果,如右图:

请注意我的解码参数,和RWKV Runner默认值不同。

很好,可以vibe coding。提示遵循有些不准,毕竟是小模型,我会继续蒸。


继续:设计一个好看的倒计时网页。

这个页面风格,很deepseek,就是这个渐变色。

代码看着还行,点按钮,报错:【Uncaught ReferenceError: Cannot access 'endDate' before initialization】。

那么,我们上强度,多轮对话,让模型处理这个错误:

模型理解了,给了方法,但还是没修好。算了,这得等RWKV-8 ROSA(RWKV-8替代attention的新机制名为ROSA。另外RWKV-7 7B满血fp16在单5090解码10000+ token/s演示。)

再抽一次卡,这次效果丑:

不过,点击【开始倒计时】,它可以正常工作:

下面是模型的完整输出:

<think>嗯,用户让我设计一个好看的倒计时网页。首先,我需要理解他们的需求。可能他们想要一个视觉上吸引人的倒计时器,适合展示在网站上,比如活动倒计时或者促销活动。接下来,我得考虑用户可能没有明确说出来的需求,比如响应式设计、交互效果、样式灵活性等。首先,我应该确定技术栈。HTML结构需要包含倒计时的各个部分,比如天数、小时、分钟、秒。CSS方面,要设计现代感的样式,可能用渐变背景、阴影和圆角来增加美观度。JavaScript部分需要处理倒计时逻辑,包括获取当前时间、计算剩余时间以及更新UI。然后,考虑用户体验。倒计时应该实时更新,所以需要使用setInterval来每秒刷新一次。同时,当倒计时结束时,要有提示,比如显示“倒计时结束”或者跳转到指定页面。响应式设计也很重要,确保在不同屏幕尺寸下都能正常显示。接下来是样式设计。可能需要使用卡片式布局,背景颜色搭配柔和的色调,比如浅蓝色或米白色,这样看起来舒适。字体选择清晰易读的Sans-serif字体,比如Arial或Roboto。边框和阴影可以增强层次感,比如添加2px的阴影和圆角5px。交互方面,点击按钮可以切换倒计时模式,比如从“开始”变为“结束”,并改变文本颜色。这需要绑定事件监听器到按钮元素,并根据状态更新样式和文本内容。另外,考虑到移动端的兼容性,可能需要添加媒体查询,调整字体大小和按钮尺寸,确保在手机上也能良好显示。还有,倒计时结束后的处理,比如弹出提示框或跳转链接,需要通过JavaScript实现。最后,测试各种情况,比如倒计时结束后的行为是否正确,样式在不同设备上的表现是否一致,以及响应速度是否流畅。可能还需要添加一些动画效果,比如数字闪烁或进度条,但用户没有特别提到,所以可能保持简洁。总结一下,我需要提供一个结构清晰、样式美观、功能完善的倒计时网页,涵盖HTML结构、CSS样式和JavaScript逻辑,同时考虑响应式设计和用户交互体验。</think>以下是一个设计精美的倒计时网页示例,包含现代化的UI设计和流畅的动画效果:```html<!DOCTYPE html><html lang="zh-CN"><head>    <meta charset="UTF-8">    <meta name="viewport" content="width=device-width, initial-scale=1.0">    <title>精美倒计时 - 活动倒计时器</title>    <style>        * {            margin: 0;            padding: 0;            box-sizing: border-box;            font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;        }        body {            background: linear-gradient(135deg, #f5f7fa 0%, #c3cfe2 100%);            min-height: 100vh;            display: flex;            justify-content: center;            align-items: center;            padding: 20px;        }        .container {            background: white;            border-radius: 15px;            box-shadow: 0 10px 30px rgba(0, 0, 0, 0.1);            overflow: hidden;            max-width: 800px;            width: 100%;        }        .header {            text-align: center;            padding: 30px;            color: #2c3e50;            position: relative;        }        .header h1 {            font-size: 2.5rem;            margin-bottom: 10px;            text-shadow: 0 2px 5px rgba(0, 0, 0, 0.1);        }        .header p {            font-size: 1.2rem;            opacity: 0.9;        }        .timer-section {            display: flex;            flex-direction: column;            align-items: center;            padding: 40px 20px;        }        .timer-card {            background: linear-gradient(135deg, #4a90e2 0%, #2980b9 100%);            border-radius: 15px;            padding: 25px;            box-shadow: 0 5px 15px rgba(0, 0, 0, 0.15);            transition: transform 0.3s ease;        }        .timer-card:hover {            transform: translateY(-5px);        }        .timer-value {            font-size: 3rem;            font-weight: bold;            color: white;            margin: 20px 0;            text-align: center;        }        .timer-label {            font-size: 1.1rem;            color: #6c757d;            margin-bottom: 10px;        }        .buttons-group {            display: flex;            justify-content: center;            gap: 15px;            margin-top: 20px;        }        .btn {            padding: 12px 25px;            border: none;            border-radius: 8px;            font-size: 1rem;            font-weight: 600;            cursor: pointer;            transition: all 0.3s ease;        }        .btn.active {            background: linear-gradient(45deg, #3498db, #2980b9);            box-shadow: 0 5px 15px rgba(52, 152, 219, 0.3);        }        .btn:hover {            transform: translateY(-2px);            box-shadow: 0 7px 15px rgba(52, 152, 219, 0.3);        }        .footer {            text-align: center;            padding: 20px;            color: #6c757d;            font-size: 0.9rem;        }        @media (max-width: 768px) {            .timer-value {                font-size: 2.5rem;            }            .timer-label {                font-size: 0.9rem;            }        }    </style></head><body>    <div class="container">        <div class="header">            <h1>精美倒计时</h1>            <p>欢迎访问我们的倒计时页面!</p>        </div>        <div class="timer-section">            <div class="timer-card">                <div class="timer-value" id="days"></div>                <div class="timer-label">天</div>            </div>            <div class="timer-card">                <div class="timer-value" id="hours"></div>                <div class="timer-label">小时</div>            </div>            <div class="timer-card">                <div class="timer-value" id="minutes"></div>                <div class="timer-label">分钟</div>            </div>            <div class="timer-card">                <div class="timer-value" id="seconds"></div>                <div class="timer-label">秒</div>            </div>        </div>        <div class="buttons-group">            <button class="btn active" id="startBtn">开始倒计时</button>            <button class="btn" id="stopBtn">暂停倒计时</button>            <button class="btn" id="resetBtn">重置倒计时</button>        </div>    </div>    <script>        // 倒计时逻辑        let timerId;        let startTime = null;        let isRunning = false;        const daysEl = document.getElementById('days');        const hoursEl = document.getElementById('hours');        const minutesEl = document.getElementById('minutes');        const secondsEl = document.getElementById('seconds');        const startBtn = document.getElementById('startBtn');        const stopBtn = document.getElementById('stopBtn');        const resetBtn = document.getElementById('resetBtn');        // 初始化倒计时        function initTimer() {            startTime = new Date();            updateDisplay();            timerId = setInterval(() => updateDisplay(), 1000);        }        // 更新倒计时显示        function updateDisplay() {            const now = new Date();            const totalSeconds = Math.floor((now - startTime) / 1000);            const days = Math.floor(totalSeconds / 86400);            const hours = Math.floor((totalSeconds % 86400) / 3600);            const minutes = Math.floor((totalSeconds % 3600) / 60);            const seconds = Math.floor(totalSeconds % 60);            // 格式化输出            daysEl.textContent = String(days).padStart(2, '0');            hoursEl.textContent = String(hours).padStart(2, '0');            minutesEl.textContent = String(minutes).padStart(2, '0');            secondsEl.textContent = String(seconds).padStart(2, '0');        }        // 开始倒计时        function startCountdown() {            isRunning = true;            startBtn.disabled = true;            stopBtn.disabled = false;            resetBtn.disabled = false;            initTimer();        }        // 暂停倒计时        function pauseCountdown() {            isRunning = false;            startBtn.disabled = false;            stopBtn.disabled = true;            resetBtn.disabled = true;        }        // 重置倒计时        function resetCountdown() {            clearInterval(timerId);            updateDisplay();            startBtn.disabled = false;            stopBtn.disabled = true;            resetBtn.disabled = true;            isRunning = false;        }        // 事件监听器        document.addEventListener('DOMContentLoaded', () => {            startBtn.addEventListener('click', () => {                if (!isRunning) {                    startCountdown();                } else {                    pauseCountdown();                }            });            stopBtn.addEventListener('click', () => {                pauseCountdown();            });            resetBtn.addEventListener('click', () => {                resetCountdown();            });        });    </script></body></html>```这个设计包含以下特点:1. **现代化UI设计**:   - 柔和的渐变背景和阴影效果   - 圆角卡片式布局   - 流畅的动画效果   - 响应式设计,适配移动端2. **交互功能**:   - 三种操作模式:开始/暂停/重置   - 按钮状态反馈(悬停效果)   - 实时更新的倒计时显示3. **视觉元素**:   - 高对比度的色彩方案   - 动态的数字显示效果   - 平滑的过渡动画4. **技术实现**:   - 使用JavaScript实现倒计时逻辑   - 支持多种操作模式切换   - 包含错误处理和状态管理您可以直接复制这段代码到HTML文件中运行,即可看到完整的倒计时界面。如果需要调整颜色或样式,可以修改CSS部分的变量值。

测试:请给前沿科技媒体机器之心设计一个前沿风格网页,要求置顶部分滚动播出实时AI新闻。

第一次抽卡,给了设计,没给HTML:

改prompt,告诉它给HTML,效果如右图:

再抽卡:

仍需努力,请大家期待更强的RWKV7-G1b。蒸了多少数据,就有多少智能。


测个写作(注意我的解码参数,对于创意写作,可以增大penalty):


目前在rwkv.cn显示,全球已有140篇论文使用RWKV训练各种模型。注意不是引用RWKV论文,而是真实使用RWKV训练模型。

最后,RWKV7-G0a2 7.2B的MMLU也从G0a的63.11%上升到64.44%(直接输出A/B/C/D字母,无CoT)。

今天也顺带更新了G1a2 1.5B:https://huggingface.co/BlinkDL/rwkv7-g1/blob/main/rwkv7-g1a2-1.5b-20251005-ctx8192.pth,蒸DeepSeek后,指令理解能力显著提升。

RWKV7 7.2B FP16,5090 单卡bsz960 = 10250 token/s,永远匀速,恒定显存,视频:

如果bsz320,总速度9650tps,但会看上去更快:

关注我们:

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RWKV AI模型 语言模型 性能测试 代码生成 深度学习 RWKV7-G0a2 RWKV-8 ROSA DeepSeek MMLU GSM8K MATH500 AI benchmarks LLM natural language processing machine learning model performance programming assistance inference speed
相关文章