RWKV-8预告：ROSA机制引领长文本处理新篇章

RWKV元始智能 10月09日 12:41

RWKV团队发布了RWKV-8（代号Heron）的预告，核心亮点是其全新的长文本处理机制ROSA（蔷薇）。ROSA旨在解决当前长文本处理算法的不足，提供真实且无妥协的高效性能，实现“永不遗忘，永能召回”。与现有方法不同，ROSA被描述为一个深度且富有内涵的算法，预示着Attention机制的局限性，并可能成为长文本处理的“正解”。此外，RWKV-7 7B模型在单块5090显卡上已实现10000+ token/s的解码速度，并且该纯RNN架构保证了恒定的显存占用和匀速的性能表现，展现了巨大的优化潜力。

✨ **ROSA机制革新长文本处理：** RWKV-8（代号Heron）引入了名为ROSA（蔷薇）的全新机制，旨在彻底改变长文本处理的效率和性能。与现有算法的拼凑感不同，ROSA被定位为一个深度且内涵丰富的算法，有望成为解决长文本问题的“正解”，并标志着Attention时代的落幕。

🚀 **“永不遗忘，永能召回”的性能承诺：** ROSA机制的核心优势在于其能够实现“永不遗忘，永能召回”的特性，这意味着模型在处理长序列信息时，能够更有效地记忆和检索早期信息，从而在需要时精确调用，解决长文本中的信息丢失或干扰问题。

⚡ **RWKV-7 7B的卓越解码速度：** 在ROSA机制正式推出之前，RWKV-7 7B模型已在单块NVIDIA 5090显卡上实现了超过10000 token/s的解码速度（fp16精度，960路并发），并且在320路并发下也能达到9500 token/s。这得益于其纯RNN架构，确保了恒定的显存占用和匀速的性能，展现了巨大的优化空间。

🔄 **纯RNN架构的优势：** 作为纯RNN模型，RWKV系列在长文本处理上具备天然优势，其性能表现是匀速且恒定的，不会随着序列长度的增加而显著下降，显存占用也保持稳定，这对于需要处理海量数据的应用场景尤为关键。

原创 PRNG Bo 2025-10-09 11:55 广东

ROSA永不遗忘，永能召回。RWKV-7 7B满血fp16在单5090解码10000+ token/s。