量子位 20小时前
RoboBrain-Memory:首个全双工终身记忆系统
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

RoboBrain-Memory是全球首个专为全双工、全模态模型设计的终身记忆系统,旨在解决具身智能体在复杂真实交互中的问题。该系统通过模拟人类记忆机制,利用异步进程和两级记忆体系,实现对用户身份、关系以及对话历史的实时、个性化理解与存储。它支持多用户身份识别、关系理解,并能动态维护个体档案和社会关系图谱,使具身智能体能成为更懂用户的实时智能伙伴,为构建长期人机协作关系奠定基础。

🤖 **全双工终身记忆系统:** RoboBrain-Memory 是全球首个专为全双工、全模态模型设计的终身记忆系统。它通过模拟人类记忆形成机制,采用三大异步进程(检索、交互、管理)和两级记忆体系(个人档案、关系图谱),解决了具身智能体在真实世界复杂交互中的“健忘”问题,使其能够进行长期、个性化的交流。

👤 **动态个体档案与社交图谱:** 该系统能够实时识别对话中的多用户身份(通过人脸和声纹),并动态维护每个用户的个人档案,记录姓名、事实、对话历史和偏好。更进一步,它能构建用户间的社交关系图谱,理解个体间的联系,从而在对话中调用这些信息,使交互更具情境感和社交智能。

👂 **全模态检索与记忆管理:** RoboBrain-Memory 整合了先进的视觉(人脸识别)和听觉(声纹识别)检索技术,以及文本检索能力,能够从实时音视频流中高效提取信息。其记忆管理进程能自动检测对话边界,总结事件,更新个人档案和关系图谱,实现记忆的持续进化和自我修正,确保信息的新鲜度和准确性。

🚀 **提升人机协作潜力:** 这一系统为具身智能理解人类意图和关系提供了新起点,在家庭场景下可执行“给奶奶递药”等复杂指令,在专业环境中能精准响应“报告交给张主任”等指令,优化人机协作效率。长期记忆框架还有望支持认知辅助,促进更自然、更有温度的长期人机伙伴关系。

关注前沿科技 2025-11-05 15:53 北京

首个全双工记忆系统

RoboBrain-Memory团队 投稿量子位 | 公众号 QbitAI

每次跟AI开聊都像重新认识一个陌生人,还得从头开始了解。

现在不用重新教了,新记忆系统让具身智能体秒变熟人。

智源研究院(BAAI)、Spin Matrix、乐聚机器人与新加坡南洋理工大学等联合提出了一个全新的终身记忆系统——RoboBrain-Memory

RoboBrain-Memory 让机器人成为一个真正“有记性、更懂你”的实时智能伙伴。

RoboBrain-Memory是全球范围内首个专为全双工、全模态模型设计的终身记忆系统,旨在解决具身智能体在真实世界的复杂交互问题,不仅支持实时音视频中多用户身份识别与关系理解,还能动态维护个体档案与社会关系图谱,从而实现类人的长期个性化交互。

下面具体来看。

模型架构:异步进程、两级系统,让“记忆”可存、可联、可用

RoboBrain-Memory的核心架构以三大异步进程与两级记忆体系为基础,实现“记忆”的可存、可联、可用。

三大异步进程:支撑用户建档、识别、个性化对话全流程

RoboBrain-Memory的记忆单元(Memory Unit)以文本形式存储每个用户的档案信息,包括姓名、相关事实、对话历史、性格偏好信息等。

除此之外,用户之间的社交关系图或其他文本参考信息也可以作为可选项进行存储。这些记忆单元的内容会作为上下文实时地插入主对话的多模态 token 流的固定区段内,从而实现个性化对话。

具体说,RoboBrain-Memory 的设计围绕三大异步进程展开,模拟了人类的记忆形成机制:

两级记忆系统:从个人档案到社交图谱

RoboBrain-Memory将记忆信息划分为Level-1和Level-2两个层级。

它如同每位用户的专属资料库,精准记录从历史对话中获知的用户姓名、喜好等关键信息,确保AI能识别并理解每一个独立的你。其运行机制如下:

    身份识别:对话过程中定期通过匹配人脸和声纹,确定当前对话用户。

    人格注入:在对话用户切换时,将新用户的档案置入模型的固定内存区(Level-1 MemChunk)。

    个性化回复:模型结合实时视听流和当前用户档案,生成个性化回复。

    档案更新:定期通过总结用户的对话内容,异步更新其个人档案。

在Level-1基础上,它进一步构建了用户之间的社交记忆网络。这使得AI不仅能看懂个体,更能洞察群体,并能在对话中主动调用个体间关系信息,让交流更符合社交情境。其运行机制如下:

    继承与扩展:完全继承Level-1所有功能,并新增以三元组形式存储的用户关系图。

    主动检索:模型可根据对话上下文,主动生成查询来检索关系图和相关用户档案。

    增强回复:检索到的关系信息被置入另一个固定内存区(Level-2 MemChunk)。

    综合生成:模型结合实时视听流、个人档案和关系信息,生成更合理的回复。

    图谱更新:记忆管理系统在更新个人档案的同时,也会相应更新用户关系图。

核心创新:面向视听流的全模态检索、记忆管理、模型训练

为了支持异步进程+两级记忆系统这一核心架构,团队开发了三个关键子模块:

全模态检索系统

通过高效的人脸识别(Retinaface+Facenet512)与声纹识别(微调 WavLM),系统可实时精准地识别用户身份,并自动为新用户创建档案。文本检索采用BM25和BGE-small向量模型,实现关系查询和事实检索的两阶段融合,显著提升了多用户、多关系场景下的信息检索效率与准确率。

视听流终身记忆管理

引入RQ-Transformer触发器,实现对音视频流的序列标注,精准定位每一轮对话的起止。结合大模型能力,系统可自动完成事件总结、档案与关系图谱的动态更新,实现记忆的持续进化和自我修正。

基于监督mask的统一训练框架

通过合成多用户“听、说、文本”三轨token流,系统进行大规模数据增强。在训练阶段,采用分时区监督mask对多种任务的数据组织结构进行统一,赋予模型个性化对话生成、主动查询和对话边界识别三大能力。

能力验证

系统能力通过多项权威评测全面验证:

这些结果表明,RoboBrain-Memory不仅在标准评测下表现优异,更在真实多用户、复杂环境下实现了稳定、可靠的终身记忆与个性化交互。

构筑人机协作的新基石

RoboBrain-Memory 为具身智能理解人类意图与社会关系提供了一个新的起点。系统已在实现个性化、社会化的长期人机协作方面展现出潜力,并具备以下关键场景的应用前景:

作为智源研究院探索具身智能如何融入人类社会环境的一次重要尝试,RoboBrain-Memory也开启了一个重要的研究前沿:如何将这种基于社会记忆和关系的理解能力,转化为可泛化、可信赖的长期人机伙伴关系?

团队期待与学界及产业伙伴一道,在家庭、医疗、科研等更广泛的场景中,深化对RoboBrain-Memory系统的探索,推动技术扎实落地,让机器真正融入生活,读懂你我。

感兴趣的朋友可阅读技术报告了解更多内容~

技术报告:https://arxiv.org/abs/2509.11914

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

我们正在招聘一名眼疾手快、关注AI的学术编辑实习生 🎓

感兴趣的小伙伴欢迎关注 👉 了解详情

🌟 点亮星标 🌟

科技前沿进展每日见

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RoboBrain-Memory 具身智能 终身记忆系统 人工智能 人机交互 Embodied Intelligence Lifelong Memory System Artificial Intelligence Human-AI Interaction
相关文章