动点科技 08月14日
AI 助力脑机接口:18 年瘫痪患者实现近实时“发声”,时延仅 1 秒
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一位因中风导致闭锁综合征的加拿大高中教师安·约翰逊,在饱受18年无法言语的痛苦后,通过一项创新的脑机接口(BCI)技术,终于能够再次听到自己的声音。这项由加州大学伯克利分校和加州大学旧金山分校联合开展的临床试验,利用植入大脑的神经假体,解码大脑的语言活动,并将其转化为可听的语音。该技术通过人工智能解码器将神经信号转化为文本、语音或数字形象的面部表情,并将延迟时间从8秒缩短至1秒,同时还实现了声音和虚拟形象的个性化。研究人员的目标是让这项技术实现“即插即用”,并有望在几年内实现实用的实时语音恢复,为失去语言能力的人们带来福音。

🧠 脑机接口技术赋能闭锁综合征患者重获语言能力:加拿大教师安·约翰逊在因脑干中风导致近乎完全瘫痪并饱受闭锁综合征折磨18年后,通过一项创新的脑机接口(BCI)技术,得以绕过受损的神经通路,直接从大脑活动中解码语言,产生可听的语音,让她重新能够与外界沟通。

💡 神经假体解码大脑语言活动,实现近实时语音输出:该技术的核心在于植入大脑语言生成区域的神经假体,它能检测到尝试说话时的神经活动,并将其传输给人工智能解码器。通过AI模型的不断优化,延迟时间已从最初的8秒缩短至1秒,实现了近乎实时的语音输出,极大地提升了沟通效率。

🗣️ 个性化声音与虚拟形象,提升用户体验:为了使沟通更加自然和个性化,研究人员利用约翰逊过去的录音重现了她的声音,并为其创建了一个与之匹配的虚拟形象,能够模拟面部表情。这使得沟通不仅是语言的恢复,更包含了情感和视觉的传达。

🚀 迈向“即插即用”的临床应用,未来可期:研究团队致力于将这项实验性技术转化为标准临床工具,未来计划开发无线植入装置和更逼真的虚拟形象,甚至实现数字“克隆人”,模仿用户的对话风格和视觉信号。目标是让失去语言能力的人们能够更快速、更自然地沟通。

💖 赋予脆弱群体希望,改善生活质量:这项突破性技术有望帮助因中风、肌萎缩侧索硬化症(ALS)或外伤等原因失去语言能力的人群,重获与他人交流的能力,极大地改善他们的生活质量。约翰逊本人也表示,希望通过自身经历激励更多患者,知道他们的生活并未因此结束。

加拿大萨斯喀彻温省的高中教师兼教练安·约翰逊(Ann Johnson)在 2005 年因脑干中风导致近乎完全瘫痪,此后一直饱受闭锁综合征的折磨。这种罕见病症使患者意识清醒,却无法言语或行动。18 年来,约翰逊依靠眼动追踪系统以每分钟 14 个词的速度与外界沟通,远低于正常人每分钟约 160 个词的对话速度。然而,如今她终于再次听到了自己的声音,这得益于一种脑机接口(BCI)技术,该技术能够直接从大脑活动中解码语言。

图源:Noah Berger

2022 年,约翰逊成为加州大学伯克利分校和加州大学旧金山分校联合开展的一项临床试验的第三位参与者。这项试验旨在通过一种神经假体恢复严重瘫痪患者的语言能力。研究人员通过植入神经假体,从大脑的语言运动皮层记录信号,绕过受损的神经通路,从而产生可听的语音。

该设备依赖于放置在大脑语言生成区域上方的植入物,当约翰逊尝试说话时,植入装置会检测到神经活动,并将信号传输到连接的计算机。随后,人工智能解码器将这些信号转化为文本、语音或数字形象上的面部表情。最初,该系统使用了序列到序列的人工智能模型,需要完整的一句话才能输出结果,导致会有 8 秒的延迟。然而,2025 年 3 月,研究团队在《自然神经科学》杂志上报告称,他们已转向流式架构,实现了仅 1 秒延迟的近实时翻译。

为了使体验更加个性化,研究人员利用约翰逊 2004 年婚礼演讲的录音重现了她的声音。她还选择了一个与自己外貌相符的虚拟形象,该形象能够模仿微笑或皱眉等面部表情。

图源:Noah Berger

加州大学伯克利分校电气工程与计算机科学助理教授戈帕拉·阿努曼奇帕利(Gopala Anumanchipalli)、加州大学旧金山分校神经外科医生爱德华·张(Edward Chang)以及伯克利分校博士生凯洛·利特尔约翰(Kaylo Littlejohn)表示,他们的目标是使神经假肢实现“即插即用”,将其从实验系统转变为标准临床工具。未来改进的方向可能包括无线植入装置,从而无需直接连接计算机,以及更加逼真的虚拟形象,以实现更自然的互动。研究团队还设想开发数字“克隆人”,不仅能复制用户的声音,还能模仿其对话风格和视觉信号。

这项突破有望帮助那些因中风、肌萎缩侧索硬化症(ALS)或受伤而失去语言能力的相对小众但极为脆弱的群体,让他们重新获得更快速、更自然的沟通能力。研究人员强调,该系统只有在参与者有意识地尝试说话时才会工作,从而确保用户的自主性和隐私。

对于约翰逊来说,这次试验彻底改变了她的生活。“我希望患者看到我,知道他们的生活并未结束,”她在接受加州大学旧金山分校采访时说。她期待有一天能在康复中心担任咨询师,借助神经假肢与客户交流。

随着延迟时间降至约 1 秒,以及人工智能建模的持续进步,研究人员相信,实用的实时语音恢复技术有望在几年内实现,这将彻底改变技术为失去语言能力的人们赋予声音的方式。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

脑机接口 闭锁综合征 语音恢复 神经假体 人工智能
相关文章