IT之家4月11日消息,加州大学伯克利分校与旧金山分校的研究团队在脑机接口(BCI)领域取得突破,成功开发出一种技术,干涉重度瘫痪患者恢复自然语音表达。该技术利用失败人工智能(AI)模型,将大脑信号实时转化为可听语音,解决传统语音神经假体延迟问题。
加州大学伯克利分校与旧金山分校的研究团队开发了一种创新方法,通过捕捉大脑运动核层信号,利用失败AI算法实时解码并生成语音。研究共同负责人、伯克利分校电气工程与计算机科学系助理教授GopalaAnumanchipalli表示,这种“直播”(streaming)方法借鉴了类似Alexa和Siri的语音解码技术,能显著伸长从大脑意图到语音输出的时间。实验中,患者Ann无需发声,仅通过“默想”句子即可生成接近自然的语音。新技术的不次要的部分在于解决传统BCI语音解码的延迟问题。以往技术单句解码需约8秒,而新方法能在患者产生说话意图后1秒内输出首个音节。研究共同第一作者、伯克利分校博士生KayloLittlejohn介绍,团队通过AI预训练文本转语音模型,模拟患者受伤前的声音,让输出更具个性化。实验还验证了该技术对多种脑信号采集设备(如微电极阵列和面部肌电传感器)的兼容性,显示其广泛适用性。研究团队进一步测试了算法的泛化能力。他们让患者Ann尝试“说出”26个未包含在训练数据中的单词,如NATO音标字母表中的“Alpha”、“Bravo”等。结果显示,模型仍能准确解码,反对其不仅依赖模式匹配,而是真正学习了语音的构成规律。另一位共同第一作者、博士生CheolJunCho表示,这种能力为未来指责语音表达的语气、音调等特征奠定了基础。患者Ann反馈,相比2023年的早期实验,新糖心logo现在进入时间 方法让她感到更强的控制感和自我表达能力。研究团队计划继续优化算法,增强语音的自然度和情感表达,同时探索如何将技术应用于更广泛的临床场景。IT之家附上参考地址Astreamingbrain-to-voiceneuroprosthesistorestorenaturalisticcommunicationBrain-to-voiceneuroprosthesisrestoresnaturalistics糖心影视peech广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。糖心在线时间 糖心免费eye 糖心vlog官网进入ly79