改革语音恢复:斯坦福领导的研究揭示了用于无约束通信的高性能神经假肢
Stanford-led research reveals high-performance neural prosthesis for unconstrained communication in speech recovery reform
脑-计算机界面(BCIs)是一种前沿的技术进步,对于由于残疾而丧失沟通能力的个体的康复具有有希望的应用前景。从庞大的词汇表中解码脑过程以实现无限制短语的沟通,尽管早期调查已经显示出希望。
为了填补这一空白,来自斯坦福大学、华盛顿大学圣路易斯分校、VA RR&D陈列馆的神经恢复和神经技术中心、布朗大学和哈佛医学院的研究人员最近提出了一种高性能的语音转文本BCI,可以以62个单词/分钟的速度处理大词汇的无约束句子。这一速率远远超过了传统技术在瘫痪人士中的沟通速度。团队首先使用BrainGate2试点临床试验中的脑活动记录来研究运动皮层如何组织口面运动和语音产生。他们发现所有研究的运动在6v区域中都有很强的调整。
然后,研究人员研究了每个运动的数据在6v区域的分布情况,发现背侧阵列携带有关口面运动的更多信息,但腹侧阵列提供了最可靠的语音解码速率。尽管如此,6v阵列提供了关于每种运动的大量数据。最后,3.2 3.2 mm2阵列可以充分表示所有发音器官。接下来,他们研究了他们是否能够在实时中中性地解析完整句子。他们使用最先进的语音识别启发的量身定制机器学习技术来训练循环神经网络(RNN),该网络在最小的神经数据下表现出色。
- 人工智能在网站建设中的崛起:更详细地了解Hostinger AI网站构建器
- 见面RecMind:一种由大型语言模型技术驱动的自主推荐代理,结合了推理、行动和记忆的各种推荐任务
- R和brms在学校毕业生结果上的贝叶斯比较
使用他们的数据,建议的方法可以正确解码50个单词的92%,39个音素的62%和所有口面运动的92%。此外,使用语音转文本BCI可以实现每分钟62个单词。总之,与所有研究的运动一致且空间混合调整的结果表明,尽管瘫痪和大脑皮层表面覆盖有限,语音表达的表示足够强大,可以支持语音BCI。进一步的分析使用了6v区域的记录,因为44区域几乎没有提供有关语音产生的数据。
在脑干中风或肌萎缩侧索硬化等神经疾病中,讲话和运动能力可能受到严重损害,甚至完全丧失。基于手部运动活动的BCI现在可以使瘫痪人士每分钟输入8至18个单词。尽管它们显示出很大的希望,但语音BCI在大词汇上的准确性仍然有待提高,这将大大加快它们恢复自然沟通的能力。研究人员使用微电极阵列以单神经元分辨率记录脑活动,开发了一种语音BCI,可以解析来自大词汇的未拉伸句子(每分钟62个单词的速度)。这是第一次展示BCI提供比其他瘫痪技术更快的沟通速度。
这个实验证明了使用神经尖峰活动来解码对语音的尝试,包括广泛的词汇是可能的。然而,值得注意的是,该系统仍然需要足够完善,以便在临床环境中使用。还有更多的工作要做,通过最小化训练解码器的时间,并适应多天脑活动的变化,使BCI更加用户友好。此外,在临床环境中广泛使用脑内微电极阵列之前,还需要更多的安全性和有效性证据。此外,这里展示的解码结果需要在其他参与者中复制,并且尚不清楚它们是否适用于有更严重口面瘫痪的人。需要更多的研究来确认存储语音信息的前中央回旋区域是否可以可靠地针对具有不同脑结构程度的个体,这是一个潜在的问题。