能读懂你心里话的AI来了,识别错误率低至3%
最近,旧金山加利福尼亚大学的研究小组使用人工智能解码系统将人类脑电波翻译成英语句子,最小平均错误率只有3%。这项研究发表在《自然神经科学》杂志上。
参与实验的四名志愿者都是癫痫患者。由于治疗需要,他们在大脑表面植入了数百个微电极。研究人员使用这些微电极阵列来记录他们的脑电波信号,并借助人工智能系统对其进行解码。
准确性比手工速记员好。
论文显示,10年前,科学家首次从人脑信号中解码出语音,但解码的准确度和速度远低于自然速度。
它有多低?
研究小组表示,到目前为止,在直接从脑电波解码语音的研究中,脑-机接口系统仅限于解码单音节词,或者当志愿者连续读出大约100个单词时,只有不到40%的单词能够被正确解码。
为了提高解码精度,研究小组从机器翻译中获得灵感,并训练了一个循环神经网络。在这项研究中,四名志愿者被要求大声重复30到50个句子。大量的微电极分布在它们的侧大脑皮层,可以监测相应的脑神经活动。这些脑电波数据输入到人工智能系统后,首先被编码成一系列序列,然后被解码成相应的英语句子。
研究人员表示,这项研究显示,大脑皮层脑电图解码具有高精度和自然的语音速度。在一名志愿者的脑电波解码任务中,每个句子平均只有3%需要纠正,低于专业手工速记员平均5%的错误率。
然而,研究小组也强调,这项研究涉及的句子较少。“如果你试图不使用这50个句子的数据集,解码会更糟糕。”第一作者约瑟夫·马尔金在接受媒体采访时说。
展示人工智能解释神经信号的潜力
“本研究的创新之处在于使用端到端深度学习网络实现神经信号翻译,从工程角度展示了人工智能技术在神经信号解释中的潜力。”清华大学医学院神经工程实验室和清华大学人工智能研究所的教授洪波在接受《科学日报》采访时说。
根据洪波的分析,本研究的难点在于两个方面。
首先,使用间距为4毫米、多达256个电极的高密度微电极阵列来覆盖大脑皮层表面的关键大脑区域,并获得足够的神经信息用于解码。这种电极在中国没有临床产品。
此外,本研究中深度循环神经网络的训练不仅采用时间轴上的卷积运算来提高特征提取能力,而且以语音频谱特征作为训练目标,大大降低了对神经数据的需求。
“脑-机接口的核心问题之一是神经信息的解码和翻译。脑电信号是有噪声的,潜在的神经编码机制是复杂和未知的。这些都是挑战。”洪波认为,以深度学习为代表的人工智能技术的发展为脑机接口迎接这一挑战开辟了一条新的途径。
然而,在洪波看来,人工智能和脑机接口的结合也带来了新的困难:如何获得大量的训练数据?人脑的高精度神经数据只能在临床条件下获得,这使得神经网络训练陷入困境。
实际应用中存在技术障碍
“这项技术目前主要用于临床癫痫手术,帮助外科医生在切除癫痫病灶前识别关键的语言功能区。脑-机接口应该供进行性冷冻和截瘫等残疾人士使用,长效电极和解码效率的问题应该不断得到解决。”洪波说。
他认为,今后在相关技术的实际应用中仍然存在很大的技术障碍。例如,高密度微电极阵列不能长时间植入,也不能用作未来脑-机接口的标准电极。
宏博团队还与材料、微电子和临床团队合作,开发可长期植入的微创解决方案。他告诉记者,基本上,当人工智能应用于脑-机接口时,关键的门槛是长期可靠的神经电极和清晰准确的神经解码规则。
“人们希望戴上脑电图帽就能读懂真相,从科学和工程的角度来看,这还有很长的路要走。但是脑科学和人工智能技术的结合有可能加速探索和研究的进程。”洪波说。(记者李媛媛)