忆阻器存算一体系统实现低能耗类脑计算
受人脑工作机制和计算方法的启发,近年来,科学家们试图借鉴人脑的物理结构和工作特性,使计算机能够完成特定的计算任务。
然而,受传统计算机体系结构瓶颈的限制,在当前的信息计算和处理技术中,数据存储和计算需要分别由存储芯片和*处理器来完成。两者之间的数据“处理”需要很长时间,消耗大量电能,并且可能随时“堵塞”。
计算机能像人脑一样通过结合存储和计算来高速处理信息吗?
最近,清华大学微电子研究所和未来芯片技术高级创新中心的研究团队联合开发了一个基于多个忆阻器阵列的存储计算集成系统,该系统能够高效地处理卷积神经网络,其能效比图形处理器芯片高两个数量级。它有望大大提高计算设备的计算能力。相关结果最近发表在《自然》杂志上。
内存和计算集成,功耗小,计算力大
随着人工智能应用对计算和存储需求的不断增长,集成电路芯片技术面临许多新的挑战。一方面,摩尔定律“走得越来越远”,越来越难以通过集成电路技术的小型化来提高计算能力。另一方面,在传统架构中,计算和存储在不同的电路单元中完成,大量的数据处理将导致功耗增加和额外的延迟。
“如果我们把家庭生活比作储藏,把工作比作计算,那么我们每天在上班的路上都会消耗时间和精力,而在早晚高峰时,通勤时间会更长。这个场景和信息处理有很多相似之处。如果存储和计算合二为一,就相当于家庭办公室。它可以减少通勤时间和体力消耗。它可以使用更少的功耗来获得更大的计算能力,并减少数据传输延迟。”团队成员之一、清华大学未来芯片技术高级创新中心教授吴华强表示。
因此,如何实现计算和存储的集成,突破计算能力的瓶颈,成为近年来国内外研究的热点。
忆阻器是继电阻、电容和电感之后的第四个基本电路元件。这种元素的电阻由流经它的电荷决定。即使电流中断,忆阻器的电阻仍将保持在先前的值,这意味着即使电源被切断,这部分数据仍可保留。另外,忆阻器体积小,可以大规模集成,功耗低,适合模拟计算。因此,研究小组认为忆阻器可以用来尝试制造一个像大脑一样的计算,集成存储和计算,低能耗。
但现实远不止是理想的骨感。忆阻器器件之间的波动、器件电导停滞、电导状态漂移等。,将导致较低的计算精度,使得难以制备具有高一致性和可靠性的多值忆阻器阵列。
忆阻器的性能很大程度上取决于材料的选择和组合。在选择材料时,团队主要考虑所选材料的物理参数是否易于控制,是否适合未来产业化。
出于这些考虑,该团队在忆阻器中常用的二氧化铪材料上增加了一个界面控制层。界面控制层为金属氧化物层材料,可以根据不同的工艺精确控制不同组分的比例。通过这种方法,可以更有效地控制忆阻器中二氧化铪部分的微观变化以及内部温度和电场。
“界面控制层就像一个面具,它不仅能隔离病毒和灰尘,还能保暖和保湿。这种设计方法使该器件具有非常优异的电气特性,并可在工厂大量生产。”研究小组的副教授高斌说。
也许它将在人工智能的应用中处于领先地位
为了解决忆阻器存储器-计算机集成系统中的实际问题,有必要克服设备、系统、算法等方面在处理大量计算任务时的瓶颈。卷积神经网络是一个很好的“试金石”。
卷积神经网络是一种重要的深度学习模型。它从人类大脑处理视觉信息的方式中吸取了教训。从算法的角度出发,通过卷积、合并等运算,有效地提取图像、视频等特征信息。它在各种计算机视觉任务处理中取得了良好的效果。在传统的计算架构中,由于存储和计算分离的设计,卷积神经网络模型的实现将导致高功耗和长延迟,不能满足许多生活场景中电池容量和实时操作的要求。
该团队认为,集成了内存和计算的忆阻器可用于实现对卷积神经网络等深度学习模型的高效处理,并满足日常应用对计算能力和功耗的要求。他们还提出了一种空间并行机制,将同一个卷积核编程为多组忆阻器阵列,每组忆阻器阵列可以并行处理不同的卷积输入块。他们集成了8个忆阻器处理单元,每个单元阵列包含2048个忆阻器设备,以提高并行计算的效率。系统高效运行卷积神经网络算法,成功验证了图像识别功能,证明了集成存储与计算架构硬件实现的可行性。
吴华强说,忆阻器记忆-计算机集成系统可能是第一个应用于人工智能领域的系统。如果将基于忆阻器的内存-计算机集成芯片用于生产手机,该芯片的计算能力几乎可以让手机掌握“读心术”,“它可以理解你的声音,知道你喜欢哪些照片,并会变得更接近和更智能。”
上一篇:“八仙过海”比拼类脑计算
下一篇:折扣计算