1987年,当我在伊利诺伊大学完成博士论文时,加州理工学院的John Hopfield向伊利诺伊大学香槟分校物理光学实验室的学生们讲述了他在神经网络方面的开创性研究,我有幸得以聆听。他描述了如何设计和制造循环神经网络芯片,以快速解决标准旅行商问题(Traveling Salesman Problem,TSP),因为TSP中的城市数迅速增加,没有物理计算机可以在渐近有界的多项式时间内解决该问题,所以该问题是NP完全的。
John Hopfield的开创性工作证明,如果组合算法的“目标函数”可以用二次型表示,那么可对循环人工神经网络中的突触连接进行相应的编程,通过组成神经元之间的大量相互作用来降低(局部极小化)目标函数的值。Hopfield的神经网络由可以随机初始化的侧连接神经元组成,该网络可以迭代减少固有Lyapunov能量函数,以达到局部极小状态。值得注意的是,在神经元未提供自反馈的循环神经网络的动力学作用下,Lyapunov函数单调递减。
在我作为助理教授进入密歇根大学后不久,我首先与一名博士生一起开发了具有异步状态更新的仿真神经网络,然后与另一名学生一起开发了具有同步状态更新的数字神经芯片。这些神经电路旨在通过在二分图中找到节点覆盖、边缘覆盖或对匹配来修复问题,进而修复VLSI芯片。在我们的图表示中,二分图中的一组顶点表示故障电路元件,而另一组顶点表示备用电路元件。为了将有故障的VLSI芯片重组为无故障的工作芯片,在嵌入式内置自检电路识别出有故障的电路元件后,通过可编程开关元件自动调用备用电路元件。
最重要的是,与TSP问题一样,二维阵列修复也可以表示为NP完全问题,因为修复算法寻找最佳的备用行和备用列的数量,这些备用行和备用列可以用于绕过位于存储阵列内的故障部件,如存储单元、字线和位线驱动器、传感放大器等。因此,由计数器和其他模块组成的简单数字电路很难解决这种自修复问题。值得注意的是,由于无法部署VLSI芯片的输入和输出引脚来将它们与深度嵌入的电路模块连接,因此无法使用外部数字计算机来确定如何修复嵌入式阵列。
在1989年和1992年,我分别获得了两项NSF拨款,将神经形态自修复设计风格扩展到了更广泛的嵌入式VLSI模块,例如存储器阵列、处理器阵列、可编程逻辑阵列等。然而,这种通过内置自检和自修复来提高VLSI芯片产量的方法略显超前,因为20世纪90年代早期最先进的微处理器只有几十万个MOS晶体管,并且亚微米CMOS技术很稳定。因此,在为各种类型的VLSI电路模块开发了基于神经网络的自修复VLSI芯片设计方法之后,我停止了对CMOS神经网络的研究。我对继续将神经网络应用于其他类型的工程问题并不太感兴趣,因为我想继续专注于VLSI的研究。对神经形态VLSI电路的研究发表在新书Learning in Energy-Efficient Neuromorphic Computing Algorithm and Architecture Co-Design Neuromorphic Circuits for Nanoscale Devices中。
另外,为了推广几种可能推动VLSI的新兴技术,在20世纪90年代初,美国国防高级研究计划局(DARPA)发起了超电子技术项目,即超密集、超快速计算组件研究计划,日本国际贸易工业部(MITI)启动了量子功能器件(QFD)项目。在这两个研究项目中,由于早期大量创新性非CMOS技术的成功,美国国家纳米技术计划(NNI)得以启动,该计划是一项由20个部门和独立机构参与的美国政府研究与开发(R&D)计划,旨在推动纳米技术革命,以影响行业乃至整个社会。
在1995年至2012年期间,我的研究团队首先专注于基于量子物理学的器件和量子隧穿器件的电路建模,然后利用一维(谐振隧穿二极管)、二维(纳米线)和三维(量子点)约束量子器件,广泛研究用于图像和视频处理的细胞神经网络(Cellular Neural Network,CNN)电路。随后,通过使用电阻性突触器件(通常称为忆阻器)和CMOS神经元,我们开发了基于学习的神经网络电路。我们还通过在计算节点中将量子隧穿和忆阻器件混合,开发了模拟电压可编程纳米计算架构。
本书的大部分内容包含我的三个博士生的论文,因此这三人都被列为本书的合著者。此外,我还邀请了一些访问研究科学家加入CNN的相关研究工作,以扩大本书的讨论范围。本书大体上按以下方式组织:
第1章至第4章从物理特性、器件建模、电路仿真、体系结构和性能评估等方面介绍电阻RAM存储器,即忆阻器交叉阵列存储器。第5章和第6章介绍使用忆阻器进行基于学习的神经形态设计,具体而言,在忆阻器基板上实现脉冲时间依赖可塑性(Spiking Timing Dependent Plasticity,STDP)和Q学习算法。第7章至第10章介绍各种类型的量子隧穿器件以及如何利用它们来设计基于超高速和低功耗忆阻器的图像处理、视频运动处理和彩色图像处理算法。此外,为了在单个量子点或量子盒阵列上实现多种功能,我们将处理器阵列与可编程忆阻器相结合,从而改变处理器阵列的时空特性。这种混合设计可以解释为一种实现模拟电压可编程纳米计算机以及各种时空滤波系统的新方法。第11章介绍基于忆阻器的细胞神经网络的设计,这是中国重庆西南大学的段书凯教授研究组在2011年和2012年访问我的研究组时在密歇根州开始进行研究的。第12章对基于忆阻器的CNN进行了更为严格的分析,这是电子科技大学(UESTC)的于永斌教授在2013年和2014年访问我的研究团队时开始研究的内容。
为了利用忆阻器、量子隧穿和自旋转矩纳米磁性器件建立这些不同的研究课题,我请Steve Kang教授、Kamran Eshraghian教授和Jason Eshraghian博士为不完全熟悉这些新兴技术及其在神经形态计算中的应用的读者编写了本书的教学介绍。第1章从基本操作原理出发,对这些技术进行了很好的回顾,因此,本书可用于纳米级神经形态学电路和体系结构的高级课程。
在第2章中,W.H.Lee和我描述了我们使用基于银非晶氧化硅的忆阻器结构开发的首个交叉阵列存储器技术,并详细介绍了交叉阵列存储器架构,本章还提供了适当的分析模型和计算,包括用于可扩展交叉阵列设计的静态功耗建模。
在第3章中,I.Ebong和我介绍了交叉阵列存储器设计的实际问题,以说明如果进行多次读取操作,单元性能就会下降。具体而言,本章提出了对单级单元(Single Level Cell,SLC)忆阻存储器进行编程和擦除的程序,实践证明,该程序具有自适应方案,该方案源于器件属性,使得访问忆阻存储器更加可靠。
在第4章中,Y.Yilmaz和我讨论了基于忆阻器的多层单元(Multi Level Cell,MLC)的可靠性架构设计,该架构使用了减少约束的读监控写方案。此外,我们描述了一种新的读取技术,该技术可以成功地区分由于阵列中的读取/写入干扰而导致的电阻漂移下的电阻状态。最后,我们提供了分析关系的推导,以阐述选择外围器件参数的设计方法。
在第5章中,I.Ebong和我描述了基于脉冲时间依赖可塑性(STDP)的赢者通吃(Winner Takes All,WTA)神经网络架构的设计,该架构用于二维网格结构上物体的位置检测。我们证明了采用忆阻器实现STDP的模拟方法优于纯数字方法。
在第6章中,I. Ebong和我提出了一个尝试,将更高层次的学习与忆阻器交叉阵列建立联系,从而为实现自配置电路铺平了道路。将该方法或者说是训练方法与Q学习进行了比较,以再次强调可靠地使用忆阻器可能不需要知道每个器件的精确电阻,而是使用器件之间的相对大小进行工作。
在第7章中,S.Li、I.Ebong和我提出了一种基于谐振隧穿二极管(Resonant Tunneling Diode,RTD)的CNN结构,通过驱动点图分析、稳定性和建立时间研究、电路仿真等方法对其运行情况进行了详细描述。对不同CNN实现方式的比较研究表明,基于RTD的CNN在集成密度、运行速度和功能性方面优于常规的CMOS技术。
在第8章中,W.H. Lee和我介绍了一种新的彩色图像处理方法,该方法利用多峰谐振隧穿二极管在二极管的量化状态下对颜色信息进行编码。多峰谐振隧穿二极管是由可编程的无源和有源器件局部连接的二维垂直柱阵列组成,实现了量化、颜色提取、图像平滑、边缘检测和线条检测等多种彩色图像处理功能。为了处理输入图像中的颜色信息,本章采用两种不同的颜色表示方法:一种使用颜色映射,另一种直接使用RGB表示。
在第9章中,W.H. Lee和我演示了一种纳米级速度调谐滤波器的设计,该滤波器采用谐振隧穿二极管执行时间滤波以跟踪运动和静止的物体。新的速度调谐滤波器不仅适用于纳米计算,而且在面积、功率和速度方面也优于其他方法。通过分析模型表明,我们所提出的用于速度调谐滤波器的纳米结构在特定区域内是渐近稳定的。
在第10章中,Y.Yilmaz和我提出了一种新颖的结构,用由量子点和可变电阻器件组成的可编程人工视网膜进行图像处理。这是一种模拟可编程电阻网格结构,在最基本的层次上模拟生物视网膜的细胞连接,该结构能够执行各种实时图像处理任务,如边缘检测和线条检测。单元结构采用称为量子点的三维受限谐振隧穿二极管进行信号放大和锁存,这些量子点通过非易失性的连续可变电阻元件在相邻单元之间互联。
在第11章中,段教授的团队提出了一种基于忆阻器的紧凑型CNN模型及其性能分析和应用。在新的CNN设计中,忆阻器桥电路作为突触电路元件,替代了传统CNN结构中的复杂乘法电路,此外,利用忆阻器的负微分电阻(Negative Differential Resistance,NDR)和非线性IV特性替代了传统CNN中的线性电阻。该章所提出的CNN设计具有高密度、无波动性、突触权重可编程等优点,通过仿真证实了所提出的基于忆阻器的CNN设计操作,这些操作可用于实现几种图像处理功能,并与传统CNN进行了比较。由于忆阻器突触权重的变化,用蒙特卡罗仿真演示了所提出的CNN的行为。
最后,在第12章中,于教授的团队描述了基于忆阻器的WTA神经网络和基于忆阻器的循环神经网络。该章阐述两种忆阻神经网络设计的理论原理,对它们进行了动力学分析,并研究了这两种神经网络的行为。在此理论分析的基础上,他们将WTA神经网络应用于皮肤病分类器中,并改进了仿真结果。
Pinaki Mazumder