搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

三层衍射神经网络实现手写数字识别

徐平 徐海东 杨拓 黄海漩 张旭琳 袁霞 肖钰斐 李雄超 王梦禹

徐平, 徐海东, 杨拓, 黄海漩, 张旭琳, 袁霞, 肖钰斐, 李雄超, 王梦禹. 三层衍射神经网络实现手写数字识别. 物理学报, 2022, 71(18): 184207. doi: 10.7498/aps.71.20220536
引用本文: 徐平, 徐海东, 杨拓, 黄海漩, 张旭琳, 袁霞, 肖钰斐, 李雄超, 王梦禹. 三层衍射神经网络实现手写数字识别. 物理学报, 2022, 71(18): 184207. doi: 10.7498/aps.71.20220536
Xu Ping, Xu Hai-Dong, Yang Tuo, Huang Hai-Xuan, Zhang Xu-Lin, Yuan Xia, Xiao Yu-Fei, Li Xiong-Chao, Wang Meng-Yu. Handwritten digit recognition by three-layer diffractive neural network. Acta Phys. Sin., 2022, 71(18): 184207. doi: 10.7498/aps.71.20220536
Citation: Xu Ping, Xu Hai-Dong, Yang Tuo, Huang Hai-Xuan, Zhang Xu-Lin, Yuan Xia, Xiao Yu-Fei, Li Xiong-Chao, Wang Meng-Yu. Handwritten digit recognition by three-layer diffractive neural network. Acta Phys. Sin., 2022, 71(18): 184207. doi: 10.7498/aps.71.20220536

三层衍射神经网络实现手写数字识别

徐平, 徐海东, 杨拓, 黄海漩, 张旭琳, 袁霞, 肖钰斐, 李雄超, 王梦禹

Handwritten digit recognition by three-layer diffractive neural network

Xu Ping, Xu Hai-Dong, Yang Tuo, Huang Hai-Xuan, Zhang Xu-Lin, Yuan Xia, Xiao Yu-Fei, Li Xiong-Chao, Wang Meng-Yu
PDF
HTML
导出引用
  • 光学衍射神经网络(optical diffraction neural network, ODNN)以光波作为计算媒介执行神经网络的逻辑分析与运算功能, 具有高速度、低功耗及并行处理的优势. 本文设计了一种仅有三层相位调制的ODNN, 提出了基于目标空间频率一级谱分布提升ODNN的数字识别性能的方法, 经优化获得了系统最优的像素大小、衍射距离, 以及最佳的三层相位分布. 设计的ODNN对MNIST手写体数字集识别准确率达到了95.3%, 高于文献中采用五层衍射神经网络实现的准确率91.75% (Lin X, Rivenson Y, Yardimci N T, Veli M, Luo Y, Jarrahi M, Ozcan A 2018 Science 361 1004), 且精简了系统结构. 结合ODNN高速度、低功耗的优点, 提出的基于频谱分析方法有利于提高ODNN的性能, 使ODNN在边缘计算领域有巨大的应用潜力.
    Optical diffractive neural network (ODNN) uses light wave as a computing medium to perform the inference and prediction function of neural network, which has the advantages of high speed, low power consumption, and parallel processing. In this work, an ODNN with only three layers of phase modulation is designed, and a method to improve the recognition performance of ODNN based on the first-order spectral distribution of targets is proposed. Using this method, the parameters of a three-layer ODNN are effectively optimized and the optimal pixel size, diffraction distance, and method for image preprocessing are obtained. The three-layer ODNN designed in this work has a recognition accuracy rate of 95.3% for MNIST (handwritten digit set), compared with the 91.75% accuracy achieved by the five-layer ODNN in the reference (Lin X, Rivenson Y, Yardimci N T, Veli M, Luo Y, Jarrahi M, Ozcan A 2018 Science 361 1004). In addition, the system volume is greatly reduced and the system structure is simplified. Combined with the advantages of high speed and low power consumption, it has huge potential applications in the fields such as edge computing in the future.
      PACS:
      42.79.Ta(Optical computers, logic elements, interconnects, switches; neural networks)
      42.30.Sy(Pattern recognition)
      42.79.-e(Optical elements, devices, and systems)
      通信作者: 杨拓, yangtuo@szu.edu.cn
    • 基金项目: 国家自然科学基金(批准号: 61275167)、深圳市高等院校稳定支持计划(批准号: 20200812103045003)和深圳市基础研究自由探索项目(批准号: JCYJ20180305125430954, JCYJ20170817102315892, JCYJ2017081701827765)资助的课题.
      Corresponding author: Yang Tuo, yangtuo@szu.edu.cn
    • Funds: Project supported by the National Natural Science Foundation of China (Grant No. 61275167), the Shenzhen Higher Institution Stability Support Plan, China (Grant No. 20200812103045003), and the Basic Research Project of Shenzhen, China (Grant Nos. JCYJ20180305125430954, JCYJ20170817102315892, JCYJ2017081701827765).

    深度学习[1,2]用多层人工神经网络学习数据、提取特征[3-7], 在诸多领域展现的能力已经达到甚至优于人类专家的水平, 然而电子芯片在运算速度上的瓶颈将限制深度学习在海量数据及高速运行环境中的应用. 在减小算力负担和提高处理速度方面, 光计算具有明显优势, 并且具有低功耗、高速度、信息并行处理及抗电磁干扰等优点[8], 近几年一些学者以光作为媒介来加速或完成神经网络的计算, 这方面的研究已经取得很多成果[8-10]. 主要有光子芯片和光衍射神经网络[11], 前者通过光逻辑处理单元来取代晶体管实现光速处理[8], 后者通过光学传播完成逻辑运算[2]. 衍射神经网络以光的衍射传播表示神经网络中各层神经元之间的映射连接, 以光波相位等参量的调制实现网络的权值调整, 通过衍射传播实现网络的运算, 因此可执行特征提取及目标分类等任务[11-13].

    2018年, Lin等[2]首次提出衍射深度神经网络的概念, 在太赫兹波段设计了5层相位调制的衍射神经网络, 每一层像素为200 × 200, 对手写体数字学习的盲测识别率达到了91.75%. 此后, 衍射神经网络的研究得到广泛的关注, Yan等[12]将衍射神经网络以十层网络级联的方式处理, 特别是级联过程中加入光学非线性处理模块后, 获得较好的识别效果. Mengu等[14]对衍射神经网络的损失函数、梯度消失等问题进行优化, 并采用相位和振幅双调制来提升识别性能. Li等[15]提出了差分网络的办法来解决光强非负数的问题, 提出了联合训练的神经网络. Sun等[16]在波长10.6 μm波段下设计了6层调制层的衍射神经网络, 提出以非线性器件作为调制层, 并获得较好识别性能. 以上工作将衍射神经网络的识别能力提高到可以与经典的计算机神经网络LeNet[17]相媲美的水平, 体现出衍射神经网络的巨大潜力. 但上述网络的光学系统相对复杂, 级联层数比较多, 存在物理实现难度较大的问题.

    我们组一直从事光学相关识别方面的研究[18,19], 曾在2018年将神经网络引入光学识别, 针对范德鲁特光学相关器应用神经网络设计了高性能光学滤波器[20,21], 大幅提升了光学相关器对发生畸变的目标的识别能力. 在此研究基础上, 本文针对目前衍射神经网络存在的局限, 在可见光波段构建衍射神经网络模型, 并通过研究目标的空间频率谱在光学衍射神经网络(optical diffraction neural network, ODNN)衍射层之间的变化, 发现了目标空间频率谱中影响ODNN识别性能的关键特征信息. 通过对ODNN的结构参量和各层调制相位进行优化, 最终仅用三层相位调制的衍射结构, 对MNIST手写体数字集的盲测达到95.3%的识别准确率, 在未采用非线性光学器件以及特殊优化算法的情况下, 本研究为目前文献报道的最高识别率. 该工作有利于将ODNN推广到诸多需要对海量数据进行高速检索的边缘计算环境中, 例如文字检索、车牌识别、物料分拣、机器视觉、交通管理、人脸识别门禁、安防报警等应用中[15,16].

    ODNN是在神经网络和光学识别的基础上发展而来. 图1(a)是深度神经网络, 图1(b)是经典的范德鲁特光学相关器光路图[22,23]. 图2是结合深度神经网络和光学识别衍生出的ODNN, 其衍射面的像素单元均是可优化的神经元, 而以光速完成调制处理, 较好地利用了神经网络和光学识别的优势. 在深度学习的网络中, 各层神经元之间的连接一般是全连接或是卷积[5], 而在ODNN中, 各层神经元之间的连接通过光学衍射实现, 即衍射关系决定了映射连接[24]. 两个相位调制层之间的光学衍射是一个特定的卷积关系, 卷积核为点扩散函数, 其关系为

    图 1 (a) 深度神经网络; (b) 经典的范德鲁特光学相关器\r\nFig. 1. (a) Deep neural network; (b) the classic Vander Lugt correlator.
    图 1  (a) 深度神经网络; (b) 经典的范德鲁特光学相关器
    Fig. 1.  (a) Deep neural network; (b) the classic Vander Lugt correlator.
    图 2 三层DOE衍射神经网络 (a) 光路示意图; (b) 程序流程图\r\nFig. 2. Three-layer DOE ODNN: (a) Optical path; (b) program flow chart.
    图 2  三层DOE衍射神经网络 (a) 光路示意图; (b) 程序流程图
    Fig. 2.  Three-layer DOE ODNN: (a) Optical path; (b) program flow chart.
    $$ U\left( {x,y} \right) = {U_0}\left( {{x_0},{y_0}} \right) \otimes h\left( {x,y} \right) \text{, } $$ (1)

    其中, $ \otimes $表示卷积; 卷积核$ h\left( {x, y} \right) $表达式为

    $$ h\left( {x,y} \right) = \frac{1}{{{\text{j}}\lambda D}} \cdot {\exp}\left( {{\text{j}}kD} \right) \cdot \exp \left[ {\frac{{{\text{j}}k}}{{2D}}\left( {{x^2} + {y^2}} \right)} \right] . $$ (2)

    从(1)式和(2)式可知, 在波长已定的情况下对于一个特定的输入$ {U_0}\left( {{x_0}, {y_0}} \right) $, 衍射输出$ U\left( {x, y} \right) $会受到衍射距离D和像素位置$ \left( {{x_0}, {y_0}, x, y} \right) $的影响, 最终影响ODNN对信息的调制能力.

    本文采用神经网络训练, 设计了一种仅有三层相位调制的ODNN, 物理模型如图2(a)所示, 网络模型见图2(b). 衍射光学元件(diffractive optical element, DOE)加载的信息以T表示, T中每个像元的值均可被优化, 光场经过DOE时则受到T的调制, 光场在DOE之间的衍射传播实现了网络映射, 结果输出到接收面上.

    其中, 输入的样本是MNIST手写体训练数据集的5.5万张手写阿拉伯数字灰度图像, 像素数为28 × 28. 在图2中, 以Tn表示3个DOE的调制函数:

    $$ {T_n} = \exp [{\text{j}} \cdot \varPhi _{\left( {x, y} \right)}^n], \;\;n{\text{ = 1, 2, 3}}, $$ (3)

    式中的调制函数采用指数形式表示, 由于DOE是相位调制元件, 所以只含相位角的函数$\varPhi _{\left( {x, y} \right)}^n$为第n个DOE上x, y坐标处的相位调制信息. 以Z 0表示输入图像, 光场通过Z 0后, 可通过(1)式—(3)式推演得到A2, Z 2, A3, Z 3, A4. A4即是到达接收面的光场分布:

    $$ \begin{split} {A^4} =\;&\Big( \Big( \left( \left( \left( {\left( {{Z^0} \otimes {h^{D_1}}} \right) \cdot {T^1}} \right)\otimes {h^{D_2}} \right) \cdot {T^2} \right) \\ & \otimes {h^{D_3}} \Big) \cdot {T^3} \Big) \otimes {h^{D_4}} \text{, } \end{split} $$ (4)

    初始的Tn是随机分布的, 在准直光源的照射下, 光场经历了(4)式的ODNN调制后, 最终以A4描述的光场分布投影到接收面. 本文在接收域内分了10个区, 分别对应数字0, 1, 2, ···, 9. 图3给出了接收域的编码.

    图 3 接收面的区域划分及演示说明 (a) 10个阿拉伯数字所在的区域划分; (b) 当输入图像为数字8, 代表数字8的区域所在的能量最大\r\nFig. 3. Area division and demonstration description of the receiving surface: (a) Area division of the 10 Arabic numerals are located; (b) when the input image is the digit 8, the area representing the digit 8 has the maximum energy.
    图 3  接收面的区域划分及演示说明 (a) 10个阿拉伯数字所在的区域划分; (b) 当输入图像为数字8, 代表数字8的区域所在的能量最大
    Fig. 3.  Area division and demonstration description of the receiving surface: (a) Area division of the 10 Arabic numerals are located; (b) when the input image is the digit 8, the area representing the digit 8 has the maximum energy.

    ODNN的期望结果是任意一张MNIST图像作为输入源, 经过ODNN后接收面上的光场能量会集中在该图像所对应的编码位置上. 如图3(b)所示, 当输入数字8时, 接收面对应数字8位置处的能量最强. 接收面的光能分布和理想分布会存在偏差, 计算接收面光场分布与理想分布之间的均方差[2], 就是误差函数L:

    $$ L = \frac{1}{K}\sum\nolimits_i^K {{{\left( {{S_i} - {G_i}} \right)}^2}} . $$ (5)

    这里, Gi表示接收面上第i个像元上的期望能量值, Si是由仿真得到接收面第i个像元上的能量值, K表示接收面光场分布上的像素点的数量. 在训练中像元值可被优化, 而光学系统的一些超参数[25], 例如波长、像元间距、衍射距离等参数需要人为设定, 且超参数的值对训练结果影响巨大. 本文主要研究这类超参数对数字识别网络性能的影响. 图像识别就是对物体特征的匹配度进行判断, 而在频谱空间研究特征匹配会更有效率. 对于数字识别来说, 数字识别的关键特征是数字的基本形状规律, 本研究将其归为低频信息; 而手写的差异, 包括笔画习惯等细节上, 将其归为高频信息. 手写数字识别的目的是数字区分, 训练时应当忽略手写的差异, 而重点关注低频信息. 因此, 本文提出基于手写数字的低频信息设计ODNN, 使ODNN成为一个低通滤波器, 低频信息可以在ODNN内传导, 高频信息在传导过程中被舍去.

    数字形状特征的最高频率是两倍笔画宽度对应的频率, 如图4中的数字1, 其频谱图样中水平方向上有最宽的一级衍射斑, 而根据角谱理论, 笔画宽度的频率和该衍射斑的边缘位置相对应. 因此, 本文以笔画宽度的一级谱频谱带宽为低通滤波的截止带宽, 数字形状的特征信息均在该低通部分内.

    图 4 手写数字及对应的频谱幅度图\r\nFig. 4. Handwritten digits and the corresponding spectral map.
    图 4  手写数字及对应的频谱幅度图
    Fig. 4.  Handwritten digits and the corresponding spectral map.

    依据这一思路设计ODNN, 使衍射层的像素仅针对有价值的特征信息进行调制, 提高调制效率以减少网络层数. 较易理解的情况是, 当层与层之间的距离属于弗朗禾费衍射区时, 输出面上得到的是输入面的频谱花样, 并且中心是低频信息, 边缘是高频信息, 此时很轻易地通过输出面的尺寸来设定截止频率. 虽然相比参考文献[2, 14, 15]将网络设计在瑞利-索末菲衍射区, 夫朗禾费衍射区的传输距离更大, 但是由于在这个传输距离下, 衍射面的宽度和传输距离的比例一般在1∶10以上, 使得光学系统容易转换成折返式光路的系统, 最终这样的设计将有利于进一步的压缩空间以及提高光学器件的集成化, 特别是三个衍射层在同一个平面上加工, 将有利于提高加工效率以及减小装配方面的负担. 基于本课题在平面集成化的光学识别器方面的研究成果[18,19], 后续可将把平面光学设计和ODNN结合起来, 本文不作详细介绍.

    在已定波长、像元尺寸的情况下, 像素数、衍射距离这两个因素可以将接收面的信息限制在一级衍射斑内, 后文研究这两个因素对ODNN识别准确率的影响, 分析了采用一级谱作为手写数字识别的有效性. 本文均在波长为632.8 nm, 像元间距为8 μm的情况下对ODNN进行研究.

    一般来说, 神经网络的层数越多, 则神经元越多, 识别能力越强. 但是, 对于ODNN, 增加层数会导致物理模型的复杂化, 对准误差、形变误差、透过率、衍射级次串扰等因素的影响也会增大, 使实际效果变差[2], 而通过增加每层像素数的方式可体现出光学并行处理的优势. 增加像素数可以增加图像的特征信息, 从频域分析可直观地观察这一改善. 以图5为例, 原图像像素为28 × 28的样本数字8, 通过离散傅里叶变换得到的频谱图也是28 × 28, 有较明显的锯齿状且谱图模糊. 当对原图像的四周补0使图像扩展成64 × 64时, 对应频谱图的截止频率不变但分辨率提高, 数字8的特征信息更加明显.

    图 5 不同像素大小的图像和频谱幅度谱\r\nFig. 5. Image and amplitude spectrum of different pixel sizes.
    图 5  不同像素大小的图像和频谱幅度谱
    Fig. 5.  Image and amplitude spectrum of different pixel sizes.

    逐渐增加DOE的像素数大小, 并分别训练得到像素数为28 × 28, 32 × 32, 64 × 64, 128 × 128以及256 × 256时ODNN的识别率. 如图6所示, 将像素数从28 × 28提高到128 × 128时, 识别率显著提高, 说明频谱图分辨率提高对识别率有贡献. 而从128 × 128到256 × 256时, 识别率略微下降, 说明128 × 128时频谱图的数字特征已经足够呈现, 进一步扩展像素已经没有太多提升, 但是在有限的训练周期下, 128 × 128系统的优化速度更快, 并且网络体积更小. 因此, 在识别率、训练速度和体积的综合考虑上, ODNN的衍射层选择128 × 128的像素大小较为合适.

    图 6 ODNN的系统分辨率对识别率的影响\r\nFig. 6. Impact of ODNN’s resolution on recognition rate.
    图 6  ODNN的系统分辨率对识别率的影响
    Fig. 6.  Impact of ODNN’s resolution on recognition rate.

    传输距离D对层与层之间映射关系的影响同样很显著. 如图7所示, 当D远大于图像尺寸, 且图像尺寸为1.024 mm × 1.024 mm时, 在29 mm处得到的光强分布已经可近似为夫朗禾费衍射[24]. 而进一步加大D时, 输出面仍呈现为夫朗禾费衍射衍射花样, 但图像比例随D的增加而变大, 使高频部分溢出屏外, 即高频部分在接收面被截止.

    图 7 衍射距离D对信息传递的影响\r\nFig. 7. Effect of diffraction distance on information transmission.
    图 7  衍射距离D对信息传递的影响
    Fig. 7.  Effect of diffraction distance on information transmission.

    D设置成不同的大小, 并分别对ODNN进行训练, 通过训练得到系统分别在D = 29, 32, 35, 38, 41, 44, 47, 50 mm时的识别率. 从图8可看出, D = 41 mm时系统的识别率最高, 结合图7可知, 此时图像在接收面的衍射花样保留了一级频谱内的信息, 高频信息已溢出屏外. 因此, 从频域分析的角度出发, 针对数字识别的有效频率成分设计ODNN的光学距离, 使得在有限的像素数和网络层数的前提下, 可得到衍射网络的最佳的衍射距离.

    图 8 衍射距离D对ODNN识别率的影响\r\nFig. 8. Influence of diffraction distance D on the recognition rate of ODNN.
    图 8  衍射距离D对ODNN识别率的影响
    Fig. 8.  Influence of diffraction distance D on the recognition rate of ODNN.

    对比文献[2], 本文采用MNIST的训练样本对所提出的三层调制层、分辨率为128 × 128的ODNN训练50个周期, 并用测试样本做盲测仿真, 结果如图9所示, 盲测的识别准确率达到了95.3%. 在相同的算法下, 文献[2]采用五层中间层、分辨率为200 × 200的设计, 其识别准确率仅为91.75%. 此外, 本文采用632.8 nm的波段, 使像元间距从400 μm缩小到8 μm, 结合衍射层数和像素数的减少, 最终将光网络的尺寸从文献[2]的80 mm × 80 mm × 120 mm减小到1.024 mm × 1.024 mm × 164 mm, 极大地压缩了系统的体积. 后续采用折反式平面光学设计, 不仅能将空间尺寸进一步压缩, 还可以将衍射层集成在一个面上有助于加工和装配.

    图 9 三层ODNN的训练结果\r\nFig. 9. Training results of three-layer ODNN.
    图 9  三层ODNN的训练结果
    Fig. 9.  Training results of three-layer ODNN.

    使用测试数据集在MATLAB上检验训练的结果, 当输入图像为图10(a)所示的数字8时, 经历ODNN后在接收面上输出的能量分布如图10(b)所示, 数字8位置处的能量光斑最大. 考虑后续加工DOE将进行台阶量化处理, 本文进一步分析了台阶量化后对识别结果的影响, 如图10(c)所示, 8台阶量化后, 数字8的识别结果仍较为明显. 图10(d)分别表示台阶量化前和量化后的三个DOE.

    图 10 ODNN的 (a) 输入和 (b) 输出图例; (c) DOE量化后的仿真结果; (d) 量化前及量化后的DOE\r\nFig. 10. Input (a) and output (b) pattern examples of ODNN; (c) simulation result when the DOEs are quantified; (d) DOEs and quantified DOEs.
    图 10  ODNN的 (a) 输入和 (b) 输出图例; (c) DOE量化后的仿真结果; (d) 量化前及量化后的DOE
    Fig. 10.  Input (a) and output (b) pattern examples of ODNN; (c) simulation result when the DOEs are quantified; (d) DOEs and quantified DOEs.

    为了实现高性能的手写数字识别, 本文提出了三层相位调制层的ODNN, 从频域分析的角度出发, 建立了依据数字样本集的空间频率一级谱特征设计ODNN的方法. 依据此方法优化了光学系统参数, 包括相位分布、像素大小、衍射距离, 保证了光网络在传播及调制过程中充分利用一级谱信息. 最终本文设计了工作波长为632.8 nm, 仅有三层相位调制的ODNN, 其分辨率为128 × 128, 像元间距为8 μm, 层间距为41 mm. 仿真表明识别准确率达到95.3%, 高于文献[2]采用五层衍射神经网络的91.75%, 且设计的ODNN光学部分体积仅为1.024 mm × 1.024 mm × 164 mm, 远小于文献[2]报道的体积. 本文提出的方法提升了ODNN的数字识别性能, 减少了网络层数, 有效精简了系统结构, 结合ODNN低功耗、高速率的优点, 有助于产业化应用. 后续将进一步采用频谱特征分析方法对更加复杂的识别任务进行研究, 使ODNN在文字检索、车牌识别、物料分拣、机器视觉、交通管理、人脸识别、门禁、安防报警等应用场景中发挥更多的应用价值.

    [1]

    Yann L C, Yoshua B, Geoffrey H 2015 Nature 521 436Google Scholar

    [2]

    Lin X, Rivenson Y, Yardimci N T, Veli M, Luo Y, Jarrahi M, Ozcan A 2018 Science 361 1004Google Scholar

    [3]

    Litjens G, Kooi T, Bejnordi B E, Setio A A A, Ciompi F, Ghafoorian M, van der Laak J A W M, van Ginneken B, S´anchez C 2017 Medical Image Analysis 42 60Google Scholar

    [4]

    Graves A, Mohamed A, Hinton G 2013 IEEE International Conference on Acoustics 2013 6645Google Scholar

    [5]

    Krizhevsky A, Sutskever I, Hinton G E 2012 In Advances in NIPS 25 1097Google Scholar

    [6]

    Cho K, Van Merrienboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, Bengio Y 2014 arXiv: 1406.1078[cs. CL]

    [7]

    Silver D, Huang A, Maddison C J, et al. 2016 Nature 529 484Google Scholar

    [8]

    Shen Y, Harris N C, Skirlo S, et al. 2017 Nat. Photonics 11 441Google Scholar

    [9]

    Solli D R, Jalali B 2015 Nat. Photonics 9 704Google Scholar

    [10]

    Psaltis D, Brady D, Gu X G, Lin S 1990 Nature 343 325Google Scholar

    [11]

    Chang J, Sitzmann V, Dun X, Heidrich W, Wetzstein G 2018 Sci. Rep. 8 123234

    [12]

    Yan T, Wu J, Zhou T, Xie H, Xu F, Fan J, Fang L, Lin X, Dai Q 2019 Phys. Rev. Lett. 123 023901Google Scholar

    [13]

    Zhou T, Fang L, Yan T, Wu J, Li Y, Fan J, Wu H, Lin X, Dai Q 2020 Photonics Research 8 940Google Scholar

    [14]

    Mengu D, Luo Y, Rivenson Y, Ozcan A 2020 IEEE J. Sel. Top. Quant. 26 3700114Google Scholar

    [15]

    Li J, Mengu D, Luo Y, Riven Y, Ozcan A 2019 Advanced Photonics 1 046001

    [16]

    Sun Y, Dong M, Yu M, Xia J, Zhang X, Bai Y, Lu L, Zhu L 2021 International J. Optics 2021 6667495

    [17]

    Lécun Y, Bottou L, Bengio Y, Haffner P 1998 Proceedings of the IEEE 86 2278Google Scholar

    [18]

    Xu P, Hong C, Cheng G, Zhou L, Sun Z 2015 Optics Express 23 6773Google Scholar

    [19]

    徐海东, 徐平, 亓森林, 梁钱, 张旭琳, 黄洁锋, 黄海漩 2010 光学学报 30 1002Google Scholar

    Xu H D, Xu P, Qi S L, Liang Q, Zhang X L, Huang J F, Huang H X 2010 Acta Opt. Sin. 30 1002Google Scholar

    [20]

    Yang T, Chen M, Xiao Y, Xu H, Xu P 2020 IEEE Photonics J. 12 7800310Google Scholar

    [21]

    Xu P, Yang T, Kai L, Li X, Long S, Huang H 2018 IEEE Photonics J. 10 7801210Google Scholar

    [22]

    Ouabida E, Essadique A, Bouzid A 2017 Expert Systems with Applications 71 383Google Scholar

    [23]

    胡文刚, 王永仲, 华文深 2006 光学技术 32 179Google Scholar

    Hu W G, Wang Y Z, Hua W S 2006 Optical Technique 32 179Google Scholar

    [24]

    苏显渝, 吕乃光, 陈家璧 2010 信息光学原理 (第一版) (北京: 电子工业出版社) 第34—40页

    Su X Y, Lü N G, Chen J B 2010 Principles of Information Optics (Vol. 1) (Beijing: Publishing House of Electronics Industry) pp34–40 (in Chinese)

    [25]

    Zhang Y, Wallace B 2015 arXiv: 1510.03820 [cs. CL]

    期刊类型引用(1)

    1. 王子荣,张星祥,龙勇机,付天骄,张墨. 多任务衍射神经网络系统设计与实现. 液晶与显示. 2024(04): 490-505 . 百度学术

    其他类型引用(1)

  • 图 1  (a) 深度神经网络; (b) 经典的范德鲁特光学相关器

    Fig. 1.  (a) Deep neural network; (b) the classic Vander Lugt correlator.

    图 2  三层DOE衍射神经网络 (a) 光路示意图; (b) 程序流程图

    Fig. 2.  Three-layer DOE ODNN: (a) Optical path; (b) program flow chart.

    图 3  接收面的区域划分及演示说明 (a) 10个阿拉伯数字所在的区域划分; (b) 当输入图像为数字8, 代表数字8的区域所在的能量最大

    Fig. 3.  Area division and demonstration description of the receiving surface: (a) Area division of the 10 Arabic numerals are located; (b) when the input image is the digit 8, the area representing the digit 8 has the maximum energy.

    图 4  手写数字及对应的频谱幅度图

    Fig. 4.  Handwritten digits and the corresponding spectral map.

    图 5  不同像素大小的图像和频谱幅度谱

    Fig. 5.  Image and amplitude spectrum of different pixel sizes.

    图 6  ODNN的系统分辨率对识别率的影响

    Fig. 6.  Impact of ODNN’s resolution on recognition rate.

    图 7  衍射距离D对信息传递的影响

    Fig. 7.  Effect of diffraction distance on information transmission.

    图 8  衍射距离D对ODNN识别率的影响

    Fig. 8.  Influence of diffraction distance D on the recognition rate of ODNN.

    图 9  三层ODNN的训练结果

    Fig. 9.  Training results of three-layer ODNN.

    图 10  ODNN的 (a) 输入和 (b) 输出图例; (c) DOE量化后的仿真结果; (d) 量化前及量化后的DOE

    Fig. 10.  Input (a) and output (b) pattern examples of ODNN; (c) simulation result when the DOEs are quantified; (d) DOEs and quantified DOEs.

  • [1]

    Yann L C, Yoshua B, Geoffrey H 2015 Nature 521 436Google Scholar

    [2]

    Lin X, Rivenson Y, Yardimci N T, Veli M, Luo Y, Jarrahi M, Ozcan A 2018 Science 361 1004Google Scholar

    [3]

    Litjens G, Kooi T, Bejnordi B E, Setio A A A, Ciompi F, Ghafoorian M, van der Laak J A W M, van Ginneken B, S´anchez C 2017 Medical Image Analysis 42 60Google Scholar

    [4]

    Graves A, Mohamed A, Hinton G 2013 IEEE International Conference on Acoustics 2013 6645Google Scholar

    [5]

    Krizhevsky A, Sutskever I, Hinton G E 2012 In Advances in NIPS 25 1097Google Scholar

    [6]

    Cho K, Van Merrienboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, Bengio Y 2014 arXiv: 1406.1078[cs. CL]

    [7]

    Silver D, Huang A, Maddison C J, et al. 2016 Nature 529 484Google Scholar

    [8]

    Shen Y, Harris N C, Skirlo S, et al. 2017 Nat. Photonics 11 441Google Scholar

    [9]

    Solli D R, Jalali B 2015 Nat. Photonics 9 704Google Scholar

    [10]

    Psaltis D, Brady D, Gu X G, Lin S 1990 Nature 343 325Google Scholar

    [11]

    Chang J, Sitzmann V, Dun X, Heidrich W, Wetzstein G 2018 Sci. Rep. 8 123234

    [12]

    Yan T, Wu J, Zhou T, Xie H, Xu F, Fan J, Fang L, Lin X, Dai Q 2019 Phys. Rev. Lett. 123 023901Google Scholar

    [13]

    Zhou T, Fang L, Yan T, Wu J, Li Y, Fan J, Wu H, Lin X, Dai Q 2020 Photonics Research 8 940Google Scholar

    [14]

    Mengu D, Luo Y, Rivenson Y, Ozcan A 2020 IEEE J. Sel. Top. Quant. 26 3700114Google Scholar

    [15]

    Li J, Mengu D, Luo Y, Riven Y, Ozcan A 2019 Advanced Photonics 1 046001

    [16]

    Sun Y, Dong M, Yu M, Xia J, Zhang X, Bai Y, Lu L, Zhu L 2021 International J. Optics 2021 6667495

    [17]

    Lécun Y, Bottou L, Bengio Y, Haffner P 1998 Proceedings of the IEEE 86 2278Google Scholar

    [18]

    Xu P, Hong C, Cheng G, Zhou L, Sun Z 2015 Optics Express 23 6773Google Scholar

    [19]

    徐海东, 徐平, 亓森林, 梁钱, 张旭琳, 黄洁锋, 黄海漩 2010 光学学报 30 1002Google Scholar

    Xu H D, Xu P, Qi S L, Liang Q, Zhang X L, Huang J F, Huang H X 2010 Acta Opt. Sin. 30 1002Google Scholar

    [20]

    Yang T, Chen M, Xiao Y, Xu H, Xu P 2020 IEEE Photonics J. 12 7800310Google Scholar

    [21]

    Xu P, Yang T, Kai L, Li X, Long S, Huang H 2018 IEEE Photonics J. 10 7801210Google Scholar

    [22]

    Ouabida E, Essadique A, Bouzid A 2017 Expert Systems with Applications 71 383Google Scholar

    [23]

    胡文刚, 王永仲, 华文深 2006 光学技术 32 179Google Scholar

    Hu W G, Wang Y Z, Hua W S 2006 Optical Technique 32 179Google Scholar

    [24]

    苏显渝, 吕乃光, 陈家璧 2010 信息光学原理 (第一版) (北京: 电子工业出版社) 第34—40页

    Su X Y, Lü N G, Chen J B 2010 Principles of Information Optics (Vol. 1) (Beijing: Publishing House of Electronics Industry) pp34–40 (in Chinese)

    [25]

    Zhang Y, Wallace B 2015 arXiv: 1510.03820 [cs. CL]

  • [1] 李昀衡, 喻可, 朱天宇, 于桐, 单思超, 谷亚舟, 李志曈. 拓扑层结构中的光学双稳态及其在光神经网络中的应用. 物理学报, 2024, 73(16): 164208. doi: 10.7498/aps.73.20240569
    [2] 李子杨, 杨霄, 刘华松, 姜玉刚, 白金林, 李士达, 杨仕琪, 苏建忠. 低光学衍射随机六元环金属网络导电膜. 物理学报, 2022, 71(13): 134202. doi: 10.7498/aps.71.20212010
    [3] 李靖, 孙昊. 识别Z玻色子喷注的卷积神经网络方法. 物理学报, 2021, 70(6): 061301. doi: 10.7498/aps.70.20201557
    [4] 朱一帆, 耿滔. 谐振腔内的高质量圆对称艾里光束的产生方法. 物理学报, 2020, 69(1): 014205. doi: 10.7498/aps.69.20191088
    [5] 孙立望, 李洪, 汪鹏君, 高和蓓, 罗孟波. 利用神经网络识别高分子链在表面的吸附相变. 物理学报, 2019, 68(20): 200701. doi: 10.7498/aps.68.20190643
    [6] 谢静, 张军勇, 岳阳, 张艳丽. 卢卡斯光子筛的聚焦特性研究. 物理学报, 2018, 67(10): 104201. doi: 10.7498/aps.67.20172260
    [7] 王磊, 窦健泰, 马骏, 袁操今, 高志山, 魏聪, 张天宇. 基于叠层衍射成像的二元光学元件检测研究. 物理学报, 2017, 66(9): 094201. doi: 10.7498/aps.66.094201
    [8] 于斌, 李恒, 陈丹妮, 牛憨笨. 用于大景深三维纳米分辨多分子追踪的衍射光学元件的设计制备和实验研究. 物理学报, 2013, 62(15): 154206. doi: 10.7498/aps.62.154206
    [9] 张宝武, 支理想, 张文涛. 基于直边衍射高斯激光驻波光学势阱仿真. 物理学报, 2012, 61(18): 183201. doi: 10.7498/aps.61.183201
    [10] 邬融, 华能, 张晓波, 曹国威, 赵东峰, 周申蕾. 高能量效率的大口径多台阶衍射光学元件. 物理学报, 2012, 61(22): 224202. doi: 10.7498/aps.61.224202
    [11] 辛璟焘, 高春清, 李辰, 王铮. 螺旋光束经过振幅型衍射光学元件的传输特性及其拓扑电荷数的测量. 物理学报, 2012, 61(17): 174202. doi: 10.7498/aps.61.174202
    [12] 邓玉强, 孙青, 于靖. 光学元件群延迟的直接测量. 物理学报, 2011, 60(2): 028102. doi: 10.7498/aps.60.028102
    [13] 武浩, 朱拓, 孔艳, 陈卫, 杨建磊. 基于径向基函数神经网络的荧光光谱技术在菌种识别中的应用. 物理学报, 2010, 59(4): 2396-2400. doi: 10.7498/aps.59.2396
    [14] 孙金霞, 孙 强, 李东熙, 卢振武. 利用衍射光学元件进行共形整流罩像差校正的研究. 物理学报, 2007, 56(7): 3900-3905. doi: 10.7498/aps.56.3900
    [15] 张艳丽, 赵逸琼, 詹其文, 李永平. 高数值孔径聚焦三维光链的研究. 物理学报, 2006, 55(3): 1253-1258. doi: 10.7498/aps.55.1253
    [16] 陆璇辉, 黄凯凯. 衍射光学元件改善激光谐振腔输出特性的研究. 物理学报, 2001, 50(8): 1409-1414. doi: 10.7498/aps.50.1409
    [17] 常胜江, 刘, 张文伟, 申金媛, 翟宏琛, 张延. 适用于神经元状态非等概率分布的神经网络模型及其光学实现. 物理学报, 1998, 47(7): 1101-1109. doi: 10.7498/aps.47.1101
    [18] 姬扬, 张静娟, 姚德成, 陈岩松. 用于半导体激光器光束整形的衍射光学元件的设计研究. 物理学报, 1996, 45(12): 2027-2034. doi: 10.7498/aps.45.2027
    [19] 朱传贵, 薛鸣球, 刘德森, 高应俊. 光学元件阵列的衍射理论分析. 物理学报, 1993, 42(3): 394-399. doi: 10.7498/aps.42.394
    [20] 洪熙春, 黄维刚, 王绍民. 失调光学系统的衍射积分公式. 物理学报, 1982, 31(12): 75-83. doi: 10.7498/aps.31.75
  • 期刊类型引用(1)

    1. 王子荣,张星祥,龙勇机,付天骄,张墨. 多任务衍射神经网络系统设计与实现. 液晶与显示. 2024(04): 490-505 . 百度学术

    其他类型引用(1)

计量
  • 文章访问数:  6390
  • PDF下载量:  263
  • 被引次数: 2
出版历程
  • 收稿日期:  2022-03-24
  • 修回日期:  2022-05-23
  • 上网日期:  2022-09-05
  • 刊出日期:  2022-09-20

/

返回文章
返回