搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于物理信息神经网络的光斑质心计算

方波浪 王建国 冯国斌

引用本文:
Citation:

基于物理信息神经网络的光斑质心计算

方波浪, 王建国, 冯国斌

Calculation of spot entroid based on physical informed neural networks

Fang Bo-Lang, Wang Jian-Guo, Feng Guo-Bin
PDF
HTML
导出引用
计量
  • 文章访问数:  411
  • PDF下载量:  27
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-04-11
  • 修回日期:  2022-06-12
  • 上网日期:  2022-10-10
  • 刊出日期:  2022-10-20

基于物理信息神经网络的光斑质心计算

    基金项目: 激光与物质相互作用国家重点实验室专项基金(批准号: SKLLIM1909) 资助的课题.

摘要: 为了实现强噪声干扰下的远场光斑质心高精度计算, 研究了一种基于物理信息神经网络的质心定位方法—质心物理信息神经网络(centroid-PINN), 该方法利用U-Net神经网络优化质心计算误差损失. 为了验证该方法, 利用模拟产生不同强度的两种类型噪声(斜坡噪声和白噪声)干扰下的高斯光斑训练网络. 通过两种类型的光斑(高斯光斑和类Sinc函数光斑)测试神经网络, 均得到了较高的质心定位精度. 相比传统质心定位计算方法, centroid-PINN无需根据噪声水平设置参数, 特别是能够处理斜坡噪声的干扰, 获得高精度定位结果. 成果可用于高性能激光光斑质心参数测量设备的研制, 对于夏克-哈特曼波前测量装置的研制也有一定的借鉴意义.

English Abstract

    • 光斑质心计算在激光参数测量、自适应光学、光通信等领域具有重要的应用[1-4]. 例如, 在激光远场光斑测量中, 需要根据远场光斑分布获得光斑质心, 评价激光指向稳定性. 同时, 质心是计算光斑其他特征参数(环围半径、光斑尺寸等)的基础; 在自适应光学中, 夏克-哈特曼技术是一种常用的波前测量技术. 在该技术中, 子孔径光斑的质心高精度探测是关键的环节之一.

      干扰对于光斑质心计算精度有显著的影响[5-11]. 光斑质心采用重心法(center of gravity, CoG)计算, 计算准确性受噪声、背景照明、光斑调制、离散采样、截断误差等因素影响. 在远场光斑测量中, 广泛存在多种类型的噪声, 并且有的噪声随信号产生, 难以通过实验手段完全消除. 在ISO-11146中, 为了降低边缘噪声的影响, 规定采用加窗质心计算方法. 同时, 针对不同类型的噪声给出了相应的消除方法. 常用的光斑质心计算方法还包括: 阈值法(threshold center of gravity, TCoG)、加权法(windowing center of gravity, WCoG)、迭代加权重心算法(iteratively windowing center of gravity, IWCoG)、强度加权算法(intensity weighted centroiding, IWC)、拟合法、模板滤波法(matched filter, MF)、相关法(correlation, Cor)等[8,12-18]. 还有许多预处理方法, 如空间卷积波法、频域滤波法、流式质心算法(stream center of gravity, SCoG)、高斯噪声估计等[11,17,19], 期望去除噪声的影响. 然而, 这些方法大多需要根据待测目标进行参数调整, 计算精度与所采用的参数相关, 对于使用者的经验要求较高.

      人工神经网络有望解决光斑质心高精度计算难题. 近年来, 人工智能得到了飞速发展, 解决了许多难题, 如图像识别、语音识别、语义分析、翻译、医学诊断等, 受到了广泛关注, 具有巨大的研究应用潜力[20]. 在质心计算/自适应光学中也取得了许多进展. 例如, Montera等[21,22]利用全连接神经网络, 将光斑直接映射至质心, 对于拉长畸变的光斑, 获得了较高的计算精度; Li等[23]给出了SHWFS-neural network (SHNN)网络, 将质心计算转化为分类问题, 在信噪比很低的情况下, 获得了准确度很高的结果. 全连接神经网络方法属于回归问题, 训练较难收敛. 所以, 采用了较小的神经网络. 而较小的网络表达能力有限, 因此对于不同朝向的变形光斑需要训练不同的神经网络. SHNN将质心计算转变为分类问题, 有效解决了极端噪声的干扰. 但该方法的计算精度最高不超过单像素. 综合考虑, 这些方法对质心计算的物理约束利用较少. 针对物理问题, Raissi等[24]提出了物理信息神经网络(physics informed neural network, PINN), 该论文目前已被引用超过2000次. PINN的主要思想为采用神经网络优化控制方程的残差, 使得神经网络在可解释性方面迈出了一大步, 解决了许多物理问题.

      因此, 借鉴PINN的思想, 给出了一种用于光斑质心计算的PINN网络, 称为质心物理信息神经网络(centroid-PINN). centroid-PINN利用损失函数将质心物理约束引入神经网络, 通过优化网络参数降低原始光斑与预测光斑的质心误差, 实现强噪声干扰下的光斑质心高精度预测. 本文将质心计算物理过程引入神经网络, 实现了强噪声下的畸变光斑的质心高精度智能预测. 本文算法采用Python实现, 神经网络基于Tensorflow框架. 为了便于复现本文计算结果, 文中所采用的程序将在论文录用后在网络上公开.

    • 实际光斑强度${I_{{\text{raw}}}}$为无噪声光斑强度${I_{\text{o}}}$与噪声强度n的叠加, 表示为

      $ {I_{{\text{raw}}}} = {I_{\text{o}}} + n. $

      基于深度学习的质心计算问题可以被表述为利用神经网络对含噪声光斑Iraw进行处理, 得到光斑$\hat I$, 使得利用$\hat I$${I_{\text{o}}}$计算得到相同的质心.

      神经网络对光斑的预处理过程可以表示为

      $ \hat I = \mathcal{F}\left( {{I_{{\text{raw}}}};\Theta } \right), $

      其中Θ为网络参数. 网络训练的目标是获得质心计算误差最小的网络参数, 即

      $ {\varTheta ^*} = \arg \mathop {\min }\limits_\varTheta \frac{1}{N}\sum\limits_{i = 1}^N {\mathcal{L}\left( {{f_{\text{c}}}\left( {\mathcal{F}\left( {{I_{{\text{raw}}}};\varTheta } \right)} \right),{f_{\text{c}}}\left( {{I_{\text{o}}}} \right)} \right)} , $

      其中, fc为光斑质心计算函数. 质心采用一阶矩定义计算:

      $ {{\boldsymbol{x}}_{\text{c}}} = {f_{\text{c}}}\left( I \right) \equiv \frac{{\displaystyle\sum {{{\boldsymbol{x}}_i}{I_i}} }}{{\displaystyle\sum {{I_i}} + \varepsilon }}, $

      其中, x表示坐标, 包括横纵坐标(x, y), 对应质心的水平竖直位置; I为光强; i表示坐标索引; ε为数值小量, 取10–15. 考虑到I可能出现全零情况, 因此实际计算时需要向分母中增加一个小量. $\mathcal{L}\left( { \cdot , \cdot } \right)$表示损失函数. 考虑到质心距离符合欧拉距离表征, 采用2范数作为损失函数, 表示为

      $ \mathcal{L} = {\left\| {{x_{\text{o}}} - {x_{\text{p}}}} \right\|_2} + {\left\| {{y_{\text{o}}} - {y_{\text{p}}}} \right\|_2}, $

      式中, 下标p表示经神经网络处理后的光斑计算得到的质心, 下标o表示无噪声光斑的质心.

      相比于SHNN, centroid-PINN在使用网络方面具有很高的自由度. 可用神经网络有很多种, 例如全连接网络、深度卷积神经网络、U-Net等. U-Net为全卷积网络, 被广泛用于图像区域划分、降噪、识别等领域[25]. 质心计算的困难主要来源于噪声干扰. 所以, 本文采用U-Net对噪声光斑进行预处理. 如图1所示, 网络的主体采用U-Net网络, 将无噪声原始光斑施加噪声后再采用神经网络处理得到预测光斑, 分别利用无噪声光斑和预测光斑计算质心, 将二者的质心间横纵坐标距离作为损失函数, 利用反向传播算法优化网络参数. U-Net为包括压缩路径和扩展路径的对称U形结构. 压缩路径用于编码, 扩展路径用于简码. 本文采用的U-Net网络包含2个编码/解码层、1个瓶颈层以及同一级的编码层和解码层之间的连接. 编码层包含2个卷积层和1个最大池化层. 卷积层用于特征提取, 卷积核的尺寸为3×3. 最大池化层用于降采样. 每经过一次降采样, 特征图尺寸减小为原来的一半. 为了减少信息损失, 每个模块较上个模块的特征向量长度增大1倍, 依次为16, 32, 64. 解码层包含1个上采样层和2个卷积层. 解码层中, 前一层特征图上采样与同层的压缩层的特征向量拼接后组成卷积层的输入. 通过卷积层完成特征向量长度的缩短及尺寸的加倍, 从而实现图像的匀化和主要信息提取. 最终需要光斑灰度图像计算质心, 因此网络的输出特征向量长度为1.

      图  1  网络结构

      Figure 1.  Network architecture.

      采用模拟方式产生训练及测试用的光斑图像. 经大气传输的远场长时间平均光斑符合高斯分布, 因此采用

      $ I = \exp \left[ { - \frac{{{{\left( {x - {x_0}} \right)}^2}}}{{2\sigma _x^2}}} \right]\exp \left[ { - \frac{{{{\left( {y - {y_0}} \right)}^2}}}{{2\sigma _y^2}}} \right] $

      生成光斑. 其中, x0y0分别为质心横纵坐标, ${\sigma _x}$${\sigma _y}$表示高斯函数水平竖直方向的标准差. 由于每经一次降采样, 特征尺寸减半, 所以U-Net的网络输入尺寸需根据瓶颈层的特征尺寸及降采样次数计算. 本文选用的输入尺寸为256×256. 为了便于设置参数, 考虑到通常要求远场光斑测量区域为光斑直径的3倍, 因此, 图像的长宽坐标范围设置为–3—3. 利用随机数修改光斑参数产生不同形貌的光斑. 其中${x_0}, {y_0} \in \left[ { - 2, 2} \right]$表示光斑的质心位置在–2—2之间变化, ${\sigma _x}, {\sigma _y} \in \left[ {0.4, 0.8} \right]$用于调整高斯光斑的直径. 共生成10000张高斯光斑图片, 随机选取其中的80%作为训练数据, 20%作为测试数据.

      在输入网络前对光斑进行预处理. 第一步: 由于质心计算仅利用光强相对强度, 以及神经网络的激活函数输出范围为–1—1, 所以将光斑强度归一化至0—1. 第二步: 为了模拟实际光斑, 向原始光斑图像中实时添加噪声形成网络输入. 典型的噪声类型包括白噪声、斜坡噪声、横向及纵向高斯噪声等[17]. 针对经长距离传输的远场光斑, 横向及纵向高斯噪声较为少见, 因此仅考虑前两种类型噪声干扰. 白噪声的标准差范围为0—0.3, 模拟最大30%的噪声干扰. 斜坡噪声的最大强度范围为0—1, 斜率范围为–0.5—0.5. 第3步: 再次将光斑强度归一化至0—1之间.

      在得到预测光斑后, 利用(4)式分别计算预测的光斑和无噪声光斑的质心, 再使用(5)式计算损失函数. 计算质心的关键在于获得质心坐标在图像中的相对位置. 因此, 将光斑图像的长宽坐标分别设为–1—1. 图像的大小为256×256, 对应一个像素的尺寸约为0.008. 最后采用反向传播算法优化网络参数. 采用的优化器为Adam, 学习率设置为0.0001.

      为了进一步验证网络的泛化能力, 采用训练后的网络预测了与高斯形貌不同的光斑的质心. 考虑平顶光斑远场衍射理想光斑, 采用如下函数产生类Sinc光斑:

      $ I = {\left[ {\frac{{{{\text{J}}_1}\left( {ar} \right)}}{r}} \right]^2}, $

      $ r = {\left( {\frac{{{{\left( {x - {x_0}} \right)}^2}}}{{\sigma _x^2}} + \frac{{{{\left( {y - {y_0}} \right)}^2}}}{{\sigma _y^2}}} \right)^{\tfrac{1}{2}}}, $

      其中, J1为一阶贝塞尔函数, r为坐标点与质心距离. 采用均匀分布随机数修改其中的参数改变光斑特征. $a \in \left[ {0.5, 1.5} \right]$, 其余参数范围与(6)式相同.

    • 共对所有数据训练20个周期. 训练中依次从总体样本中抽取小批量样本, 批量的大小为32. 典型的损失函数变化如图2所示. 曲线显示: 经1个周期的训练, 损失函数明显下降. 经过训练, 训练集上的损失函数下降了约4个数量级, 测试集上的损失函数值约为10–4. 测试集的损失函数值整体小于训练集的损失函数, 原因是当前采用的损失函数为所有样本的损失函数之和, 而测试集的样本少. 多次重复执行训练过程, 得到的损失函数变化情况略有不同. 这是由于优化神经网络时采用的随机数作为种子. 但是, 通常损失函数能够在一个周期内明显下降. Centroid-PINN利用损失函数将质心计算物理过程融入神经网络, 使得神经网络在训练时能够更好地针对质心计算提取所需的图像特征. 因而网络较容易收敛, 在较少的迭代周期内即达到收敛. 需要指出的是, 如果采用较大的学习率, 可能出现振荡情况. 振荡的可能原因是个别光斑恰好通过当前网络参数前向传播后得到近似全零图像. 但继续训练, 损失函数将再次降低. 该结果表明网络在当前参数设置下易于收敛.

      图  2  训练过程中损失函数变化情况

      Figure 2.  Loss in training process

    • 从高斯光斑测试集中随机选取光斑图像, 采用已训练的网络预测光斑质心, 结果如图3所示. 图3(a)中, 第一行为3个典型的输入光斑图像; 第二行为对应的无噪声原始光斑; 第三行为采用第一行光斑作为输入得到的预测图像. 输入光斑图像中显示出较明显的背景干扰, 并且光斑尺寸各异、位置随机、存在沿水平竖直方向的拉伸变形. 结果显示: 在预测光斑图像中, 仅在与原始光斑位置相同处的强度较大, 在噪声处几乎无响应, 说明网络对于真实光斑的响应较强. 进一步, 分别使用重心算法(CoG)和阈值重心算法(TmCoG)计算原始输入光斑的质心, 采用CoG计算预测图像光斑质心. 为了便于实现, TmCoG的阈值固定为0.1. 结果如图3(b)所示. 图中显示了10个批次的计算结果, 每个数据点为32幅图像的平均值. CoG与TmCoG的计算偏差基本相同, 约0.5. 对比图像尺寸为1, 因此对于存在当前噪声干扰的光斑, 传统质心算法无法准确获得光斑质心. 主要原因是传统质心算法易受噪声干扰, 特别是无法应对斜坡噪声干扰. 而利用神经网络预测的精度为约0.008, 约为1个像素. 表明利用当前的神经网络可以有效预测斜坡和白噪声干扰下的高斯光斑质心位置. 对比网络输出的光斑与原始光斑, 虽然二者存在较大差异, 但是网络在光斑处的响应远高于其他位置处, 表明网络有效提取了高精度计算质心的特征, 因而获得了较高的质心定位精度. 在传统降噪应用中, 要求网络的输出与原始图像相一致. Centroid-PINN不同于传统的降噪, Centroid-PINN的约束为网络输出的光斑与原始光斑形所计算得到的质心相同.

      图  3  高斯光斑典型结果 (a)典型光斑, 第一行为输入光斑, 第二行为原始的无噪声光斑, 第三行为预测光斑; (b)质心误差

      Figure 3.  Typical results of gauss spots: (a) Typical spots, first row is input spots, second row is true spot, third row is predicted spot; (b) centroid estimation error.

    • 为了检验该网络的泛化能力, 使用上述训练后的网络预测了噪声干扰下的类Sinc光斑的质心, 结果如图4所示. 图4(a)是典型的输入光斑、原始光斑和预测光斑. 输入光斑为含噪声光斑. 原始光斑为无噪声光斑. 预测光斑为经神经网络处理后的光斑. 为了更明显的显示衍射光斑图案, 灰度值采用了自然对数坐标. 输入光斑不仅包含各种类型的噪声干扰、改变了尺寸、拉伸变化, 而且增加了原训练数据集中不存在的旋转变换. 与高斯光斑算例相似, 在预测光斑中, 仅在与原始光斑的主光斑位置处出现较强响应. 图像边缘处显示出十分低的响应是由于目前采用的U-Net在卷积计算时采用了边缘补零的方法, 采用边缘对称方法可以改善这一现象. 质心计算误差结果如图4(b)所示. 由神经网络预测的质心误差小于0.008, 即神经网络的预测精度达到了亚像素级别. 相比而言, 传统质心算法的计算误差约0.09, 未能得到准确的质心位置. 因此, 神经网络预测的精度依旧远高于传统质心算法方法.

      图  4  类Sinc光斑计算结果 (a)典型光斑, 第一行为输入光斑, 第二行为原始光斑, 第三行为网络输出光斑; (b)质心误差

      Figure 4.  Typical results of sinc-like spots: (a) Typical spots, first row is input spots, second row is true spot, third row is predicted spot; (b) centroid estimation error.

    • 为了检验Centroid-PINN的性能, 利用高斯光斑分别计算了两种噪声对质心定位精度的影响, 结果如图5所示. 图5(a), (b)分别显示了仅有高斯噪声和仅有斜坡噪声的计算结果. 横坐标表示不同的噪声强度. 每一个数据点均为32幅图像计算的平均结果. 结果显示: Centroid-PINN预测的质心误差小于0.01, 约为1个像素; 而传统方法预测的结果偏差较大, 未能准确获得质心位置. 表明神经网络可以在两种噪声单独干扰下有效地排除噪声干扰, 识别光斑. 特别是对于斜坡噪声, 随着噪声强度的增大, 神经网络预测精度进一步提升. 该现象可以解释为随着斜坡噪声的强度增大, 噪声的特征更为明显, 因此神经网络更容易排除该噪声的干扰.

      图  5  不同强度噪声对质心计算的影响 (a)白噪声; (b)斜坡噪声

      Figure 5.  Influence of noise intensity on centroid computation: (a) White noise; (b) ramp noise.

    • 针对噪声干扰下的畸变光斑质心高精度计算, 提出了基于神经网络的质心预测方法, 称为centroid-PINN. Centroid-PINN利用U-Net神经网络预处理光斑图像, 将质心计算误差作为损失函数优化网络参数. 采用模拟手段验证了该方法. 结果表明: 在白噪声和斜坡噪声干扰下, centroid-PINN对于畸变的高斯光斑和Sinc光斑的质心计算精度远高于传统方法, 可达亚像素级别. 相比于传统的神经网络方法, centroid-PINN具有更明确的物理意义, 更易于训练. 相比传统质心计算方法, centroid-PINN能够智能化消除特定类型噪声的干扰, 有效解决了噪声干扰下的质心高精度定位难题. 进一步, 噪声的类型丰富多样, 本文仅对两种典型噪声的干扰展开了研究, 后续工作中还可以分析其他噪声的干扰, 以及多种噪声的叠加干扰.

参考文献 (25)

目录

    /

    返回文章
    返回