搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

机器学习在宇宙线粒子鉴别中的应用

刘烨 牛赫然 李兵兵 马欣华 崔树旺

引用本文:
Citation:

机器学习在宇宙线粒子鉴别中的应用

刘烨, 牛赫然, 李兵兵, 马欣华, 崔树旺

Application of machine learning in cosmic ray particle identification

Liu Ye, Niu He-Ran, Li Bing-Bing, Ma Xin-Hua, Cui Shu-Wang
PDF
HTML
导出引用
  • 基于热中子探测器实验模拟数据, 使用决策树(decision tree, DT)、随机森林(random forest, RF)和BP神经网络(back-propagation neural network, BPNN)构建了宇宙线粒子鉴别机器学习模型, 对每种粒子分别使用不同的机器学习算法基于模拟数据进行模型训练, 并针对算法进行超参数调整, 将每种算法的AUC值和Q品质因子作为粒子成分鉴别的评价指标. 实验结果表明, 不同机器学习模型对粒子预测精度影响很大. 在测试检验中, 经过交叉网格搜索方法调参后的决策树鉴别模型对中成分(碳氮氧和镁铝硅)比较敏感, 鉴别模型AUC值均在0.95以上, Q品质因子均大于6; 经交叉网格搜索方法调参后的随机森林鉴别模型对于宇宙线粒子鉴别的效果最好, 所有粒子鉴别模型的AUC值均大于0.92且Q品质因子均在4以上; BP神经网络算法只对质子和铁核比较敏感. 本研究对宇宙线粒子鉴别和筛选提供了新的方法和选择, 可为热中子探测器后续开展宇宙线能谱测量提供新思路.
    Machine learning algorithms can learn the rules and patterns of big data through computers, excavate potential information hidden behind the data, and be widely used to solve classification, regression, clustering, and other problems. Firstly, this paper uses CORSIKA software to simulate the process of cosmic ray cascade shower in the atmosphere, generating information such as the initial energy, zenith angle, azimuth angle of cosmic ray particles. Then, this paper uses the Geant4 toolkit to conduct thermal neutron detector response simulation, generating 4000 particles in each of proton, helium, CNO, MgAlSi and iron. Based on the experimental simulation data of thermal neutron detector, this paper constructs machine learning models for identifying cosmic ray particles by using decision tree (DT), random forest (RF) and BP neural network (BP NN) respectively. For each particle, all the machine learning algorithms are used for model training based on the simulation data. The cross grid search method is used to adjust the hyper parameters of each machine learning algorithm. The AUC value and Q quality factor value of each algorithm are used as evaluation indexes for particle composition identification. The AUC value is a general indicator for evaluating algorithm performance in machine learning and the Q quality factor value is an evaluation index commonly used in the field of high energy physics. The Experimental results show that different machine learning models have great influence on particle prediction accuracy, and the random forest cosmic ray particle identification model has sufficient accuracy and generalization capability. In the test, the decision tree algorithm adjusted by cross grid search method is sensitive to the medium components (CNO and MgAlSi). The AUC values of the algorithm are all above 0.95 and the Q quality factor values are all above 6. The random forest algorithm adjusted by the cross grid search method has the best effect on the identification of cosmic ray particles. The AUC values of the algorithm are all more than 0.92 and the Q quality factor values are all more than 4. The BP neural network algorithm is only sensitive to proton and iron. This study provides a new method and selection for identifying and screening the cosmic ray particles and it also provides a new idea for the following measurement of cosmic ray energy spectrum by thermal neutron detector.
      通信作者: 崔树旺, cuisw@hebtu.edu.cn
    • 基金项目: 国家自然科学基金(批准号: 11905043, U2031103)、河北省教育厅项目(批准号: KCJSZ2022036)和河北经贸大学研究生创新资助项目(批准号: XYCX202333)资助的课题.
      Corresponding author: Cui Shu-Wang, cuisw@hebtu.edu.cn
    • Funds: Project supported by the National Natural Science Foundation of China (Grant Nos. 11905043, U2031103), the Department of Education Project Hebei Province, China (Grant No. KCJSZ2022036), and the Hebei University of Economics and Business Graduate Innovation Funding Project, China (Grant No. XYCX202333).
    [1]

    胡红波, 王祥玉, 刘四明 2018 科学通报 63 2440Google Scholar

    Hu H B, Wang X Y, Liu S M 2018 Chin. Sci. Bull. 63 2440Google Scholar

    [2]

    胡红波, 郭义庆 2016 科学通报 61 1188Google Scholar

    Hu H B, Guo Y Q 2016 Chin. Sci. Bull. 61 1188Google Scholar

    [3]

    曹臻 2022 科学通报 67 1558Google Scholar

    Cao Z 2022 Chin. Sci. Bull. 67 1558Google Scholar

    [4]

    曹臻, 陈明君, 陈松战, 胡红波, 刘成, 刘烨, 马玲玲, 马欣华, 盛祥东, 吴含荣, 肖刚, 姚志国, 尹丽巧, 查敏, 张寿山 2019 天文学报 60 3Google Scholar

    Cao Z, Chen M J, Chen S Z, Hu H B, Liu C, Liu Y, Ma L L, Ma X H, Shen X D, Wu H R, Xiao G, Yao Z G, Yin L Q, Zha M, Zhang S S 2019 Acta Astron. Sin. 60 3Google Scholar

    [5]

    李川, 王文博, 陈鹏飞 2022 中国科学: 物理学 力学 天文学 52 16Google Scholar

    Li C, Wang W B, Chen P F 2022 Sci. China Phys. Mech. 52 16Google Scholar

    [6]

    张丰, 刘虎, 祝凤荣 2022 物理学报 71 249601Google Scholar

    Zhang F, Liu H, Zhu F R 2022 Acta Phys. Sin. 71 249601Google Scholar

    [7]

    陈秀林 2020 硕士学位论文 (北京: 中国科学院大学)

    Chen X L 2020 M. S. Thesis (Beijing University of Chinese Academy of Sciences) (in Chinese)

    [8]

    严雨婷, 毕文杰 2023 中国管理科学 网络首发 [2023-02-03]

    Yan Y T, Bi W J 2023 Chin. J. Manag. Sci. Online First (in Chinese)

    [9]

    Herrera L J, Todero Peixoto C J, Baños O, Carceller J M, Carrillo F, Guillén A 2020 Entropy 22 998Google Scholar

    [10]

    Pang L G, Zhou K, Su N, Petersen H, Stöcker H, Wang X N 2018 Nat. Commun. 9 210Google Scholar

    [11]

    高泽鹏, 王永佳, 李庆峰, 刘玲 2022 中国科学: 物理学 力学 天文学 52 252010Google Scholar

    Gao Z P, Wang Y J, Li Q F, Liu L 2022 Sci. China Phys. Mech. 52 252010Google Scholar

    [12]

    骆仕杰, 韩抒真 2023 小型微型计算机系统 网络首发 [2023-03-05]

    Luo S J, Han S Z 2023 J. Chin. Comp. Syst. Online First (in Chinese)

    [13]

    王玉东, 王忠海, 周荣, 陈秀莲, 覃雪, 刘军 2019 核电子学与探测技术 39 567

    Wang Y D, Wang Z H, Zhou R, Chen X L, Qin X, Liu J 2019 Nucl. Electron. Detect. Technol. 39 567

    [14]

    黎威, 龙连春, 刘静毅, 杨洋 2022 物理学报 71 060202Google Scholar

    Li W, Long L C, Liu J Y, Yang Y 2022 Acta Phys. Sin. 71 060202Google Scholar

    [15]

    崔静静, 胡泽文, 任萍 2022 情报科学 40 90Google Scholar

    Cui J J, Hu Z W, Ren P 2022 Inf. Sci. 40 90Google Scholar

    [16]

    李勇男 2018 情报科学 36 80Google Scholar

    Li Y N 2018 Inf. Sci. 36 80Google Scholar

    [17]

    Lin S, Luo W 2019 Multivar. Behav. Res. 54 578Google Scholar

    [18]

    Song S, Park C G 2019 Sustainability 11 6976Google Scholar

    [19]

    肖燚, 郭亚会, 李明蔚, 付永硕, 孙峰 2022 北京师范大学学报(自然科学版) 58 261Google Scholar

    Xiao Y, Guo Y H, Li M W, Guo Y S, Sun F 2022 J. Beijing Normal Univ. (Nat. Sci.) 58 261Google Scholar

    [20]

    卢小宾, 张杨燚, 杨冠灿, 行佳鑫 2022 情报学报 41 1059Google Scholar

    Lu X B, Zhang Y Y, Yang G C, Xing J X 2022 Inf. Sci. 41 1059Google Scholar

    [21]

    Pei Y L, Li D D, Xue W X 2020 Concurr. Comp-Pract E 32 e5515

    [22]

    院琳, 杨雪松, 王秉中 2019 物理学报 68 170503Google Scholar

    Yuan L, Yang X S, Wang B Z 2019 Acta Phys. Sin. 68 170503Google Scholar

    [23]

    赵振宇, 刘宇帆, 刘善存, 马海波 2023 北京航空航天大学学报 (社会科学版) 网络首发 [2023-03-05]

    Zhao Z Y, Liu Y F, Liu S C, Ma H B 2023 J. Beijing Univ. Aeronaut. Astronaut (Soc. Sci. Ed.) Online First

  • 图 1  宇宙线成分鉴别模型技术路线图

    Fig. 1.  Technical roadmap of the cosmic rays component identification model.

    图 2  随机森林算法建模流程图

    Fig. 2.  Flow chart of random forest algorithm modeling.

    图 3  本文BP神经网络结构示意图

    Fig. 3.  Structure diagram of BP neural network in this paper

    图 4  三种宇宙线鉴别模型鉴别氦十折交叉验证核验图

    Fig. 4.  Results of three cosmic rays identification models identifying helium using 10-fold cross validation method.

    图 5  三种宇宙线粒子鉴别模型鉴别氦核概率分布图

    Fig. 5.  Probability distribution of three cosmic rays identification models identifying helium.

    表 1  决策树鉴别不同成分最佳超参数

    Table 1.  Optimal hyperparameters of decision tree identifying different components.

    超参数目标成分
    质子氦核碳氮氧镁铝硅铁核
    criterionEntropyEntropyEntropyEntropyEntropy
    max_depth2129402819
    min_samples_split24724
    min_weight_fraction_leaf00000
    min_samples_leaf11111
    下载: 导出CSV

    表 2  随机森林鉴别不同成分最佳超参数

    Table 2.  Optimal hyperparameters of random forest identifying different components.

    超参数目标成分
    质子氦核碳氮氧镁铝硅铁核
    criterionGiniGiniEntropyEntropyEntropy
    n_estimators4888301521
    max_depth2026302723
    min_samples_split22212
    min_samples_leaf11111
    下载: 导出CSV

    表 3  BP神经网络(鉴别氦核)隐藏层节点核验结果

    Table 3.  BP neural network (identifying helium) hidden layer nodes verification results.

    训练结果 隐藏节点个数
    5678910111213
    迭代次数200002000020000250002700020000200002000020000
    算法AUC值0.55030.50450.52930.55930.63290.62760.61770.61420.6418
    Q品质因子0.820.290.580.861.261.251.221.261.34
    下载: 导出CSV

    表 4  BP神经网络鉴别不同成分最佳超参数组合

    Table 4.  Optimal hyperparameters of BP neural network identifying different components.

    超参数目标成分
    质子氦核碳氮氧镁铝硅铁核
    隐藏层节点数1311131311
    初始学习率0.010.010.010.010.01
    迭代次数2000025000200002000020000
    下载: 导出CSV

    表 5  三种宇宙线粒子鉴别模型鉴别不同成分效率及纯度

    Table 5.  Efficiency and purity of three cosmic rays identification models identifying different components.

    目标成分效率/%纯度/%
    BP神经网络决策树随机森林BP神经网络决策树随机森林
    质子64.974.875.774.477.691.1
    氦核36.083.379.352.880.195.7
    碳氮氧10.393.481.564.594.899.4
    镁铝硅16.991.878.769.992.195.8
    铁核82.888.191.187.588.793.5
    下载: 导出CSV

    表 6  三种宇宙线粒子鉴别模型鉴别不同成分AUC值及Q品质因子

    Table 6.  AUC and Q quality factor values of three cosmic rays identification models identifying different components.

    目标成分AUCQ 品质因子
    BP神经网络决策树随机森林BP神经网络决策树随机森林
    质子0.79620.85550.92472.713.155.42
    氦核0.64180.88050.95371.343.758.38
    碳氮氧0.54440.96120.97390.877.5520.1
    镁铝硅0.57540.95040.95311.256.548.39
    铁核0.87510.89520.93802.962.974.40
    下载: 导出CSV
  • [1]

    胡红波, 王祥玉, 刘四明 2018 科学通报 63 2440Google Scholar

    Hu H B, Wang X Y, Liu S M 2018 Chin. Sci. Bull. 63 2440Google Scholar

    [2]

    胡红波, 郭义庆 2016 科学通报 61 1188Google Scholar

    Hu H B, Guo Y Q 2016 Chin. Sci. Bull. 61 1188Google Scholar

    [3]

    曹臻 2022 科学通报 67 1558Google Scholar

    Cao Z 2022 Chin. Sci. Bull. 67 1558Google Scholar

    [4]

    曹臻, 陈明君, 陈松战, 胡红波, 刘成, 刘烨, 马玲玲, 马欣华, 盛祥东, 吴含荣, 肖刚, 姚志国, 尹丽巧, 查敏, 张寿山 2019 天文学报 60 3Google Scholar

    Cao Z, Chen M J, Chen S Z, Hu H B, Liu C, Liu Y, Ma L L, Ma X H, Shen X D, Wu H R, Xiao G, Yao Z G, Yin L Q, Zha M, Zhang S S 2019 Acta Astron. Sin. 60 3Google Scholar

    [5]

    李川, 王文博, 陈鹏飞 2022 中国科学: 物理学 力学 天文学 52 16Google Scholar

    Li C, Wang W B, Chen P F 2022 Sci. China Phys. Mech. 52 16Google Scholar

    [6]

    张丰, 刘虎, 祝凤荣 2022 物理学报 71 249601Google Scholar

    Zhang F, Liu H, Zhu F R 2022 Acta Phys. Sin. 71 249601Google Scholar

    [7]

    陈秀林 2020 硕士学位论文 (北京: 中国科学院大学)

    Chen X L 2020 M. S. Thesis (Beijing University of Chinese Academy of Sciences) (in Chinese)

    [8]

    严雨婷, 毕文杰 2023 中国管理科学 网络首发 [2023-02-03]

    Yan Y T, Bi W J 2023 Chin. J. Manag. Sci. Online First (in Chinese)

    [9]

    Herrera L J, Todero Peixoto C J, Baños O, Carceller J M, Carrillo F, Guillén A 2020 Entropy 22 998Google Scholar

    [10]

    Pang L G, Zhou K, Su N, Petersen H, Stöcker H, Wang X N 2018 Nat. Commun. 9 210Google Scholar

    [11]

    高泽鹏, 王永佳, 李庆峰, 刘玲 2022 中国科学: 物理学 力学 天文学 52 252010Google Scholar

    Gao Z P, Wang Y J, Li Q F, Liu L 2022 Sci. China Phys. Mech. 52 252010Google Scholar

    [12]

    骆仕杰, 韩抒真 2023 小型微型计算机系统 网络首发 [2023-03-05]

    Luo S J, Han S Z 2023 J. Chin. Comp. Syst. Online First (in Chinese)

    [13]

    王玉东, 王忠海, 周荣, 陈秀莲, 覃雪, 刘军 2019 核电子学与探测技术 39 567

    Wang Y D, Wang Z H, Zhou R, Chen X L, Qin X, Liu J 2019 Nucl. Electron. Detect. Technol. 39 567

    [14]

    黎威, 龙连春, 刘静毅, 杨洋 2022 物理学报 71 060202Google Scholar

    Li W, Long L C, Liu J Y, Yang Y 2022 Acta Phys. Sin. 71 060202Google Scholar

    [15]

    崔静静, 胡泽文, 任萍 2022 情报科学 40 90Google Scholar

    Cui J J, Hu Z W, Ren P 2022 Inf. Sci. 40 90Google Scholar

    [16]

    李勇男 2018 情报科学 36 80Google Scholar

    Li Y N 2018 Inf. Sci. 36 80Google Scholar

    [17]

    Lin S, Luo W 2019 Multivar. Behav. Res. 54 578Google Scholar

    [18]

    Song S, Park C G 2019 Sustainability 11 6976Google Scholar

    [19]

    肖燚, 郭亚会, 李明蔚, 付永硕, 孙峰 2022 北京师范大学学报(自然科学版) 58 261Google Scholar

    Xiao Y, Guo Y H, Li M W, Guo Y S, Sun F 2022 J. Beijing Normal Univ. (Nat. Sci.) 58 261Google Scholar

    [20]

    卢小宾, 张杨燚, 杨冠灿, 行佳鑫 2022 情报学报 41 1059Google Scholar

    Lu X B, Zhang Y Y, Yang G C, Xing J X 2022 Inf. Sci. 41 1059Google Scholar

    [21]

    Pei Y L, Li D D, Xue W X 2020 Concurr. Comp-Pract E 32 e5515

    [22]

    院琳, 杨雪松, 王秉中 2019 物理学报 68 170503Google Scholar

    Yuan L, Yang X S, Wang B Z 2019 Acta Phys. Sin. 68 170503Google Scholar

    [23]

    赵振宇, 刘宇帆, 刘善存, 马海波 2023 北京航空航天大学学报 (社会科学版) 网络首发 [2023-03-05]

    Zhao Z Y, Liu Y F, Liu S C, Ma H B 2023 J. Beijing Univ. Aeronaut. Astronaut (Soc. Sci. Ed.) Online First

  • [1] 宋睿, 刘雪梅, 王海滨, 吕皓, 宋晓艳. 机器学习辅助的硬质合金硬度预测. 物理学报, 2024, 73(12): 126201. doi: 10.7498/aps.73.20240284
    [2] 张嘉晖. 蛋白质计算中的机器学习. 物理学报, 2024, 73(6): 069301. doi: 10.7498/aps.73.20231618
    [3] 应大卫, 张思慧, 邓书金, 武海斌. 基于机器学习的单拍冷原子成像. 物理学报, 2023, 72(14): 144201. doi: 10.7498/aps.72.20230449
    [4] 张逸凡, 任卫, 王伟丽, 丁书剑, 李楠, 常亮, 周倩. 机器学习结合固溶强化模型预测高熵合金硬度. 物理学报, 2023, 72(18): 180701. doi: 10.7498/aps.72.20230646
    [5] 管星悦, 黄恒焱, 彭华祺, 刘彦航, 李文飞, 王炜. 生物分子模拟中的机器学习方法. 物理学报, 2023, 72(24): 248708. doi: 10.7498/aps.72.20231624
    [6] 牟家连, 吕军光, 孙希磊, 兰小飞, 黄永盛. 环形正负电子对撞机带电粒子鉴别的飞行时间探测器. 物理学报, 2023, 72(12): 122901. doi: 10.7498/aps.72.20222271
    [7] 郭唯琛, 艾保全, 贺亮. 机器学习回归不确定性揭示自驱动活性粒子的群集相变. 物理学报, 2023, 72(20): 200701. doi: 10.7498/aps.72.20230896
    [8] 艾飞, 刘志兵, 张远涛. 结合机器学习的大气压介质阻挡放电数值模拟研究. 物理学报, 2022, 71(24): 245201. doi: 10.7498/aps.71.20221555
    [9] 康俊锋, 冯松江, 邹倩, 李艳杰, 丁瑞强, 钟权加. 基于机器学习的非线性局部Lyapunov向量集合预报订正. 物理学报, 2022, 71(8): 080503. doi: 10.7498/aps.71.20212260
    [10] 张嘉伟, 姚鸿博, 张远征, 蒋伟博, 吴永辉, 张亚菊, 敖天勇, 郑海务. 通过机器学习实现基于摩擦纳米发电机的自驱动智能传感及其应用. 物理学报, 2022, 71(7): 078702. doi: 10.7498/aps.71.20211632
    [11] 黎威, 龙连春, 刘静毅, 杨洋. 基于机器学习的无机磁性材料磁性基态分类与磁矩预测. 物理学报, 2022, 71(6): 060202. doi: 10.7498/aps.71.20211625
    [12] 张丰, 刘虎, 祝凤荣. 膝区宇宙线广延大气簇射次级成分的特征. 物理学报, 2022, 71(24): 249601. doi: 10.7498/aps.71.20221556
    [13] 刘武, 朱成皖, 李昊天, 赵谡玲, 乔泊, 徐征, 宋丹丹. 基于机器学习和器件模拟对Cu(In,Ga)Se2电池中Ga含量梯度的优化分析. 物理学报, 2021, 70(23): 238802. doi: 10.7498/aps.70.20211234
    [14] 林键, 叶梦, 朱家纬, 李晓鹏. 机器学习辅助绝热量子算法设计. 物理学报, 2021, 70(14): 140306. doi: 10.7498/aps.70.20210831
    [15] 陈江芷, 杨晨温, 任捷. 基于波动与扩散物理系统的机器学习. 物理学报, 2021, 70(14): 144204. doi: 10.7498/aps.70.20210879
    [16] 黄志成, 周勋秀, 黄代绘, 贾焕玉, 陈松战, 马欣华, 刘栋, 阿西克古, 赵兵, 陈林, 王培汉. 高海拔宇宙线观测实验中scaler模式的模拟研究. 物理学报, 2021, 70(19): 199301. doi: 10.7498/aps.70.20210632
    [17] 韩瑞龙, 蔡明辉, 杨涛, 许亮亮, 夏清, 韩建伟. 宇宙线高能粒子对测试质量充电机制. 物理学报, 2021, 70(22): 229501. doi: 10.7498/aps.70.20210747
    [18] 杨自欣, 高章然, 孙晓帆, 蔡宏灵, 张凤鸣, 吴小山. 铅基钙钛矿铁电晶体高临界转变温度的机器学习研究. 物理学报, 2019, 68(21): 210502. doi: 10.7498/aps.68.20190942
    [19] 周勋秀, 王新建, 黄代绘, 贾焕玉, 吴超勇. 近地雷暴电场与羊八井地面宇宙线关联的模拟研究. 物理学报, 2015, 64(14): 149202. doi: 10.7498/aps.64.149202
    [20] 王俊芳, 郄秀书, 卢红, 张吉龙, 于晓霞, 石峰. 雷暴电场对宇宙射线次级粒子 子的影响研究. 物理学报, 2012, 61(15): 159202. doi: 10.7498/aps.61.159202
计量
  • 文章访问数:  2622
  • PDF下载量:  85
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-03-07
  • 修回日期:  2023-04-08
  • 上网日期:  2023-05-18
  • 刊出日期:  2023-07-20

/

返回文章
返回