搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

机器学习在量子通信资源优化配置中的应用

陈以鹏 刘靖阳 朱佳莉 方伟 王琴

引用本文:
Citation:

机器学习在量子通信资源优化配置中的应用

陈以鹏, 刘靖阳, 朱佳莉, 方伟, 王琴

Application of machine learning in optimal allocation of quantum communication resources

Chen Yi-Peng, Liu Jing-Yang, Zhu Jia-Li, Fang Wei, Wang Qin
PDF
HTML
导出引用
  • 在未来量子通信网络的大规模应用中, 如何根据当前用户实际情况实现资源优化配置, 比如选择最优量子密钥分发协议(quantum key distribution, QKD)和最优系统参数等, 是实现网络应用的一个重要考察指标. 传统的QKD最优协议选择以及参数优化配置方法, 大多是通过局部搜索算法来实现. 该方法需要花费大量的计算资源和时间. 为此, 本文提出了将机器学习算法应用到QKD资源优化配置之中, 通过回归机器学习的方式来同时进行不同情境下的最优协议选择以及最优协议的参数优化配置. 此外, 将包括随机森林(random forest, RF)、最近邻(k-nearest neighbor, KNN)、逻辑回归(logistic regression)等在内的多种回归机器学习模型进行对比分析. 数据仿真结果显示, 基于机器学习的新方案与基于局部搜索算法的传统方案相比, 在资源损耗方面实现了质的跨越, 而且RF在多个回归评估指标上都取得了最佳的效果. 此外, 通过残差分析, 发现以RF回归模型为代表的机器学习方案在最优协议选择以及参数优化配置方面具有很好的环境鲁棒性. 因此, 本工作将对未来量子通信网络实际应用起到重要的推进作用.
    In the application of quantum communication networks, it is an important task to realize the optimal allocation of resources according to the current situation. For example, We need to select the optimal quantum key distribution (QKD) protocol and parameters. Traditionally, the most commonly implemented method is the local search algorithm (LSA), which costs a lot of resources. Here in this work, we propose a machine learning based scheme, in which the regression machine learning is used to simultaneously select the optimal protocol and corresponding parameters. In addition, we make comparisons among a few machine learning models including random forest (RF), K-nearest neighbor (KNN) and logistic regression. Simulation results show that the new scheme takes much less time than the LSA scheme, and the RF achieves the best performance. In addition, through the RF residual analysis, we find that the machine learning scheme has good robustness. In conclusion, this work may play an important role in promoting the practical application of quantum communication networks.
      通信作者: 王琴, qinw@njupt.edu.cn
    • 基金项目: 国家重点研究发展计划(批准号: 2018YFA0306400, 2017YFA0304100) 、国家自然科学基金 (批准号: 12074194) 、江苏省自然科学基金前沿技术(批准号: BK20192001)和江苏省研究生科研创新计划(批准号: KYCX20_0726)资助的课题
      Corresponding author: Wang Qin, qinw@njupt.edu.cn
    • Funds: Project supported by the National Key R&D Program of China (Grant Nos. 2018 YFA0306400, 2017 YFA0304100), the National Natural Science Foundation of China (Grant No. 12074194), the Leading-edge technology program of Jiangsu Natural Science Foundation (Grant No. BK20192001), and Postgraduate Research & Practice Innovation Program of Jiangsu Province (KYCX20_0726).
    [1]

    Bennett C H, Brassard G 1984 Proceedings of IEEE International Conference on Computers, System and Signal Processing (Bangalore: IEEE) p175

    [2]

    Busch P, Heinonen T, Lathi P 2007 Phys. Rep. 452 155Google Scholar

    [3]

    Wootters W K, Zurek W H 1982 Nature. 299 299Google Scholar

    [4]

    Hwang W Y 2003 Phys. Rev. Lett. 91 057901Google Scholar

    [5]

    Wang X B 2005 Phys. Rev. Lett. 94 230503Google Scholar

    [6]

    Lo H K, Ma X F, Chen K 2005 Phys. Rev. Lett. 94 230504Google Scholar

    [7]

    Makarov V, Hjelme D R 2005 J. Mod. Optic. 52 691Google Scholar

    [8]

    Qi B, Fung C H F, Lo H K, Ma X F 2007 Quantum. Inf. Comput. 7 73

    [9]

    Lamas L A, Qin L, Gerhardt I, Makarov V, Kurtsiefer C 2009 New. J. Phys. 11 065003Google Scholar

    [10]

    Lydersen L, Wiechers C, Wittmann C, Elser D, Skaar J 2010 Nat. Photonics. 4 686Google Scholar

    [11]

    Lo H, Curty M, Qi B 2012 Phys. Rev. Lett. 108 130503Google Scholar

    [12]

    Braunstein S L, Pirandola S 2012 Phys. Rev. Lett. 108 130502Google Scholar

    [13]

    Wang X B. 2013 Phys. Rev. A 87 012320Google Scholar

    [14]

    Rubenok A, Slater J A, Chan P, Lucio M I, Tittel W 2013 Phys. Rev. Lett. 111 130501Google Scholar

    [15]

    Tang Z Y, Liao Z F, Xu F H, Qi B, Qian L, Lo H K 2014 Phys. Rev. Lett. 112 190503Google Scholar

    [16]

    Liu Y, Chen T Y, Wang L J, Liang H, Shentu G L, Wang J, Cui K, Yin H L, Liu N L, Li L, Ma X F, Pelc J S, Fejer M M, Peng C Z, Zhang Q, Pan J W 2013 Phys. Rev. Lett. 111 130502Google Scholar

    [17]

    Zhou X Y, Ding H J, Zhang C H, Wang Q 2020 Opt. Lett. 45 4176Google Scholar

    [18]

    Liu J Y, Zhou X Y Wang Q 2021 Phys. Rev. A. 103 022602Google Scholar

    [19]

    Lucamarini M, Yuan Z L, Dynes J F, Shields A J 2018 Nature 557 400Google Scholar

    [20]

    Takeoka M, Guha S. 2014 Nat. Commun. 5 5235Google Scholar

    [21]

    Pirandola S, Laurenza R, Ottaviani C 2017 Nat. Commun. 8 15043Google Scholar

    [22]

    Wang X B, Yu Z W, Hu X L 2018 Phys. Rev. A. 98 062323Google Scholar

    [23]

    Pittaluga M, Minder M, Lucamarini M, Sanzaro M, Woodward R I, Li M J, Yuan Z L, Shields A J 2021 Nat. Photonics. 15 530Google Scholar

    [24]

    Wang S, Yin Z Q, Chen W, He D Y, Song X T, Li H W, Zhang L J, Zhou Z, Guo G C, Han Z F 2022 Nat. Photonics. 16 154Google Scholar

    [25]

    Ren Z A, Chen Y P, Liu J Y, Ding H J, Wang Q 2021 IEEE Commun. Lett. 25 3Google Scholar

    [26]

    Fan-Yuan G J, Lu F Y, Wang S, Yin Z Q, He D Y, Zhou Z, Teng J, Chen W, Guo G C, Han Z F 2021 Photon. Res. 9 1881Google Scholar

    [27]

    Ding H J, Liu J Y, Zhang C M, Wang Q 2020 Quantum. Inf. Comput. 19 2548Google Scholar

    [28]

    Xu F, Xu H, Lo H K. 2014 Phys. Rev. A. 89 052333Google Scholar

    [29]

    Liu J Y, Ding H J, Zhang C M, Xie S P, Wang Q 2019 Phys. Rev. Appl. 12 014059Google Scholar

    [30]

    Yang M, Ren C L, Ma Y C, Xiao Y, Ye X J, Song L L, Xun J S, Yung M H, Li C F, Guo G C 2019 Phys. Rev. Lett. 123 190401Google Scholar

    [31]

    Zhou Y H, Yu Z W, Wang X B. 2016 Phys. Rev. A. 93 042324Google Scholar

    [32]

    Zhang C H, Zhang C M, Wang Q. 2019 Opt. Lett. 44 1468Google Scholar

    [33]

    Breiman L 2001 J. Clin. Microbiol. 45 5Google Scholar

    [34]

    Cover T M, Hart P E 1967 IEEE Trans. Inf. Theory 13 21Google Scholar

    [35]

    Cox D R 1958 J. R. Stat. Soc. B 20 215Google Scholar

  • 图 1  随机森林回归模型的算法框架.

    Fig. 1.  The algorithm framework of random forest regression model.

    图 2  系统参数对随机森林回归模型的重要性.

    Fig. 2.  Importance of system parameters to RF regression model.

    图 3  随机森林回归模型的残差图

    Fig. 3.  Residual diagram of RF regression model.

    图 4  随机森林回归模型的混淆矩阵

    Fig. 4.  Residual diagram of RF regression model.

    表 1  系统参数的特征范围

    Table 1.  Characteristic range of system parameters.

    Y0ed$ \eta $NL/km
    10–10—10–50.00—0.060.1—0.9106—10161—600
    下载: 导出CSV

    表 2  不同回归模型的评估对比

    Table 2.  Evaluation and comparison of different regression models.

    RFKNNLR
    MAE0.0020.0120.038
    MSE0.0160.0490.131
    $ {\mathit{R}}^{2} $0.9780.7950.397
    Accuracy0.9770.7870.365
    下载: 导出CSV

    表 3  时间资源损耗记录表

    Table 3.  Time resource wastage table.

    机器学习方案传统方案
    ModelRFKNNLRLSA
    Time1.23 s2.95 s5.43 s24 h以上
    下载: 导出CSV
  • [1]

    Bennett C H, Brassard G 1984 Proceedings of IEEE International Conference on Computers, System and Signal Processing (Bangalore: IEEE) p175

    [2]

    Busch P, Heinonen T, Lathi P 2007 Phys. Rep. 452 155Google Scholar

    [3]

    Wootters W K, Zurek W H 1982 Nature. 299 299Google Scholar

    [4]

    Hwang W Y 2003 Phys. Rev. Lett. 91 057901Google Scholar

    [5]

    Wang X B 2005 Phys. Rev. Lett. 94 230503Google Scholar

    [6]

    Lo H K, Ma X F, Chen K 2005 Phys. Rev. Lett. 94 230504Google Scholar

    [7]

    Makarov V, Hjelme D R 2005 J. Mod. Optic. 52 691Google Scholar

    [8]

    Qi B, Fung C H F, Lo H K, Ma X F 2007 Quantum. Inf. Comput. 7 73

    [9]

    Lamas L A, Qin L, Gerhardt I, Makarov V, Kurtsiefer C 2009 New. J. Phys. 11 065003Google Scholar

    [10]

    Lydersen L, Wiechers C, Wittmann C, Elser D, Skaar J 2010 Nat. Photonics. 4 686Google Scholar

    [11]

    Lo H, Curty M, Qi B 2012 Phys. Rev. Lett. 108 130503Google Scholar

    [12]

    Braunstein S L, Pirandola S 2012 Phys. Rev. Lett. 108 130502Google Scholar

    [13]

    Wang X B. 2013 Phys. Rev. A 87 012320Google Scholar

    [14]

    Rubenok A, Slater J A, Chan P, Lucio M I, Tittel W 2013 Phys. Rev. Lett. 111 130501Google Scholar

    [15]

    Tang Z Y, Liao Z F, Xu F H, Qi B, Qian L, Lo H K 2014 Phys. Rev. Lett. 112 190503Google Scholar

    [16]

    Liu Y, Chen T Y, Wang L J, Liang H, Shentu G L, Wang J, Cui K, Yin H L, Liu N L, Li L, Ma X F, Pelc J S, Fejer M M, Peng C Z, Zhang Q, Pan J W 2013 Phys. Rev. Lett. 111 130502Google Scholar

    [17]

    Zhou X Y, Ding H J, Zhang C H, Wang Q 2020 Opt. Lett. 45 4176Google Scholar

    [18]

    Liu J Y, Zhou X Y Wang Q 2021 Phys. Rev. A. 103 022602Google Scholar

    [19]

    Lucamarini M, Yuan Z L, Dynes J F, Shields A J 2018 Nature 557 400Google Scholar

    [20]

    Takeoka M, Guha S. 2014 Nat. Commun. 5 5235Google Scholar

    [21]

    Pirandola S, Laurenza R, Ottaviani C 2017 Nat. Commun. 8 15043Google Scholar

    [22]

    Wang X B, Yu Z W, Hu X L 2018 Phys. Rev. A. 98 062323Google Scholar

    [23]

    Pittaluga M, Minder M, Lucamarini M, Sanzaro M, Woodward R I, Li M J, Yuan Z L, Shields A J 2021 Nat. Photonics. 15 530Google Scholar

    [24]

    Wang S, Yin Z Q, Chen W, He D Y, Song X T, Li H W, Zhang L J, Zhou Z, Guo G C, Han Z F 2022 Nat. Photonics. 16 154Google Scholar

    [25]

    Ren Z A, Chen Y P, Liu J Y, Ding H J, Wang Q 2021 IEEE Commun. Lett. 25 3Google Scholar

    [26]

    Fan-Yuan G J, Lu F Y, Wang S, Yin Z Q, He D Y, Zhou Z, Teng J, Chen W, Guo G C, Han Z F 2021 Photon. Res. 9 1881Google Scholar

    [27]

    Ding H J, Liu J Y, Zhang C M, Wang Q 2020 Quantum. Inf. Comput. 19 2548Google Scholar

    [28]

    Xu F, Xu H, Lo H K. 2014 Phys. Rev. A. 89 052333Google Scholar

    [29]

    Liu J Y, Ding H J, Zhang C M, Xie S P, Wang Q 2019 Phys. Rev. Appl. 12 014059Google Scholar

    [30]

    Yang M, Ren C L, Ma Y C, Xiao Y, Ye X J, Song L L, Xun J S, Yung M H, Li C F, Guo G C 2019 Phys. Rev. Lett. 123 190401Google Scholar

    [31]

    Zhou Y H, Yu Z W, Wang X B. 2016 Phys. Rev. A. 93 042324Google Scholar

    [32]

    Zhang C H, Zhang C M, Wang Q. 2019 Opt. Lett. 44 1468Google Scholar

    [33]

    Breiman L 2001 J. Clin. Microbiol. 45 5Google Scholar

    [34]

    Cover T M, Hart P E 1967 IEEE Trans. Inf. Theory 13 21Google Scholar

    [35]

    Cox D R 1958 J. R. Stat. Soc. B 20 215Google Scholar

  • [1] 周江平, 周媛媛, 周学军. 非对称信道相位匹配量子密钥分发. 物理学报, 2023, 0(0): . doi: 10.7498/aps.72.20230652
    [2] 刘天乐, 徐枭, 付博伟, 徐佳歆, 刘靖阳, 周星宇, 王琴. 基于回归决策树的测量设备无关型量子密钥分发参数优化. 物理学报, 2023, 72(11): 110304. doi: 10.7498/aps.72.20230160
    [3] 朱佳莉, 曹原, 张春辉, 王琴. 实用化量子密钥分发光网络中的资源优化配置. 物理学报, 2023, 72(2): 020301. doi: 10.7498/aps.72.20221661
    [4] 孟杰, 徐乐辰, 张成峻, 张春辉, 王琴. 标记单光子源在量子密钥分发中的应用. 物理学报, 2022, 71(17): 170304. doi: 10.7498/aps.71.20220344
    [5] 叶炜, 郭迎, 夏莹, 钟海, 张欢, 丁建枝, 胡利云. 基于量子催化的离散调制连续变量量子密钥分发. 物理学报, 2020, 69(6): 060301. doi: 10.7498/aps.69.20191689
    [6] 聂敏, 刘广腾, 杨光, 裴昌幸. 基于最少中继节点约束的量子VoIP路由优化策略. 物理学报, 2016, 65(12): 120302. doi: 10.7498/aps.65.120302
    [7] 吴承峰, 杜亚男, 王金东, 魏正军, 秦晓娟, 赵峰, 张智明. 弱相干光源测量设备无关量子密钥分发系统的性能优化分析. 物理学报, 2016, 65(10): 100302. doi: 10.7498/aps.65.100302
    [8] 周飞, 雍海林, 李东东, 印娟, 任继刚, 彭承志. 基于不同介质间量子密钥分发的研究. 物理学报, 2014, 63(14): 140303. doi: 10.7498/aps.63.140303
    [9] 权东晓, 裴昌幸, 朱畅华, 刘 丹. 一种新的预报单光子源诱骗态量子密钥分发方案. 物理学报, 2008, 57(9): 5600-5604. doi: 10.7498/aps.57.5600
    [10] 胡华鹏, 张 静, 王金东, 黄宇娴, 路轶群, 刘颂豪, 路 巍. 双协议量子密钥分发系统实验研究. 物理学报, 2008, 57(9): 5605-5611. doi: 10.7498/aps.57.5605
    [11] 张 静, 王发强, 赵 峰, 路轶群, 刘颂豪. 时间和相位混合编码的量子密钥分发方案. 物理学报, 2008, 57(8): 4941-4946. doi: 10.7498/aps.57.4941
    [12] 赵 峰, 路轶群, 王发强, 陈 霞, 李明明, 郭邦红, 廖常俊, 刘颂豪. 基于微弱相干脉冲稳定差分相位量子密钥分发. 物理学报, 2007, 56(4): 2175-2179. doi: 10.7498/aps.56.2175
    [13] 郑力明, 王发强, 刘颂豪. 光纤色散与损耗对光量子密钥分发系统的影响. 物理学报, 2007, 56(4): 2180-2183. doi: 10.7498/aps.56.2180
    [14] 何广强, 易 智, 朱 俊, 曾贵华. 基于双模压缩态的量子密钥分发方案. 物理学报, 2007, 56(11): 6427-6433. doi: 10.7498/aps.56.6427
    [15] 陈 霞, 王发强, 路轶群, 赵 峰, 李明明, 米景隆, 梁瑞生, 刘颂豪. 运行双协议相位调制的量子密钥分发系统. 物理学报, 2007, 56(11): 6434-6440. doi: 10.7498/aps.56.6434
    [16] 冯发勇, 张 强. 基于超纠缠交换的量子密钥分发. 物理学报, 2007, 56(4): 1924-1927. doi: 10.7498/aps.56.1924
    [17] 陈 杰, 黎 遥, 吴 光, 曾和平. 偏振稳定控制下的量子密钥分发. 物理学报, 2007, 56(9): 5243-5247. doi: 10.7498/aps.56.5243
    [18] 李明明, 王发强, 路轶群, 赵 峰, 陈 霞, 梁瑞生, 刘颂豪. 高稳定的差分相位编码量子密钥分发系统. 物理学报, 2006, 55(9): 4642-4646. doi: 10.7498/aps.55.4642
    [19] 吴 光, 周春源, 陈修亮, 韩晓红, 曾和平. 长距离长期稳定的量子密钥分发系统. 物理学报, 2005, 54(8): 3622-3626. doi: 10.7498/aps.54.3622
    [20] 马海强, 李亚玲, 赵 环, 吴令安. 基于双偏振分束器的量子密钥分发系统. 物理学报, 2005, 54(11): 5014-5017. doi: 10.7498/aps.54.5014
计量
  • 文章访问数:  1135
  • PDF下载量:  62
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-05-04
  • 修回日期:  2022-07-07
  • 上网日期:  2022-11-02
  • 刊出日期:  2022-11-20

机器学习在量子通信资源优化配置中的应用

  • 1. 南京邮电大学, 量子信息技术研究所, 南京 210003
  • 2. 南京邮电大学, 宽带无线通信与传感网教育部重点实验室, 南京 210003
  • 通信作者: 王琴, qinw@njupt.edu.cn
    基金项目: 国家重点研究发展计划(批准号: 2018YFA0306400, 2017YFA0304100) 、国家自然科学基金 (批准号: 12074194) 、江苏省自然科学基金前沿技术(批准号: BK20192001)和江苏省研究生科研创新计划(批准号: KYCX20_0726)资助的课题

摘要: 在未来量子通信网络的大规模应用中, 如何根据当前用户实际情况实现资源优化配置, 比如选择最优量子密钥分发协议(quantum key distribution, QKD)和最优系统参数等, 是实现网络应用的一个重要考察指标. 传统的QKD最优协议选择以及参数优化配置方法, 大多是通过局部搜索算法来实现. 该方法需要花费大量的计算资源和时间. 为此, 本文提出了将机器学习算法应用到QKD资源优化配置之中, 通过回归机器学习的方式来同时进行不同情境下的最优协议选择以及最优协议的参数优化配置. 此外, 将包括随机森林(random forest, RF)、最近邻(k-nearest neighbor, KNN)、逻辑回归(logistic regression)等在内的多种回归机器学习模型进行对比分析. 数据仿真结果显示, 基于机器学习的新方案与基于局部搜索算法的传统方案相比, 在资源损耗方面实现了质的跨越, 而且RF在多个回归评估指标上都取得了最佳的效果. 此外, 通过残差分析, 发现以RF回归模型为代表的机器学习方案在最优协议选择以及参数优化配置方面具有很好的环境鲁棒性. 因此, 本工作将对未来量子通信网络实际应用起到重要的推进作用.

English Abstract

    • 量子密钥分发(quantum key distribution, QKD)是量子保密通信的核心, 其安全性基于物理学基本原理, 原则上能够为远距离通信的双方(Alice和Bob)提供无条件安全的信息保障. 第一个QKD协议由Bennett和Brassard[1]于1984年提出, 此后简称BB84协议, 其安全性已经得到严格的数学证明[2,3], 也是目前应用最为广泛的一种QKD协议. 原始的BB84协议需要采用理想的单光子源, 但是在实际应用中, 大多采用弱相干光源(weak coherent source, WCS), 该类光源中的多光子成分使得窃听方(eve)实施光子数分离攻击(PNS)成为可能. 为了解决PNS攻击, 科学家提出了诱骗态方法[4-6]. 此外, 探测端的测信道漏洞也是Eve攻击的对象[7-10]. 为了关闭探测器端的诸多侧信道漏洞, 加拿大Lo等[11]和英国Braunstein等[12]于2012年各自独立地提出了测量设备无关量子密钥分发(measurement-device-independent, MDI)协议. MDI-QKD结合诱骗态方案可以免疫所有针对探测段的攻击手段, 因此提出之后受到了广泛的关注 [13-18]. 在实际应用中, MDI-QKD的安全密钥率和传输距离受统计起伏效应影响严重. 在此背景下, 双场量子密钥分发协议(twin-field quantum key distribution, TF-QKD)于2018年被Lucamarini等[19]提出. TF-QKD保留了MDI-QKD的测量设备无关特性, 并打破了无中继量子信道码率-距离限制(PLOB界)[20,21], 进一步提高了量子通信的实用性能, 这也使其成为目前关注度最高的QKD协议之一[22-24].

      在实际执行量子密钥分发之前, 首先需要根据用户实际情况选择合适的密钥分发协议[25,26], 同时对选定的量子密钥分发协议进行相关参数的优化配置[27], 从而确保通信双方之间能够实现最优的安全密钥共享, 本文将这个过程称之为最优协议选择以及最优参数配置. 传统的解决方案可以使用遍历收索方法或维度下降局域收索(LSA)优化算法[28]. 但是以上方法在实际应用时需要消耗大量的计算资源和计算时间, 无法满足实时量子通信的需求. 另一方面, 由于机器学习在数据处理方面的优势, 其常被用于协助解决量子信息中的部分问题[29,30]. 鉴于此, 本文考虑使用机器学习方案替代上述传统方案, 即通过机器学习实现回归模型来建模传统方案. 仿真结果表明, 相较于传统方案, 机器学习方案大幅减少了时间资源消耗, 因而显示出在实时量子通信应用中的巨大应用前景.

    • 监督机器学习过程可以简单解释为通过特征数据到标签数据的映射, 去学习一个具有指定数据预测功能的机器学习模型, 即基于某种机器学习算法$ F(x) $通过$ X\to Y $的映射过程去学习获取具有数据预测功能的ML模型$ f(x) $. 以几种主流的量子密钥分发协议: BB84-, MDI-以及TF-QKD为问题背景, 并主要从数据的获取和机器学习模型的构建两方面来介绍本文工作.

    • 为简单起见, 本文在评价最优QKD协议时暂不考虑系统安全等级等因素, 仅把安全密钥速率(R)作为评定特定情境下最优QKD协议的关键指标. 在实际QKD过程中, R值与下面几种系统因素紧密相关: 探测器的暗记数率($ {Y}_{0} $)、探测效率($ \eta $)、本底误码($ {e}_{\mathrm{d}} $), 通信发送方发送的光脉冲数($ N $), 通信双方间的通信距离($ L $). 将系统参数组合成5维向量$ X=\left[{Y}_{0}, {e}_{\mathrm{d}}, \eta , N, L\right] $, 并将其作为ML的特征数据格式.

      在讨论ML所需标签数据格式之前, 首先对获取仿真数据过程中所涉及到的3种主流QKD协议及其诱骗态方法进行简要论述. 对于BB84协议, 使用的是三强度诱骗态方法[5]. 在该方案中, 参数优化过程所涉及到的主要配置参数包括: 信号态强度$ \mu $、诱骗态强度$ \nu $、发送信号态脉冲的概率$ {P}_{\mu } $、发送诱骗态脉冲的概率$ {P}_{\nu } $、信号态制备在Z基的概率$ {P}_{z\mu } $、诱骗态制备在X基的概率$ {P}_{x\nu } $. 对于MDI协议, 使用的是四强度诱骗态方法[31], 参数优化涉及到的配置参数主要包括: 信号态强度$ \mu $、诱骗态强度$ \nu $$ \omega $、发送信号态$ \mu $的概率$ {P}_{\mu } $、发送诱骗态$ \nu $的概率$ {P}_{\nu } $、发送诱骗态$ \omega $的概率$ {P}_{\omega } $. 对于TF协议, 使用的是四强度诱骗态方法[32], 对应系统参数包括: 信号态强度$ \mu $、诱骗态强度$ \nu $, $ \omega $及其对应选择概率$ {P}_{\mu } $, $ {P}_{\nu } $, $ {P}_{\omega } $, 以及失败概率$ \epsilon $等.

      为了在ML标签数据格式中表征所选的最优协议, 本工作将3种协议对应编号1, 2, 3, 并将其作为标签向量的一个维度. 则不同协议的标签格式有: $ {Y}_{\mathrm{B}\mathrm{B}84}=\left[\mu , \nu , {P}_{\mu }, {P}_{\nu }, {P}_{z\mu }, {P}_{x\nu }, 1\right] $, $ {Y}_{\mathrm{M}\mathrm{D}\mathrm{I}}=\left[\mu , \nu , \omega , {P}_{\mu }, {P}_{\nu }, {P}_{\omega }, 2\right] $, $ {Y}_{\mathrm{T}\mathrm{F}}=\left[\mu , \nu , \omega , {P}_{\mu }, {P}_{\nu }, {P}_{\omega }, \epsilon , 3\right] $. 研究发现BB84协议和MDI协议的标签向量格式均为6维, 而TF协议的标签向量格式为7维. 为了构建统一格式的标签向量, 采用占位法来抹平上述差异, 即$ {Y}_{\mathrm{B}\mathrm{B}84}=\left[\mu , \nu , {P}_{\mu }, {P}_{\nu }, {P}_{z\mu }, {P}_{x\nu }, NUM, 1\right] $, $ {Y}_{\mathrm{M}\mathrm{D}\mathrm{I}}= \left[\mu , \nu , \omega , {P}_{\mu }, {P}_{\nu }, {P}_{\omega }, NUM, 2\right] $. 进一步地, 得益于占位方式的使用, 不同协议能够很好的保证参数维度的一致性, 这更有利于本工作推广到其他多种不同的QKD协议.

      在标签数据格式和特征数据格式构建完成之后, 需要获取通用的特征数据和标签数据. 根据实际经验, 本文将特征数据格式中的5个系统参数限制到表1所示的特征范围中. 本工作在5个系统参数的特征范围内进行等间隔的取值, 以间隔n为例, 则可以生成$ {n}^{5} $特征数据. 这里需要注意一点, 对于本底误码的取值而言, TF协议是其他两个协议的4倍. 随后利用不同QKD协议的密钥生成公式, 并结合LSA算法优化不同协议的配置参数, 以获取3份数据量大小为$ {n}^{5} $的标签数据. 接着通过比较不同协议的密钥率大小, 将3个协议关联起来, 即直接根据密钥率$ R $将无效数据剔除后的$ {Y}_{\mathrm{B}\mathrm{B}84} $, $ {Y}_{\mathrm{M}\mathrm{D}\mathrm{I}} $$ {Y}_{\mathrm{T}\mathrm{F}} $, 这3份标签数据合并为一份标签数据$ Y $. 至此, 便得到了ML所需的特征数据X和标签数据Y.

      Y0ed$ \eta $NL/km
      10–10—10–50.00—0.060.1—0.9106—10161—600

      表 1  系统参数的特征范围

      Table 1.  Characteristic range of system parameters.

    • 特征数据和标签数据统称为ML数据集, 经过上述的相关操作整个数据集的大小在10万量级. 随后本工作采用归一化(normalization)操作来加速ML模型对数据集的学习拟合, 表示为 núm = (num – min)/(max – num). 从数据集中随机划分出80%用于ML模型训练的训练集和20%用于ML模型性能评估的测试集. 后续, 在训练集上先后进行随机森林、最近邻、逻辑回归等ML模型的学习训练. 鉴于RF模型取得了最佳的预测效果, 接下来仅以RF为例, 介绍其构建的主要过程.

      随机森林(random forests, RF)[33]是基于Bagging(bootstrap aggregation)集成算法的典型范例, 其基本单元是决策树(decision tree)[34][35], 直观理解就是众多决策树构成一片随机森林. 在机器学习任务中, 随机森林既可以用于分类任务又可以用于回归任务, 本文主要是利用RF算法训练一个回归模型. RF回归模型, 是由众多回归决策树集成而来的. 回归树在训练时, 每确定一个节点, 就会将特征数据对应的特征空间进行一次划分, 划分形成的单元会以该单元内的均值作为其输出值. RF中除了森林这一重要概念之外, 还有随机的概念. 随机主要有两种含义: 其一, 从训练集中随机有放回的拿取样本数据用于决策树的学习, 有放回的随机抽取就是Bagging算法的直观体现; 其二, 随机选取特征向量中的特征用于决策树的学习. 随机的样本数据、随机的特征选择, 导致RF中的决策树各不相同, 而RF最终输出的结果则取决于不同决策树回归输出的均值. 图1展示了本工作中RF回归模型的算法框架.

      图  1  随机森林回归模型的算法框架.

      Figure 1.  The algorithm framework of random forest regression model.

      RF在训练集上进行学习拟合时, 需要对其算法的一些参数进行调优, 才能获取预测效果最好的回归模型. 这里主要使用网格搜索(GridSearch)和交叉验证(CV)的方法来对Sklearn中的随机森林Regressor模型进行调参. GridSearch可以理解为在指定参数范围内按照一定步长将候选参数所有可能的取值进行排列组合, 即生成“网格”. 而交叉验证则是将训练集进一步切分, 以常见的K折交叉验证法为例, 训练集中的K-1份使用网格参数进行训练, 训练集中剩余的1份则用于评估, 重复K次并选出K次平均评分最高时的网格参数, 进而完成参数调优. 本工作中RF回归模型的最终调参结果是: n_estimators为90、max_depth为56, min_samples_split为1. 其中, 第1个参数用于指定RF原始训练集有放回随机抽取样本数据所生成的子数据集个数; 第2个参数用于指定生成决策树的最大深度; 第3个参数用于指定决策树节点可分的最小样本数. 在完成RF回归模型的构建后, 对特征数据$ X $中5个系统参数的重要性进行评估. 结果表明: 距离$ L $对RF模型的影响最大; 其他几个系统参数的重要性相对较小, 具体的重要性比重如图2所示.

      图  2  系统参数对随机森林回归模型的重要性.

      Figure 2.  Importance of system parameters to RF regression model.

    • 在测试集上对已获ML模型进行性能评估时, 需要注意标签数据Y中包含了协议标号和该协议对应的配置参数. 不同于分类模型直接获取协议标号, 本工作的回归模型需要对回归预测的协议标号进行取整操作才能正确的实现协议分类. 下面简要介绍3种常用回归模型的性能评估指标, 并对本文的RF, KNN, LR模型进行比较分析.

      平均绝对误差(mean absolute error, MAE), 用于评估回归模型预测结果和真实结果差异的平均值, 其值越小说明ML模型对数据的拟合效果就越好, 可以表示为: $\mathrm{M}\mathrm{A}\mathrm{E}=\dfrac{1}{N}\displaystyle\sum\nolimits _{i=1}\left|{y}_{i}-{{\tilde y}_{i}}\right|$. 均方误差(mean squared error, MSE), 用于计算预测结果和真实结果对应样本点误差平方和的均值, 其值越小说明ML模型在数据预测方面的性能就越好, 可以表示为: $\mathrm{M}\mathrm{S}\mathrm{E}=\dfrac{1}{N}\displaystyle\sum\nolimits _{i=1}{\left({y}_{i}-{{\tilde y}_{i}}\right)}^{2}$. 决定系数(coefficient of determination R squared, R squared), 一般被认为是衡量线性回归相对较好的指标, 其取值范围在0—1之间, 越靠近1说明ML模型对数据的拟合效果就越好, 可以表示为: ${R}^{2}= 1-\left(\displaystyle{\sum} _{i=1}^{N}{\left({y}_{i}-{{\tilde y}_{i}}\right)}^{2} \Big/\displaystyle{\sum} _{i=1}^{N}{\left({y}_{i}-{{\bar y}}\right)}^{2}\right)$. 上述表达式中的N为测试集数据量、$ {y}_{i} $为测试集中的真实结果、$ \stackrel{~}{{y}_{i}} $为ML模型使用测试集预测出来的结果、${\bar y}=\dfrac{1}{N}\displaystyle{\sum} _{i=1}^{N}{y}_{i}$. 这里将回归模型的评估指标以及预测准确率如表2所示.

      RFKNNLR
      MAE0.0020.0120.038
      MSE0.0160.0490.131
      $ {\mathit{R}}^{2} $0.9780.7950.397
      Accuracy0.9770.7870.365

      表 2  不同回归模型的评估对比

      Table 2.  Evaluation and comparison of different regression models.

      表2可知, 基于相同训练集获取的RF回归模型相较于KNN和LR模型, 在MAE, MSE, $ {R}^{2} $预测准确率等性能指标上都取得了最好的表现, 这也说明RF适用于最优协议选择和参数优化配置的任务. 此外, 将ML方案和传统方案在个人电脑上的具体耗时情况如表3所示. 个人电脑的硬件配置为: Intel(R) Core(TM) i1-9750H CPU @2.60GHz; NVIDIA GeForce GTX 1650; 16 GB DDR4 2667MHZ. 具体的时间资源损耗统计过程, 本工作在指定某一用户需求下, 先后使用两种不同方案进行时间统计. 机器学习方案: 在获取训练完成的模型后, 将需求数据输入模型, 模型可以在短短数秒之内给出协议选择以及参数配置. 传统方案: 根据提供的用户需求数据, 采用LSA优化并获取3个协议的安全码率, 之后对3个协议的码率大小进行比对, 将成码率最大的协议作为最优协议. 该过程的时间损耗主要集中在采用LSA对协议参数进行优化获取最佳码率这个过程, 耗时超过24 h. 从表3结果来看, 两种方案选择的协议相同且协议配置参数的残差在0.025以内, 但是两者的耗时却存在着巨大的差异, 这进一步表明机器学习在很大程度上满足了简化并加速量子通信资源配置的目的.

      机器学习方案传统方案
      ModelRFKNNLRLSA
      Time1.23 s2.95 s5.43 s24 h以上

      表 3  时间资源损耗记录表

      Table 3.  Time resource wastage table.

      为了更加直观地展示RF方案的可行性, 接下来就RF的残差和混淆矩阵进行可视化分析. 图3为RF回归模型在训练集和测试集上的残差图, 这里的残差分析针对的是协议的配置参数, 即标签数据Y向量中处于第一维的配置参数. 图3中的蓝色点为训练集上的残差情况, 绿色点为测试集上的残差情况. 经统计, 多数偏差都低于0.025, 这表明RF机器学习方案具有相对较好的鲁棒性. 图4展示了协议选择的混淆矩阵, 主对角线的协议选择为正确的选择情况. 从图4可以看出, RF模型在不同情境下都能以较大的概率做出正确的协议选择. 通过对混淆矩阵可视化数据的相关计算, 可以求得RF回归模型的预测准确率在98%左右, 这也与表2中通过函数接口计算的准确率基本相当.

      图  3  随机森林回归模型的残差图

      Figure 3.  Residual diagram of RF regression model.

      图  4  随机森林回归模型的混淆矩阵

      Figure 4.  Residual diagram of RF regression model.

    • 本文提出了基于机器学习的最优协议选择以及优化参数配置的新方案, 相较于传统方案而言, 新方案大幅度地减少了时间资源损耗, 通过残差分析证明机器学习方案具有较好的鲁棒性. 此外, 本文详细地介绍了机器学习方案的流程, 主要是通过监督学习去实现满足协议选择以及参数配置功能的回归模型. 在构建的多个回归模型中, RF模型取得了最佳的表现: 均方误差为0.002、平均绝对误差为0.016、$ {R}^{2} $为0.978. 综上, 本工作的研究对未来即时量子通信网络的大规模应用以及多协议高速QKD的发展都有很好的参考价值.

      感谢南京邮电大学通信与信息工程学院张春辉老师和周星宇老师的帮助与讨论.

参考文献 (35)

目录

    /

    返回文章
    返回