智能情报分析中数据与算法风险识别模型构建研究
张涛1 , 马海群2
1.黑龙江大学信息管理学院,哈尔滨 150080 2.黑龙江大学信息资源管理研究中心,哈尔滨 150080
Research on the Construction of Data and Algorithm Risk Identification Model in Intelligent Intelligence Analysis
Zhang Tao1 , Ma Haiqun2
1.School of Information Management, Heilongjiang University, Harbin 150080 2.Research Center of Information Resource Management, Heilongjiang University, Harbin 150080
摘要 人工智能的本质是对数据与算法的利用,当前人工智能视域下的情报分析在为管理决策带来便捷的同时,其数据与算法风险问题尤为突出。为化解此类风险给情报工作带来的影响,风险识别研究具有重要的现实意义。本文基于风险社会理论、监管沙盒理论构建“数据-算法-流程”的智能情报分析风险识别模型。以本课题团队参与沙盒测试的“领域热点主题识别及演化分析项目”为例,对该智能情报分析项目中数据与算法风险进行识别,通过实证验证了模型的有效性,最后为政府提出指导防范与化解重大安全风险的对策建议。
关键词 :
智能情报分析 ,
数据风险 ,
算法风险 ,
风险识别
收稿日期: 2021-09-29
基金资助: 国家社会科学基金重点项目“总体国家安全观下的国家情报工作制度创新研究”(20ATQ004)。
作者简介 : 张涛,男,1981年生,博士研究生,副教授,硕士生导师,研究方向为文本计算与数据分析;马海群,男,1964年生,博士,教授,博士生导师,研究方向为信息政策与法律,E-mail:mahaiqun@sina.com.c;
1 张涛, 马海群. 智能情报分析中算法风险及其规制研究[J]. 图书情报工作, 2021, 65(12): 47-56. 2 钱学森. 1993年8月8日致戴汝为[M]// 钱学森书信. 北京: 国防工业出版社, 2007: 311-313. 3 王飞跃. 从激光到激活: 钱学森的情报理念与平行情报体系[J]. 自动化学报, 2015, 41(6): 1053-1061. 4 李广建, 罗立群. 计算型情报分析的进展[J]. 中国图书馆学报, 2019, 45(4): 29-43. 5 李广建, 江信昱. 论计算型情报分析[J]. 中国图书馆学报, 2018, 44(2): 4-16. 6 陈雪飞, 李辉, 靳晓宏, 等. 计算情报初探[J]. 情报理论与实践, 2020, 43(3): 11-16, 70. 7 胡昌平, 吕美娇. 大数据与智能环境下的情报学理论发展[J]. 情报理论与实践, 2020, 43(10): 1-6. 8 栗琳, 孙敏. 数据智能技术驱动的情报全流程变革及发展[J]. 情报理论与实践, 2020, 43(10): 7-12. 9 邱韵霏, 李春旺. 智能情报分析模式: 数据驱动型与知识驱动型[J]. 情报理论与实践, 2020, 43(2): 28-34. 10 化柏林, 李广建. 智能情报分析系统的架构设计与关键技术研究[J]. 图书与情报, 2017(6): 74-83. 11 曾文, 李辉, 李荣, 等. 数据工程视角下的智能情报分析与应用探索[J]. 情报理论与实践, 2018, 41(7): 31-34, 59. 12 孙建军, 李阳. 论情报学与情报工作“智慧”发展的几个问题[J]. 信息资源管理学报, 2019, 9(1): 4-8. 13 冯秋燕, 朱学芳. 人工智能在情报工作中的应用研究[J]. 情报理论与实践, 2019, 42(11): 27-33. 14 牛海波, 栗琳. 智能时代情报工作展望[J]. 情报理论与实践, 2020, 43(1): 12-17. 15 曾庆华, 陈成鑫. 基于综合集成方法的反恐情报分析系统构建[J]. 情报杂志, 2018, 37(4): 27-32. 16 丁晓蔚, 苏新宁. 基于区块链可信大数据人工智能的金融安全情报分析[J]. 情报学报, 2019, 38(12): 1297-1309. 17 王天尧, 吴素彬. 人工智能在军事情报工作中的应用现状、特点及启示[J]. 飞航导弹, 2020(4): 46-51. 18 黄云芳, 王秉. 智能安全情报分析模型的构建[J]. 情报理论与实践, 2020, 43(11): 59-64. 19 唐晓波, 郑杜, 谭明亮. 融合情报方法论与人工智能技术的企业竞争情报系统模型构建[J]. 情报科学, 2019, 37(7): 118-124, 162. 20 曾子明, 王婧. 社会计算视角下突发事件智能情报服务研究——以上海外滩踩踏事件为例[J]. 情报杂志, 2017, 36(11): 59-64, 77. 21 魏薇, 景慧昀, 牛金行. 人工智能数据安全风险及治理[J]. 中国信息安全, 2020(3): 82-85. 22 曹惠民, 邓婷婷. 政府数据治理风险及其消解机制研究[J]. 电子政务, 2021(1): 81-91. 23 李维杰, 穆琳, 桂畅旎. 网络社会数据风险识别与应对[J]. 北京邮电大学学报(社会科学版), 2018, 20(6): 25-33. 24 郑岩. 数字金融背景下个人金融数据风险监管问题[J]. 沈阳师范大学学报(社会科学版), 2021, 45(2): 38-45. 25 郝文强. 政府数据开放隐私风险识别机制研究[J]. 电子政务, 2021(3): 103-111. 26 Micheli M, Ponti M, Craglia M, et al. Emerging models of data governance in the age of datafication[J]. Big Data & Society, 2020, 7(2). doi: 10.1177/2053951720948087. 27 Jones K H, Ford E M, Lea N, et al. Toward the development of data governance standards for using clinical free-text data in health research: position paper[J]. Journal of Medical Internet Research, 2020, 22(6): e16760. 28 Mendon?a Silva M, Poleto T, Camara e Silva L, et al. A grey theory based approach to big data risk management using FMEA[J]. Mathematical Problems in Engineering, 2016, 2016: Article ID 9175418. 29 Olaitan O, Herselman M, Wayi N. A data governance maturity evaluation model for government departments of the Eastern Cape Province, South Africa[J]. South African Journal of Information Management, 2019, 21(1): a996. 30 贾开. 人工智能与算法治理研究[J]. 中国行政管理, 2019(1): 17-22. 31 徐凤. 人工智能算法黑箱的法律规制——以智能投顾为例展开[J]. 东方法学, 2019(6): 78-86. 32 姜野. 算法的法律规制研究[D]. 长春: 吉林大学, 2020. 33 彭兰. 假象、算法囚徒与权利让渡: 数据与算法时代的新风险[J]. 西北师大学报(社会科学版), 2018, 55(5): 20-29. 34 张爱军, 李圆. 人工智能时代的算法权力: 逻辑、风险及规制[J]. 河海大学学报(哲学社会科学版), 2019, 21(6): 18-24, 109. 35 Yang J. Effects of bias and opacity of artificial intelligence algorithms on legal decision making and its discipline[J]. Korean Lawyers Association Journal, 2017, 66: 60-105. 36 Simoncini A. The unconstitutional algorithm: artificial intelligence and the future of liberties[J]. Biolaw Journal-Rivista di Biodiritto, 2019(1): 63-89. 37 Giuffrida I. Liability for AI decision-making: some legal and ethical considerations[J]. Fordham Law Review, 2019, 88(2): 439-456. 38 Zuiderveen Borgesius F J. Strengthening legal protection against discrimination by algorithms and artificial intelligence[J]. The International Journal of Human Rights, 2020, 24(10): 1572-1593. 39 Beck U. World risk society[M]. Cambridge: Polity Press, 1999. 40 Financial Conduct Authority (FCA). Regulatory sandbox[R]. London: Financial Conduct Authority, 2015. 41 卢新瑞. 2018版ISO31000《风险管理指南》综述与解析[J]. 中国商论, 2018(20): 165-166. 42 惠志斌, 李佳. 人工智能时代公共安全风险治理[M]. 上海: 上海社会科学院出版社, 2021. 43 孙雅静, 赵旭, 颜学雄, 等. 面向数据泄漏的Web沙箱测试方法[J]. 计算机科学, 2017, 44(S2): 322-328. 44 周若涵. 数据安全风险对国家安全的挑战及法律应对[C]// 《上海法学研究》集刊——上海市法学会国家安全法治研究小组文集. 上海: 上海市法学会, 2021: 15-22. 45 曾文, 李辉, 李荣, 等. 数据工程视角下的智能情报分析与应用探索[J]. 情报理论与实践, 2018, 41(7): 31-34, 59. 46 黄震, 张夏明. 监管沙盒的国际探索进展与中国引进优化研究[J]. 金融监管研究, 2018(4): 21-39. 47 钱鸿生. 基于风险管理的软件生命周期模型研究[D]. 上海: 同济大学, 2006. 48 苏新宁. 情报学学科话语体系建设[J]. 信息资源管理学报, 2021, 11(2): 10-11. 49 Jiang L, Zhang T, Huang T H, et al. Empirical research of hot topic recognition and its evolution path method for scientific and technological literature[J]. Journal of Advanced Computational Intelligence and Intelligent Informatics, 2022, 26(3): 299-308. 50 谭春辉, 熊梦媛. 基于LDA模型的国内外数据挖掘研究热点主题演化对比分析[J]. 情报科学, 2021, 39(4): 174-185. 51 张涛, 马海群, 易扬. 文本相似度视角下我国大数据政策比较研究[J]. 图书情报工作, 2020, 64(12): 26-37. 52 Blei D, Ng A, Jordan M. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1002. 53 Griffiths T L, Steyvers M. Finding scientific topics[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(suppl_1): 5228-5235. 54 武永亮, 赵书良, 李长镜, 等. 基于TF-IDF和余弦相似度的文本分类方法[J]. 中文信息学报, 2017, 31(5): 138-145. 55 王春柳, 杨永辉, 邓霏, 等. 文本相似度计算方法研究综述[J]. 情报科学, 2019, 37(3): 158-168. 56 中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要[N]. 人民日报, 2021-03-13(1). 57 苏新宁. 大数据时代情报学学科崛起之思考[J]. 情报学报, 2018, 37(5): 451-459. 58 邓建鹏, 李雪宁. 监管沙盒的国际实践及其启示[J]. 陕西师范大学学报(哲学社会科学版), 2019, 48(5): 62-76.