随着人工智能技术在大数据与高性能计算的推动下飞速发展,涌现出大量创新性的方法,对现有的数据安全与脱敏方法带来了诸多挑战。从当今大数据与智能技术发展的现状入手,讨论了数据脱敏技术的内涵、工作流程、系统机制、典型脱敏案例,展望了未来数据脱敏技术的发展趋势,从技术、需求和法治、管理机制方面提出了一些数据脱敏的建议。
How to avoid the privacy and information leakage in the massive data is a widespread concern in the field of the big data and the information security. The data desensitization technology is one of the important means to solve this problem. In recent years, with the rapid development of the artificial intelligence technology driven by the big data and the high-performance computing, a large number of innovative methods were proposed, with many challenges to the existing data desensitization methods. This paper reviews the current situation of the big data and intelligent technology development, and the data desensitization technology, as well as the future development trends of the data desensitization technology.
[1] Bakken D E, Rarameswaran R, Blough D M, et al. Data obfuscation:Anonymity and desensitization of usable data sets[J]. IEEE Security and Privacy Magazine, 2004, 2(6):34-41.
[2] Lake B M, Salakhutdinov R, Tenenbaum J B. Human-level concept learning through probabilistic program induction[J]. Science, 2015, 350(6266):1332.
[3] Li G L, Wu J Li J H, et al. Service popularity-based smart resources partitioning for fog computing-enabled industrial internet of things[J]. IEEE Transactions on Industrial Informatics, 2018, 14(10):4702-4711.
[4] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436.
[5] 王鑫, 王电钢, 母继元,等. 基于机器学习的数据脱敏系统研究与设计[J]. 电力信息与通信技术, 2018(1):33-38.
[6] 卞超轶, 朱少敏, 周涛. 一种基于Spark的大数据匿名化系统实现[J]. 电信科学, 2018, 34(4):156-161.
[7] 乔宏明, 梁奂. 运营商面向大数据应用的数据脱敏方法探讨[J]. 移动通信, 2015(13):17-20.
[8] 包英明. 大数据平台数据安全防护技术[J]. 信息安全研究, 2019, 5(3):60-65.
[9] 徐焕, 查志勇, 罗弦, 等. 大数据环境下配电系统测试数据脱敏技术研究[J]. 机械设计与制造工程, 2019, 48(3):54-58.
[10] 陈天莹, 陈剑锋. 大数据环境下的智能数据脱敏系统[J]. 通信技术, 2016, 49(7):915-922.
[11] 胡荣磊, 何艳琼, 曾萍, 等. 一种大数据环境下医疗隐私保护方案设计与实现[J]. 信息网络安全, 2018(9):54-60.
[12] 王冬, 李文, 徐高升, 等. 一种大数据环境下的数据隐私保护策略及其实践[J]. 微型电脑应用, 2013(6):6-8.
[13] 叶水勇. 数据脱敏技术的探究与实现[J]. 电力信息与通信技术, 2019, 17(4):23-27.
[14] Kawahara J, Saitoh T, Yoshinaka R. The time complexity of permutation routing via matching, token swapping and a variant[J]. Journal of Graph Algorithms and Applications, 2019, 23(1):29-70.
[15] Mohseni M, Banani S A, Eckford A W, et al. Scheduling for VoLTE:Resource allocation optimization and lowcomplexity algorithms[J]. IEEE Transactions on Wireless Communications, 2019, 18(3):1534-1547.
[16] Li J H. Cyber security meets artificial intelligence:A survey[J]. Frontiers of Information Technology & Electronic Engineering, 2018, doi:10.1631/FITEE.1800573.
[17] 李盼, 赵文涛, 刘强, 等. 机器学习安全性问题及其防御技术研究综述[J]. 计算机科学与探索, 2018, 12(2), doi:10.3778/j.issn.1673-9418.1708038.
[18] Guan Z, Bian L, Shang T, et al. When machine learning meets security issues:A survey[C]//2018 IEEE International Conference on Intelligence and Safety for Robotics (ISR). Piscataway N J:IEEE, 2018, doi:10.1109/IISR.2018.8535799.
[19] 张雪芹, 张立, 顾春华. 社交网络中社会工程学威胁定量评估[J]. 浙江大学学报(工学版), 2019, 53(5):24-29.
[20] 崔星华. 基于局部特征的图像模式识别算法研究[J]. 吉林建筑工程学院学报, 2014, 31(6):52-54.
[21] 彭小圣, 邓迪元, 程时杰, 等. 面向智能电网应用的电力大数据关键技术[J]. 中国电机工程学报, 2015, 35(3):503-511.
[22] 吕军, 杨超, 王跃东, 等. 基于多业务场景的大数据脱敏技术研究及其在电力用户隐私信息保护中的应用[J]. 电力大数据, 2018, 21(7):34-40.
[23] 冉冉, 李峰, 王欣柳, 等. 一种面向隐私保护的电力大数据脱敏方案及应用研究[J]. 信息安全与技术, 2018, 21(7):105-113.
[24] 徐宗本. 用好大数据须有大智慧[N]. 人民日报, 2016-03-15(07).
[25] 程学旗, 靳小龙, 杨婧, 等. 大数据技术进展与发展趋势[J]. 科技导报, 2016, 34(14):49-59.
[26] 马茜, 谷峪, 张天成, 等. 一种基于数据质量的异构多源多模态感知数据获取方法[J]. 计算机学报, 2013, 36(10):2120-2131.
[27] 马新强, 刘勇, 范婧, 等. 大数据驱动下智慧城市建设的若干思考[J]. 科技导报, 2017, 35(21):133-139.