IETF是全球互联网较权威的技术标准化组织。为分析IETF各个专业领域内的标准化专家,更好地掌握当前互联网标准的研究热点,设计了挖掘IETF专家社区的原型系统。该系统可对IETF的多种数据来源进行针对性的解析和存储,对数据进行清洗和合并,利用优化和改进后的Louvain算法进行社区发现,从而将专家划分到多个不同的互联网专业领域方向,随后挖掘出各个专业领域内的活跃专家,并采用TF-IDF算法挖掘出研究热点,能为制定互联网国际标准提供准确的动态信息。
The IETF is a relatively authoritative technical standardization organization in the global Internet. In order to analyze the standardization experts in various professional fields in the IETF and identify the research hotspots of the current Internet standards, a prototype for discovering the communities of the IETF experts is designed. This system analyzes and stores various data sources of the IETF, cleans and merges the data, and uses the optimized and improved Louvain algorithm for the community discovery. Then the system divides the experts into a number of different Internet professional fields, and mines the active experts in various professional fields, and uses the TF-IDF algorithm to mine its research hotspots. So the system can provide accurate and dynamic information for China to develop the Internet international standards.
[1] 刘东信, 朱崇业. 英文版科技期刊审稿和组稿专家的遴选——基于SCI数据库高特征因子(Eigenfactor)期刊的分析[J]. 中国科技期刊研究, 2012, 23(3):369-372.
[2] 蒲姗姗. 基于知识互补的科研合作专家推荐模型研究[J]. 情报理论与实践, 2018, 41(8):96-101.
[3] 李江, 李东, 冯培桦, 等. 基于专长吻合度、学术影响力与社会关联值的专家推荐模型研究[J]. 情报学报, 2017, 36(4):338-345.
[4] IETF. IETF About[EB/OL]. (2009-07-17)[2019-01-20]. https://www.ietf.org/about.
[5] 中国通信标准化协会. Internet工程任务组[EB/OL]. (2004-02-12)[2019-01-20]. http://www.ccsa.org.cn/organization/intro.php?org=IETF.
[6] Girvan M, Newman M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences, 2002, 99(12):7821-7826.
[7] Vincent D B, Jean-Loup G, Renaud L, et al. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics:Theory and Experiment, 2008, 2008(10):155-168.
[8] 吴祖峰, 王鹏飞, 秦志光, 等. 改进的Louvain社团划分算法[J].电子科技大学学报, 2013, 42(1):105-108.
[9] Traag V A. Faster unfolding of communities:Speeding up the louvain algorithm[J]. Physical Review E, Statistical, Nonlinear and Soft Matter Physics, 2015, 92(3):032801.
[10] 吴卫江, 李沐南, 李国和. Louvain算法的并行化处理[J]. 计算机与数字工程, 2016, 44(8):1402-1406.
[11] 李贤, 许大卫. 基于聚类中心度的网络数据划分研究[J]. 自动化技术与应用, 2018, 37(9):86-90.
[12] 陈启伟. 基于IETF的互联网国际组织社交数据挖掘方法研究[D]. 北京:中国科学院大学计算机网络信息中心, 2018.
[13] 李沐南. Louvain算法在社区挖掘中的研究与实现[D]. 北京:中国石油大学, 2016.
[14] 郝树魁. Hadoop HDFS和MapReduce架构浅析[J]. 邮电设计技术, 2012(7):37-42.
[15] 杨煜, 赵成贵. 基于Hadoop MapReduce并行近似谱聚类算法研究与实现[J]. 计算机应用与软件, 2015, 32(8):17-21.
[16] 李玉林, 董晶. 基于Hadoop的MapReduce模型的研究与改进[J]. 计算机工程与设计, 2012, 33(8):3110-3116.
[17] Newman M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E, 2004, 69(6):066133.
[18] Girvan M, Newman M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12):7821-7826.
[19] Illes J F, Daniel A, Gergely P, et al. Weighted network modules[J]. New Journal of Physics, 2007, 9(6):180.
[20] Newman M E J. Analysis of weighted networks[J]. Physical Review E, 2004, 70(5):056131.
[21] 夏玮, 杨鹤标. 改进的Louvain算法及其在推荐领域的研究[J]. 信息技术, 2017(11):125-128.
[22] 钮瑗瑗, 程国振, 齐超, 等. 基于遗忘曲线的用户影响力时效性度量方法[J]. 计算机应, 2017, 37(S1):18-22.
[23] 李桃迎, 张鑫, 陈燕. 基于艾宾浩斯遗忘曲线的零售商品模糊关联分析[J]. 计算机应用研究, 2018, 35(2):462-465.
[24] 于洪, 李转运. 基于遗忘曲线的协同过滤推荐算法[J]. 南京大学学报(自然科学版), 2010, 46(5):520-527.
[25] 蒋永新, 孙爱莉. 基于tf-idf方法的图情学核心期刊学科特征分析[J]. 情报资料工作, 2009(1):89-92.
[26] 路永和, 李焰锋. 改进TF-IDF算法的文本特征项权值计算方法[J]. 图书情报工作, 2013,57(3):90-95.