%A 江天, 乔嘉林, 黄向东, 王建民 %T 开源软件中的大数据管理技术 %0 Journal Article %D 2020 %J 科技导报 %R 10.3981/j.issn.1000-7857.2020.03.007 %P 103-114 %V 38 %N 3 %U {http://www.kjdb.org/CN/abstract/article_15634.shtml} %8 2020-02-13 %X 随着谷歌文件系统和宽表结构为代表的技术打破依赖关系数据库管理海量数据的限制,以Apache Hadoop为代表的开源大数据管理系统软件新技术与系统不断涌现,并快速成熟应用。针对Apache开源社区中面向在线事务处理和在线分析处理场景的大数据管理软件,介绍了大数据管理中的数据存储、数据分区、副本机制、分布式协议等,并比较分析了分布式文件系统、键值库、时序数据库等典型分布式数据管理系统的优缺点。