Earth data science is combination of earth science and data science, and is a frontier cross field of earth science research and a paradigm shift of data-driven scientific discovery. This paper reviews the progress of big earth data research in 2020 from the aspects of earth data science program, scientific data governance, and earth science data sharing. It focuses on the Deep-Time Digital Earth Science Program, Big Earth Data Science Engineering Project and achievements in global data aggregation, authentication, repository, policies, standards, and identification, as well as practices of the earth science data centers, databases, data models, data integration, and data publishing. The paper also points out that it is still an urgent need to pay full attention to the rules of scientific data governance, promote the development of earth science big data programme, strengthen the establishment of earth science data ecology, and improve all aspects of cooperation in the field of earth science data.
WANG Juanle
,
WANG Yujie
,
ZHANG Min
,
JIANG Han
,
HONG Mengmeng
,
LI Shuhan
. Review of the progress of earth data science and sharing in 2020[J]. Science & Technology Review, 2021
, 39(1)
: 105
-114
.
DOI: 10.3981/j.issn.1000-7857.2021.01.008
[1] 程学旗, 梅宏, 赵伟, 等. 数据科学与计算智能:内涵、范式与机遇[J]. 中国科学院院刊, 2020, 35(12):1470-1481.
[2] Stephenson M H, Cheng Q, Wang C, et al. Progress towards the establishment of the IUGS Deep-time Digital Earth (DDE) programme[J]. Episodes Journal of International Geoscience, 2020, 43(4):1057-1062.
[3] 中国科学院战略性先导科技专项(A类). 地球大数据科学工程[J]. 中国科学院院刊, 2018, 33(8):760.
[4] Guo H, Nativi S, Liang D, et al. Big earth data science:an information framework for a sustainable planet[J]. International Journal of Digital Earth, 2020, doi:10.1080/17538947.2020.1743785.
[5] 郭华东. 地球大数据:科学工程数据共享蓝皮书(2019)[M]. 北京:科学出版社, 2020.
[6] Guo H. Big earth data facilitates sustainable development goals[J]. Big Earth Data, 2020, 4(1):1-2.
[7] International Science Council-Would Data System. Data together final version march 2020 Final[EB/OL]. (2020-03-30)[2021-01-07]. https://www.worlddatasystem.org/news/files/DataTogetherFinalVersionMarch2020FINAL.pdf.
[8] Mokrane M, Hugo W, Harrison S. WDS/DSA Certification-International collaboration for a trustworthy research data infrastructure[C]//EGU:General Assembly, 2016.
[9] 王卷乐, 王祎, 卜坤, 等. 世界数据系统CoreTrustSeal数据中心认证实践——以WDC可再生资源与环境数据中心为例[J]. 农业大数据学报, 2019, 1(3):71-81.
[10] Lin D, Crabtree J, Dillo I, et al. The TRUST Principles for digital repositories[J]. Scientific Data, 2020, 7:144.
[11] 中华人民共和国国务院办公厅. 科学数据管理办法[EB/OL]. (2018-04-02)[2021-01-02]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
[12] 中华人民共和国交通运输部办公厅. 交通运输科学数据管理办法(征求意见稿)[EB/OL]. (2020-06-18)[2021-01-02]. http://xxgk.mot.gov.cn/jigou/kjs/202006/t20200623_3398111.html.
[13] 中国气象局. 风云气象卫星数据管理办法(试行)[EB/OL]. (2018-07-06)[2021-01-02]. http://www.gov.cn/gongbao/content/2018/content_5350059.htm.
[14] 王卷乐, 石蕾, 徐波, 等. 我国科学数据标准体系研究[J]. 中国科技资源导刊, 2020, 52(5):45-51, 77.
[15] 中华人民共和国科学技术部. 科技资源标识体系培训工作会在京召开[EB/OL]. (2020-12-02)[2021-01-02]. http://www.most.gov.cn/kjbgz/202012/t20201202_159970.htm.
[16] 邓怡颖, 樊隽轩, 王玥, 等. 古生物学数据库现状与数据驱动下的科学研究[J]. 高校地质学报, 2020, 26(4):361-383.
[17] 张蕾, 钟瀚霆, 陈安清, 等. 大数据驱动下的数字古地理重建:现状与展望[J]. 高校地质学报,2020(1):73-85.
[18] 蒋璟鑫, 李超, 胡修棉. 沉积学数据库建设与沉积大数据科学研究进展:以macrostrat数据库为例[J]. 高校地质学报, 2020, 103(01):29-45.
[19] 信俊昌, 王国仁, 李国徽, 等. 数据模型及其发展历程[J]. 软件学报, 2019, 30(1):142-163.
[20] 李鸿飞, 杜溢墨, 曾熠, 等. 异构混合存储的软硬件协同数据放置策略[J]. 国防科技大学学报, 2020, 42(2):64-71.
[21] Liu J, Wang W, Zhong H. Earth Data Miner:A cloudbased big earth data intelligence analysis platform[J]. IOP Conference Series:Earth and Environmental Science, 2020, 509(1):012032.
[22] 沈志宏, 赵子豪, 王海波. 以图为中心的新型大数据技术栈研究[J]. 数据分析与知识发现, 2020, 4(7):50-65.
[23] 王瑞丹, 高孟绪, 石蕾, 等. 对大数据背景下科学数据开放共享的研究与思考[J]. 中国科技资源导刊, 2020, 52(1):1-5.
[24] 王卷乐, 石蕾, 王玉洁, 等. 科学数据汇聚的模式分析及对我国的发展建议[J]. 地球科学进展, 2020, 35(8):839-847.
[25] Data Cite. Repository Finder[EB/OL].[2021-01-02]. https://repositoryfinder.datacite.org.
[26] 马军花, 段宗奇, 刘闯."全球变化科学研究数据出版系统" 被美国地球物理学会认定为该学会学术期刊关联原创数据仓储中心全球变化[J]. 数据学报(中英文), 2019, 3(3):305-307, 415-417.
[27] 国家青藏高原科学数据中心. 国家青藏高原科学数据中心成为国内首个通过Nature数据期刊Scientific Data认证的数据仓储中心[EB/OL]. (2020-10-02)[2021-01-02]. https://data.tpdc.ac.cn/zh-hans/news/80e2911c-9a6f-4bf5-a363-ed30fb06a18e.
[28] 中国科学院计算机网络中心. 国内首家:ScienceDB成为Nature推荐通用存储库[EB/OL]. (2020-10-02)[2021-01-02]. http://www.cnic.cas.cn/xwdt/zhxw/202010/t20201010_5714666.html.