中国科学院日前发布了地球大数据共享服务平台。这一平台以共享方式为全球用户提供系统、多元、动态、连续并具有全球唯一标识规范化的地球大数据,通过建立数据、计算与服务为一体的数据共享系统,推动形成地球科学数据共享新模式。
这一平台是中国科学院A类战略性先导科技专项“地球大数据科学工程”2018年度成果。专项负责人郭华东院士介绍,目前共享数据总量约5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库49万条数据记录、中国生物物种名录360万条、微生物资源数据库42万条、组学数据目前在线10亿条。目前用户能够在线检索到40%数据,随着硬件条件不断完善,平台数据将陆续上线,并且每年将以3PB的数据量进行更新。
此次重点发布的是地球大数据共享服务平台的两个核心系统——数据共享服务系统、数据银行(CASEarth Databank)系统,以及一个区域系统——数字丝路地球大数据系统。
数据共享服务系统是地球大数据专项数据资源发布及共享服务的门户窗口。它基于专项数据特点,可提供项目分类、关键词检索、标签云过滤、数据关联推荐等多种数据发现模式,同时提供在线下载、应用程序编程接口访问等多种数据获取模式,支持可定制的多格式数据在线查看、预览和查询,并能够应对各种个性化需求,进行统计、收藏、推荐、下载和评价服务。
CASEarth Databank系统提供长时序的多源对地观测数据即得即用产品集,包括1986年中国遥感卫星地面站建设以来20万景(每景12种产品,共计240万个产品)的长时序陆地卫星数据产品,基于高分卫星1/2、资源3号卫星等国产高分辨率遥感卫星数据制作的2米分辨率动态全国一张图,利用高分卫星、陆地卫星等国内外卫星数据制作的30米分辨率动态全球一张图,以及重点区域的亚米级即得即用产品集等。
数字丝路地球大数据系统,包括“一带一路”区域资源、环境、气候、灾害、遗产等专题数据集94套、自主知识产权数据产品57类、共享数据超过120万亿字节。
“地球大数据科学工程”于2018年1月1日正式启动实施,执行期5年。来自国内外多个学科领域的129家科研单位的1200余名研究人员,共同致力于构建包含资源、环境、生物、生态等多个领域的大数据与云服务共享平台,最终目标是建成国际地球大数据科学中心。