发布于: Jan 14, 2021
Registry of Open Data 中推出来自 Illumina、阿拉斯加大学费尔班克斯分校、IntelinAir 等机构的 18 个新数据集或更新数据集,分为以下几类。
生命科学:
- Illumina, Inc. 的 1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5
- Amazon Web Services (AWS) 托管的 BindingDB
- 康奈尔大学生物声学保护中心的 Sounds of Central African Landscapes
- 更新:国家标准技术局的 Genome In A Bottle
地理空间:
- IntelinAir 的 AgricultureVision
- Singeris 托管的 Copernicus Digital Elevation Model
- 阿拉斯加大学费尔班克斯分校的 High Resolution Downscaled Climate Data for Southeast Alaska
气候和气象:
- IDEAM 的 IDEAM Colombian Radar Network
- 国家海洋和大气管理局 (NOAA) 的 Global Forecast System Warm Start Initial Conditions
- NOAA 的 Unified Forecast System Subseasonal to Seasonal prototype 5
- UCLA 的 WRF Downscaled Coupled Model Intercomparison Project 6 (CMIP6)
- 更新:NOAA 的 High-Resolution Rapid Refresh Archive,采用 Zarr 格式,由犹他大学托管
- 更新:由 Earth Science Grid Federation (ESGF) 托管的 Coupled Model Intercomparison Project 6 (CMIP6),采用 NetCDF 格式
- 更新:NOAA 的 National Water Model Reanalysis,采用 Zarr 格式
机器学习:
- AWS 的 DialogLUE
- 明尼苏达大学的 Natural Scenes Dataset
- Sophos AI 的 Sophos/ReversingLabs 20 Million Malware Detection Dataset
- Dirceu G Silva 的 CoversBR - A Large Dataset for Cover Song Identification
AWS 开放数据赞助计划涵盖公开提供的高价值云优化型数据集的存储成本。我们与致力于以下目标的数据提供商合作:
- 让数据可在 AWS 上进行分析,以实现数据的普遍访问
- 开发新的原生云技术、格式和工具,以降低数据处理成本
- 鼓励从访问共享数据集中获益的社区实现发展