게시된 날짜: Jan 14, 2021
Illumina, University of Alaska Fairbanks, IntelinAir 등에서 제공하는 다음 범주의 18가지 신규 및 업데이트된 데이터 세트를 Registry of Open Data에서 사용할 수 있습니다.
생명 과학:
- 1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5(Illumina, Inc. 제공)
- BindingDB(AWS(Amazon Web Services)에서 관리)
- Sounds of Central African Landscapes(Cornell University의 Center for Conservation Bioacoustics 제공)
- 업데이트됨: Genome In A Bottle(National Institute of Standards and Technology 제공)
지리 공간:
- AgricultureVision(IntelinAir 제공)
- Copernicus Digital Elevation Model(Singerise에서 관리)
- Southeast Alaska를 위한 High Resolution Downscaled Climate Data(University of Alaska Fairbanks 제공)
기후 및 날씨:
- IDEAM Colombian Radar Network(IDEAM 제공)
- Global Forecast System Warm Start Initial Conditions(NOAA(National Oceanic and Atmospheric Administration) 제공)
- Unified Forecast System Subseasonal to Seasonal prototype 5(NOAA 제공)
- WRF Downscaled Coupled Model Intercomparison Project 6(CMIP6)(UCLA 제공)
- 업데이트됨: High-Resolution Rapid Refresh Archive(NOAA 제공, University of Utah에서 관리하는 Zarr 형식)
- 업데이트됨: Coupled Model Intercomparison Project 6(CMIP6) (ESGF(Earth Science Grid Federation)에서 관리하는 NetCDF 형식)
- 업데이트됨: National Water Model Reanalysis(NOAA에서 제공하는 Zarr 형식)
기계 학습:
- DialogLUE(AWS 제공)
- Natural Scenes Dataset(University of Minnesota 제공)
- Sophos/ReversingLabs 20 Million Malware Detection Dataset(Sophos AI 제공)
- CoversBR - A Large Dataset for Cover Song Identification(Dirceu G Silva 제공)
AWS Open Data 스폰서십 프로그램은 공개적으로 사용 가능한 클라우드에 최적화된 고가치 데이터 세트에 대한 스토리지 비용을 부담합니다. 이 프로그램은 다음을 추구하는 데이터 공급자를 대상으로 합니다.
- AWS에서 데이터를 분석에 사용할 수 있도록 하여 데이터 액세스를 민주화합니다.
- 데이터 작업 비용을 낮추는 새로운 클라우드 네이티브 기술, 형식 및 도구를 개발합니다.
- 공유 데이터 세트에 대한 액세스를 활용하는 커뮤니티의 개발을 장려합니다.