投稿日: Jan 14, 2021
Illumina、アラスカ大学フェアバンクス校、IntelinAir などから提供されている 18 の新規または更新済みデータベースを次のカテゴリのオープンデータのレジストリで利用できます。
ライフサイエンス:
- Illumina, Inc. の 1000 Genomes Phase 3 Reanalysis with DRAGEN 3.5
- アマゾン ウェブ サービス (AWS) が管理する BindingDB
- コーネル大学 (Center for Conservation Bioacoustics) の Sounds of Central African Landscapes
- 更新: アメリカ国立標準技術研究所の Genome In A Bottle
地理空間:
- IntelinAir の AgricultureVision
- Singerise が管理する Copernicus Digital Elevation Model
- アラスカ大学フェアバンクス校の High Resolution Downscaled Climate Data for Southeast Alaska
気候と天気:
- IDEAM の IDEAM Colombian Radar Network
- アメリカ海洋大気庁 (NOAA) の Global Forecast System Warm Start Initial Conditions
- NOAA のUnified Forecast System Subseasonal to Seasonal prototype 5
- UCLA の WRF Downscaled Coupled Model Intercomparison Project 6 (CMIP6)
- 更新: NOAA の High-Resolution Rapid Refresh Archive (ユタ大学が Zarr 形式で管理)
- 更新: Earth Science Grid Federation (ESGF) が NetCDF 形式で管理する Coupled Model Intercomparison Project 6 (CMIP6)
- 更新: NOAA の National Water Model Reanalysis (Zarr 形式)
機械学習:
- AWS の DialogLUE
- ミネソタ大学の Natural Scenes Dataset
- Sophos AI の Sophos/ReversingLabs 20 Million Malware Detection Dataset
- Dirceu G Silva の CoversBR - A Large Dataset for Cover Song Identification
AWS オープンデータスポンサーシッププログラムでは、公開されているクラウド向けに最適化された高価値データセットのストレージのコストを AWS が負担しています。私たちは、以下を追及しているデータプロバイダーと協力しています。
- AWS で分析できるようにすることで、誰でもデータにアクセスできるようにする。
- 新しいクラウドネイティブのテクニック、フォーマット、ツールを開発して、データ操作にかかるコストを削減する。
- 共有データセットへのアクセスからメリットを得るコミュニティの開発を奨励する。