投稿日: Jul 15, 2020
NCBI (National Center for Bioinformatics)、ジョンズホプキンス大学、テキサス大学サウスウエスト校、米国海洋大気庁 (NOAA)、米国国立がん研究所、National Herbarium of New South Wales などからの 23 の新規または更新されたアマゾン ウェブ サービス (AWS) パブリックデータセットが、次のカテゴリで利用できるようになりました。
新型コロナウイルス (COVID-19) への対応:
- 分子科学ソフトウェア研究所の COVID-19 分子構造および治療学のハブ
- アメリカ国立生物工学情報センターの COVID-19 ゲノム配列データセット
ライフサイエンス:
- ジョンズホプキンズ大学およびテキサス大学サウスウエスト校のクラウドゲノムインデックス
- バージニア大学の Refgenie ゲノムアセット
- 米国国立がん研究所の Gabriella Miller Kids First Pediatric Research Program
- 米国国立がん研究所の Cancer Genome Atlas
- 米国国立医学図書館の Basic Local Alignment Sequence Tool (BLAST) データベース
- Royal Botanic Gardens and Domain Trust の National Herbarium of New South Wales
気象:
- NOAA の National Blend of Models
- 米国海洋大気庁の国内デジタル予報データベース
- Unidata が管理する NOAA の NEXRAD Level 3
- マサチューセッツ工科大学の Storm EVent ImageRy (SEVIR)
- コネチカット大学の Eversource Energy Center の RAPID NRT 洪水マップ
- 国立再生可能エネルギー研究所の Tracking the Sun
- 国立再生可能エネルギー研究所のUS Wave データセット
地理空間:
- New Jersey Office of Information Technology の ニュージャージー州全域のデジタル航空写真カタログと LiDAR データ
- NOAA の Crowd Sourced Bathymetry (CSB)
- GeoSampa の Prefeitura Municipal de São Paulo (PMSP) LiDAR ポイントクラウド
- Meteorological Environmental Earth Observation の Sentinel-3
機械学習:
- CosmiQ Works の RarePlanes
- Amazon の多言語アマゾンレビューコーパス
- Alexa 音声ショッピングによる回答変更
- Alexa 音声ショッピングによる製品質疑応答システムのユーモア検出
AWS パブリックデータセットプログラムでは、一般に利用できるクラウド向けに最適化された価値の高いデータセットのストレージコストを AWS が負担しています。私たちは、以下を追及しているデータプロバイダーと協力しています。
- AWS で分析できるようにすることで、誰でもデータにアクセスできるようにする。
- 新しいクラウドネイティブのテクニック、フォーマット、ツールを開発して、データ操作にかかるコストを削減する。
- 共有データセットへのアクセスからメリットを得るコミュニティの開発を奨励する。