投稿日: Apr 11, 2019
以下のカテゴリにおいて 18 の新しいまたは更新された AWS パブリックデータセットが利用可能になりました。
天文学:
- ワシントン大学の 再イオン化の電波天文学データセット
- エディンバラ大学天文学研究所の LOFAR ELAIS-N1 サイクル 2 観測電波天文学データセット
生物学:
- John Irwin 氏の ZINC15 3D 分子ドッキングモデル
- Vertebrate Genomes Project の Genome Ark
- ENCODE Data Coordinating Center の DNA エレメントの百科事典 (ENCODE) データセット
- カリフォルニア大学サンタクルーズ校の Human PanGenomics Project
災害対策:
- シンガポールの南洋理工大学の Sentinel-1 シングルルック複素画像 (S1 SLC) データセット (南アジア、東南アジア、台湾、日本用)
- Grillo の 地震早期警報システム (OpenEEW)
百科事典:
- Software Heritage の Software Heritage Graph Dataset
環境:
- アメリカ国立再生可能エネルギー研究所 (NREL) のWind Integration National Dataset (WIND)
- アメリカ国立再生可能エネルギー研究所 (NREL) のNational Solar Radiation Data Base
- コーネル大学鳥類学研究室の eBird Status and Trends モデル結果
- Quantitative Engineering Design の Africa Soil Information Service (AfSIS) Soil Chemistry
機械学習:
- ペンシルバニア大学の Massively Multilingual Image Dataset は 98 言語のデータに拡張
- Broader Web-Scale Provision of Parallel Corpora for European Languages の Paracrawl
気象:
- NOAA の Global Forecast System (GFS v2.0 & v3.0)
- OpenMeteoData の Météo-France モデル
規制:
- Applied Nonprofit Research の IRS 990 Filings (スプレッドシート版)
AWS パブリックデータセットプログラムでは、一般に公開される高価値でクラウド向けに最適化されたデータセットのストレージコストを AWS が負担します。私たちは、以下を追及しているデータプロバイダーと協力しています。
- AWS で分析できるようにすることで、誰でもデータにアクセスできるようにする。
- 新しいクラウドネイティブのテクニック、フォーマット、ツールを開発して、データ操作にかかるコストを削減する。
- 共有データセットへのアクセスからメリットを得るコミュニティの開発を奨励する。
変更 (2021 年 12 月 9 日) - 優れたエクスペリエンスを保証する取り組みの一環として、この記事の期限切れリンクを更新、または元の記事から削除しました。