張貼日期: Apr 11, 2019
現在提供以下類別 18 個全新或更新的 AWS 公用資料集:
天文學:
- 華盛頓大學的 Epoch of Reionization Radio Astronomy Dataset
- 愛丁堡大學天文學研究所的 LOFAR ELAIS-N1 Cycle 2 Observations Radio Astronomy Dataset
生物學:
- John Irwin 的 ZINC15 3D Molecular Docking Models
- 脊椎動物基因體計劃的 Genome Ark
- ENCODE 資料協調中心的 Encyclopedia of DNA Elements (ENCODE) Dataset
- 加州大學聖塔克魯茲分校的 Human PanGenomics Project
災難應變:
- 新加坡南洋理工大學的 Sentinel-1 Single Look Complex (S1 SLC) dataset for South Asia, Southeast Asia, Taiwan, and Japan
- Grillo 的 Open Earthquake Early-Warnings (OpenEEW)
百科全書:
- Software Heritage 的 Software Heritage Graph Dataset
環境:
- 美國 Wind Integration National Dataset (WIND)美國國家再生能源實驗室 (NREL)
- 美國 National Solar Radiation Data Base美國國家再生能源實驗室 (NREL)
- 康乃爾鳥類學實驗室的 eBird Status and Trends Model Results
- Quantitative Engineering Design 的 Africa Soil Information Service (AfSIS) Soil Chemistry
機器學習:
- 賓州大學的 The Massively Multilingual Image Dataset 已擴展為包含 98 種語言的資料。
- Broader Web-Scale Provision of Parallel Corpora for European Languages 的 Paracrawl
氣象學:
- NOAA 的 Global Forecast System (GFS v2.0 & v3.0)
- OpenMeteoData 的 Météo-France Models
法規:
- Applied Nonprofit Research 的 IRS 990 Filings in Spreadsheets
上述高價值雲端優化公開資料集的儲存費用由 AWS 公用資料集計劃負擔。我們合作的資料供應單位均追求以下目標:
- 開放資料自由存取,讓使用者可在 AWS 上自行分析。
- 開發新雲端原生技術、格式和工具,降低資料使用成本。
- 以共用資料集的方式分享資源,促進社群發展。