張貼日期: Oct 16, 2018
現在推出 19 個全新的 AWS 公用資料集,對生命科學、環境科學、機器學習、多媒體、公民科技和網路安全感興趣的研究人員和開發人員都能善加利用。
生命科學:
- Chan Zuckerberg Biohub 的 Tabula Muris
- 博德研究所的 Cell Painting Image Collection、GATK Test Data,以及 Broad Genome References
機器學習:
- fast.ai 的 Image classification、image localization、natural language processing 和 COCO 資料集
- 卡爾斯魯爾理工學院的KITTI Vision Benchmark Suite
環境:
- Deutscher Wetterdienst (德國國家氣象服務) 的 DWD ICON Global、DWD ICON-EU 和 DWD COSMO-D2 天氣模式
- 透過 NOAA Big Data Project 提供的 NOAA Global Ensemble Forecast System
- 透過 NOAA Big Data Project 提供的 NOAA Operational Forecast System
- 阿拉斯加大學國際北極研究中心的 Downscaled Climate Data for Alaska
公民:
- Janaagraha Centre for Citizenship and Democracy 的 IChangeMyCity Complaints Data
網路安全:
- Rapid7 的 Forward DNS ANY Dataset
- 加拿大通訊安全局和加拿大網絡安全學會的 A Realistic Cyber Defense Dataset
多媒體:
- Xiph.Org 的 Xiph.Org Test Media
上述高價值雲端優化公開資料集的儲存費用,由 AWS 公用資料集計劃負擔。我們合作的資料供應單位均追求以下目標:
- 開放資料自由存取,讓使用者可在 AWS 上自行分析。
- 開發新雲端原生技術、格式和工具,降低資料使用成本。
- 以共用資料集的方式分享資源,促進社群發展。
進一步了解如何為 AWS 公用資料集計劃提供資料集。