发布于: Oct 16, 2018
现在,我们为对生命科学、环境科学、机器学习、多媒体、公民科技和网络安全感兴趣的研究人员和开发人员提供了 19 种全新的 AWS 公用数据集。
生命科学:
- Chan Zuckerberg Biohub 的 Tabula Muris
- 布罗德研究所的 Cell Painting Image Collection、GATK Test Data 和 Broad Genome References
机器学习:
- fast.ai 的图像分类、图像定位、自然语言处理和 COCO 数据集
- 卡尔斯鲁厄理工学院的 KITTI Vision Benchmark Suite
环境:
- 德国国家气象局 (National Meteorological Service) 的 DWD ICON Global、DWD ICON-EU 和 DWD COSMO-D2 天气模型
- NOAA Big Data Project 提供的 NOAA 全球集合预报系统
- NOAA Big Data Project 提供的 NOAA 运营预测系统
- 阿拉斯加大学国际北极研究中心的阿拉斯加缩减规模气候数据
公民:
- Janaagraha Centre for Citizenship and Democracy 的 IChangeMyCity Complaints Data
网络安全:
- Rapid7 的 Forward DNS ANY Dataset
- 加拿大通讯安全局和加拿大网络安全研究院的 A Realistic Cyber Defense Dataset
多媒体:
- Xiph.Org 的 Xiph.Org Test Media
AWS 公用数据集计划涵盖公开提供的高价值云优化数据集的存储成本。我们与致力于以下目的的数据提供商合作:
- 让数据可在 AWS 上进行分析,以实现数据的普遍访问。
- 开发新的原生云技术、格式和工具,以降低数据处理成本。
- 鼓励从访问共享数据集中获益的社区实现发展。
了解如何向 AWS 公用数据集计划提供数据集。