投稿日: Oct 16, 2018
ライフサイエンス、環境科学、機械学習、シビックテック、マルチメディア、サイバーでキュリティに関心がある研究者や開発者向けに、19 の新たな AWS パブリックデータセットを利用できるようになりました。
ライフサイエンス:
- Tabula Muris (提供元: Chan Zuckerberg Biohub)
- 細胞蛍光染色画像コレクション、GATK テストデータ、Broad Genome Reference (提供元: Broad Institute)
機械学習:
- 画像分類、画像のローカライズ、自然言語処理、COCO データセット (提供元: Fast.ai)
- KITTI Vision Benchmark Suite (提供元: Karlsruhe Institute of Technology)
環境:
- DWD ICON Global、DWD ICON-EU、DWD COSMO-D2 の天候モデル (提供元: ドイツ気象局)
- NOAA Global Ensemble Forecast System (提供元: NOAA Big Data Project)
- NOAA Operational Forecast System (提供元: NOAA Big Data Project)
- Downscaled Climate Data for Alaska (提供元: Arctic Research Center, University of Alaska)
シビックテック:
- IChangeMyCity 苦情データ (提供元: Janaagraha Centre for Citizenship and Democracy)
サイバーセキュリティ:
- Forward DNS ANY データセット (提供元: Rapid7)
- A Realistic Cyber Defense Dataset (提供元: Canada's Communications Security Establishment and the Canadian Institute for Cybersecurity)
マルチメディア:
- Xiph.Org Test Media (提供元: Xiph.Org)
AWS パブリックデータセットプログラムにより、クラウド向けに最適化された、価値が高いデータセットを一般公開するためのストレージの費用は、AWS が負担します。私たちは、以下を追及しているデータプロバイダーと協力しています。
- AWS で分析できるようにすることで、誰でもデータにアクセスできるようにする。
- 新しいクラウドネイティブのテクニック、フォーマット、ツールを開発して、データ操作にかかるコストを削減する。
- 共有データセットへのアクセスからメリットを得るコミュニティの開発を奨励する。
AWS パブリックデータセットプログラムにデータセットを提案する方法をご覧ください。