Veröffentlicht am: Apr 11, 2019
18 neue oder aktualisierte öffentliche AWS-Datensätze sind jetzt in den folgenden Kategorien verfügbar:
Astronomie:
- Epoch of Reionization Radio Astronomy Dataset von der University of Washington
- LOFAR ELAIS-N1 Cycle 2 Observations Radio Astronomy Dataset vom Institute for Astronomy an der University of Edinburgh
Biologie:
- ZINC15 3D Molecular Docking Models von John Irwin
- Genome Ark vom Vertebrate Genomes Project
- Encyclopedia of DNA Elements (ENCODE) Dataset vom ENCODE Data Coordinating Center
- Human PanGenomics Project von der University of California in Santa Cruz
Katastrophenhilfe:
- Sentinel-1 Single Look Complex (S1 SLC) Dataset für Südasien, Südostasien, Taiwan und Japan von der Nanyang Technological University in Singapur
- Open Earthquake Early-Warnings (OpenEEW) von Grillo
Enzyklopädisch:
- Software Heritage Graph Dataset vom Software Heritage
Umwelt:
- Wind Integration National Dataset (WIND) vom U.S. National Renewable Energy Laboratory (NREL)
- National Solar Radiation Data Base vom U.S. National Renewable Energy Laboratory (NREL)
- eBird Status and Trends Model Results vom Cornell Lab of Ornithology
- Africa Soil Information Service (AfSIS) Soil Chemistry von Quantitative Engineering Design
Machine Learning:
- The Massively Multilingual Image Dataset von der University of Pennsylvania wurde auf Daten aus 98 Sprachen erweitert.
- Paracrawl von Broader Web-Scale Provision of Parallel Corpora for European Languages
Meteorologisch:
- Global Forecast System (GFS v2.0 & v3.0) von NOAA
- Météo-France Models von OpenMeteoData
Behördlich:
- IRS 990 Filings in Spreadsheets von Applied Nonprofit Research
Das AWS Public Dataset-Programm deckt die Kosten für die Speicherung von öffentlich verfügbaren hochwertigen Cloud-optimierten Datensätzen ab. Wir arbeiten mit Datenanbietern zusammen, die Folgendes anstreben:
- Den Zugriff auf Daten demokratisieren, indem diese für AWS-Analysen bereitgestellt werden.
- Neue cloud-native Techniken, Formate und Tools, die die Kosten für die Arbeit mit Daten senken, entwickeln.
- Entwicklung von Communitys ermutigen, die vom Zugriff auf freigegebene Datensätze profitieren.
Geändert am 9.12.2021 – Um ein großartiges Erlebnis zu gewährleisten, wurden abgelaufene Links in diesem Beitrag aktualisiert oder aus dem ursprünglichen Beitrag entfernt.