Lernen Sie Astro kennen – den verwalteten Apache-Airflow-Service von Astronomer, der in AWS entwickelt und gehostet wird

Wie war dieser Inhalt?

Damit Daten in einem modernen Unternehmen nützlich sind, müssen sie aus verschiedenen Quellen gesammelt und zentralisiert, über ein wachsendes Ökosystem von Tools verarbeitet und in einer Weise an Systeme im gesamten Unternehmen weitergeleitet werden, die von allen Teams genutzt werden kann. Diese Datenorchestrierung – das Weben von Geschäftslogik in den Datenstapel für alles von Dashboards bis zu Personalisierungsalgorithmen – erfordert Hunderte, wenn nicht Tausende von Datenpipelines.

Datenorchestrierung wird in allen Branchen und in Unternehmen jeder Größe benötigt. Mit mehr als 2 200 Mitwirkenden und über 12 Millionen monatlichen Downloads hat sich Apache Airflow zum Open-Source-Standard für die programmatische Erstellung, Planung und Überwachung von Datenpipelines entwickelt. Datenexperten schätzen Airflow wegen seiner Community, seiner Flexibilität und seiner Fähigkeit, einen zentralen Überblick über ein Datenökosystem zu bieten.

Datenteams brauchen jedoch natürlich mehr als das Open-Source-Programm Airflow allein – sie brauchen Testpipelines, um die Datenqualität zu gewährleisten, SDKs, um Datenexperten produktiv zu machen, und Beobachtbarkeit sowie eine Datenabfolge für die zugrunde liegenden Daten – auch wenn sie sich bemühen, den betrieblichen Aufwand zu minimieren. Die Datenabfolge liefert den vollständigen Kontext der Daten, indem sie die Beziehungen zwischen den Datenquellen, den Ursprung der Daten und ihre Umwandlung und Konvertierung im Laufe des Datenlebenszyklus detaillierter erfasst.

Den Bedarf an moderner Datenorchestrierung decken

Astronomer, ein 2018 gegründetes Startup, hat die letzten fünf Jahre damit verbracht, Airflow als Open-Source-Projekt mit Tools voranzutreiben, die Datenexperten dabei helfen, das Beste aus Datenorchestrierung und Datenverlauf herauszuholen. Das Flaggschiffprodukt von Astronomer, Astro, ermöglicht es Kunden, Datenpipelines auf Airflow als verwalteten Service zu erstellen, auszuführen und zu verfolgen, wodurch Datenteams mehr Zeit haben, sich auf das Schreiben von Geschäftsabläufen und die Erweiterung des Zugangs zu Daten zu konzentrieren.

„Viele grundlegende Geschäftsprozesse, die Astro für unsere Kunden orchestriert, werden von Amazon Web Services (AWS) unterstützt: Amazon Simple Storage Service (Amazon S3), Amazon Redshift, Amazon EMR, Amazon SageMaker und viele andere“, erklärt Viraj Parekh, Astronomer Field CTO.

Astronomer wurde von einem kleinen Team aus drei Freunden – Paola Peraza Calderon, Pete DeJoy und Viraj Parekh – gegründet und verfolgt derzeit eine dreifache Aufgabe:

  • Produkte zu entwickeln, die den Wert von Datenorchestrierung und Datenverlauf für Datenteams erhöhen.
  • Förderung des organischen Wachstums des Open-Source-Projekts Airflow und seiner Community.
  • Bereitstellung von Schulungen, bewährten Methoden und Unterstützung für Datenexperten, damit diese erfolgreich mit Daten arbeiten können.

Mit mehr als 350 Mitarbeitern und einem weltweit verteilten Team sind sowohl Astronomer als auch der Kundenstamm schnell gewachsen. „Es begann damit, dass Leute, die die Open-Source-Software Airflow einsetzen, uns um Hilfe bei der Verwaltung der dahinter stehenden Infrastruktur baten“, sagt Pete. „Jetzt, wo wir das Infrastrukturmanagement erledigt haben, konzentrieren wir uns auf das breitere Spektrum an Funktionen, die erforderlich sind, um Airflow als Grundlage für eine vollständige Orchestrierungsplattform zu nutzen.“

Aufbau und Skalierung in AWS

Der Marktbedarf für die Produkte von Astronomer und das Erfolgspotenzial des Unternehmens waren schon früh offensichtlich. Viraj lacht, als er eine Geschichte über die frühen Tage erzählt. „Wir hatten alle Hände voll zu tun, um ein Proof-of-Concept mit einem großen Spielehersteller durchzuführen. Das Unternehmen verließ sich auf Astronomer, um den Datenfluss für seinen größten Launch des Jahres zu orchestrieren. Am Morgen nach dem Start gab es keine Supportanfragen“, sagt Viraj. „Und ich dachte: Oh nein, ist etwas schief gelaufen? Es stellte sich aber heraus, dass etwas richtig gelaufen war. Alles funktionierte. Wir wickelten 100 % des Dateninputs ab, der von einem der größten Launches dieses Unternehmens herrührte, und alles lief reibungslos.“

Warum hat Astronomer sein Startup auf AWS aufgebaut? „Ich kann nicht sagen, dass es eine schwierige Entscheidung war. Es war die offensichtliche Wahl – AWS ist der Eckpfeiler unserer Cloud-Strategie“, sagt Paola. „Die Allgegenwärtigkeit der AWS-Services über Länder und Regionen hinweg ermöglicht es uns, mit Organisationen auf der ganzen Welt zusammenzuarbeiten. Sie erschließt unseren Markt im Alleingang.“

Um den wachsenden Anforderungen seines Kundenstamms gerecht zu werden, entwickelt Astronomer Schnittstellen, die es Datenexperten ermöglichen, bei der Entwicklung von Datenpipelines das Beste aus Airflow herauszuholen und sich einen einzigartigen Überblick über ihr Ökosystem zu verschaffen. Viraj erklärt: „Wir vereinen die Datenorchestrierung über jedes beliebige System – inklusive aller Tools und Services, die Ihr Team verwendet – mit dem Datenverlauf. Sie können nicht nur Daten über alle Ihre Systeme hinweg orchestrieren, sondern auch sehen, wie sich diese Daten bewegen.“

Wie im Architekturdiagramm dargestellt, basiert Astro auf einer Multi-Plane-Architektur, die aus einer von Astronomer gehosteten Steuerebene und einer Datenebene besteht, die in Ihrer Cloud oder in einem von Astronomer gehosteten Single-Tenant-Konto laufen kann:

Mit dem Wachstum von Astronomer hat das Unternehmen seine AWS-Präsenz skaliert, um die Anforderungen seiner Kunden zu erfüllen. Heute verlässt sich Astronomer auf Amazon Elastic Kubernetes Service (Amazon EKS), um Astro als verwalteten Service im Unternehmensnetzwerk eines Kunden zu betreiben, und unterstützt Tools wie AWS Transit Gateway und AWS Private Link, um eine sichere Verbindung zu anderen Datendiensten in ihrem Netzwerk herzustellen. Astro verwendet AWS CloudFormation für die Bereitstellung neuer Kubernetes-Cluster und Amazon S3 für die Speicherung von Protokollen und stellt den Kunden Knoten-Instances-Typen zur Verfügung, damit sie die optimale Hardware für ihre Pipelines auswählen können. Dies gibt Datenanwendern Optionen, Leistung und Effizienz, wo sie sie brauchen.

„Wir sind zuversichtlich, dass AWS mit dem Wachstum unseres Marktes und unserer Kundenbasis mitwachsen kann. Die Möglichkeit, AWS-Services genau auf unsere Bedürfnisse abzustimmen, hilft uns, Astro schneller, kostengünstiger und für unsere Kunden einfacher zu machen“, sagt Paola.

Aufbau eines erfolgreichen Startups

Für Startups, die ihren Erfolg wiederholen wollen, ist es nach Ansicht des Astronomer-Gründerteams entscheidend, Zeit mit den ersten Anwendern des Produkts zu verbringen. Dadurch entsteht eine enge Feedback-Schleife, die Ihr Produkt frühzeitig verbessert und oft zu starken persönlichen Beziehungen führt, die Sie während des gesamten Unternehmensaufbaus begleiten werden.

„Vor allem bei Startups in der Frühphase ist es sehr wahrscheinlich, dass die Personen, die Ihr Produkt zuerst annehmen, das Problem verstehen, das Sie zu lösen versuchen. Pflegen Sie diese Beziehungen im Laufe der Zeit, denn diese Kunden haben über Ihr Problem nachgedacht und nutzen Ihre Lösung schon so lange wie Sie selbst.“ – Viraj Parekh

„Stellen Sie viele Fragen – und stecken Sie viel Arbeit hinein. Um ein Unternehmen durch die Anfangsphase zu führen, muss man die Ärmel hochkrempeln, sich selbst weiterentwickeln und ein kleines Team um sich versammeln. So einfach es klingt, aber die Umsetzung macht den Unterschied zwischen vielen erfolgreichen Projekten aus.“ – Paola Peraza Calderon

„Während Ihr Unternehmen wächst, nimmt die Liste der zu erledigenden Dinge kein Ende. Es ist eine echte Kunst zu lernen, wie man die Punkte auf der Liste identifiziert, die höchste Priorität haben, und sich darauf konzentriert, diese zu erledigen.“ – Pete DeJoy

Was kommt als Nächstes für Astronomer?

Was die Zukunft von Astronomer angeht, erklärt Pete: „Wir wollen ein Unternehmen für Generationen aufbauen, das einen echten Mehrwert für seine Kunden schafft, während wir gleichzeitig die Talente unserer Mitarbeiter fördern und ihnen die Möglichkeit geben, sich in ihrer Karriere zu verwirklichen. Und das erreichen wir, indem wir tagtäglich greifbare, bedeutsame Kundenergebnisse antreiben.“

Paola Peraza Calderon

Paola Peraza Calderon

Paola ist Produktmanagerin und stolze Mitgründerin von Astronomer. Sie hat ihre mehr als 5 Jahre bei Astronomer verbracht und viele Hüte getragen, aber ihr Schwerpunkt liegt im Produktmanagement und in der Dokumentation für Entwickler. Sie hat den größten Teil ihres Einflusses gemacht, indem sie die Erfahrungen der Entwickler im Cloud-Service von Astronomer kuratiert und ein Team von technischen Redakteuren geleitet hat, um Datentechnik zugänglicher zu machen. Paola ist Absolventin der Georgetown University und verbrachte fünf Jahre als Venture for America Fellow in Cincinnati, Ohio. Sie stammt ursprünglich aus Mexiko-Stadt, lebt derzeit in Brooklyn und freut sich darauf, den Fußabdruck von Astronomer weiter auszubauen.

Ganapathi Krishnamoorthi

Ganapathi Krishnamoorthi

Ganapathi Krishnamoorthi ist Senior ML Solutions Architect bei AWS. Ganapathi bietet Startup- und Unternehmenskunden präskriptive Anleitungen und hilft ihnen dabei, Cloud-Anwendungen in großem Maßstab zu entwickeln und bereitzustellen. Er ist auf Machine Learning spezialisiert und konzentriert sich darauf, Kunden dabei zu helfen, KI/ML für ihre Geschäftsergebnisse zu nutzen. Wenn er nicht auf der Arbeit ist, erkundet er gerne die Natur und hört Musik.

Megan Crowley

Megan Crowley

Megan Crowley ist Senior Technical Writer im Startup Content Team bei AWS. Nach einer früheren Karriere als Englischlehrerin an einer High School wird sie von einer unermüdlichen Begeisterung angetrieben, zu Inhalten beizutragen, die zu gleichen Teilen lehrreich und inspirierend sind. Die Geschichten von Startups mit der Welt zu teilen, ist der bereicherndste Teil ihrer Rolle bei AWS. In ihrer Freizeit findet man Megan bei der Holzbearbeitung, im Garten und auf Antiquitätenmärkten.

Pete DeJoy

Pete DeJoy

Pete ist praxisorientierter Produktmanager und stolzer Mitgründer von Astronomer. In den letzten fünf Jahren hat er an der Lösung von datentechnischen Problemen gearbeitet. Während seiner bisherigen Karriere hat er fast jeden erdenklichen Job erledigt, aber seine Leidenschaft liegt an der Schnittstelle zwischen technologischer Innovation und Produkt- und Marktanpassung. In seinen früheren Lebensjahren spielte er Football auf College-Ebene und war ein leistungsfähiger Skirennfahrer. Seine akademischen Jahre verbrachte er damit, sich mit Physik und Chemie zu beschäftigen, aber den größten Teil dieser geistigen Fähigkeiten widmet er seitdem Stack-Overflow-Antworten.

Viraj Parekh

Viraj Parekh

Viraj leitet die Bemühungen um das Ökosystem und ist stolzer Mitgründer von Astronomer. Während seiner mehr als sechs Jahre bei Astronomer hat er bei der Entwicklung und Verwaltung von Produkten mitgewirkt, Kunden gewonnen und Teams im gesamten Unternehmen aufgebaut. Derzeit konzentriert er sich darauf, ein erstklassiges Erlebnis mit Airflow/Astronomer und dem Rest des Data Stacks zu schaffen. Viraj lebt heute in Brooklyn und verbrachte drei Jahre als Venture for America Fellow in Cincinnati, Ohio.

Wie war dieser Inhalt?