Janssen Pharmaceuticals erhöht mit Amazon SageMaker die Genauigkeit von Machine Learning um 21 %
2022
Janssen Pharmaceuticals (Janssen), eine Gruppe von Pharmaunternehmen, die seit 1961 zu Johnson & Johnson gehört, nutzt Machine Learning (ML), um die Erfahrungen von Patienten, die Janssen-Therapien verwenden, besser zu verstehen. Um den Bereitstellungsworkflow zu automatisieren und eine bessere Schnittstelle zwischen Entwicklungs- und Produktionsumgebung zu schaffen, nutzten die Datenwissenschaftler von Janssen Amazon Web Services (AWS). Durch den Einsatz von AWS-Services – einschließlich Amazon SageMaker, einem ML-Service, der zum Erstellen, Trainieren und Bereitstellen von ML-Modellen für praktisch jeden Anwendungsfall verwendet werden kann – implementierte Janssen einen automatisierten ML-Operations-Prozess (MLOps), der die Genauigkeit der Modellvorhersagen um 21 Prozent verbesserte, die Geschwindigkeit des Feature Engineering um etwa 700 Prozent steigerte und Janssen dabei half, die Kosten zu senken und gleichzeitig die Effizienz zu steigern.
Anstatt jeden Schritt des Prozesses sequentiell anzuordnen, konnten wir die Datenvorbereitung und die Feature-Engineering-Aufträge und deren Orchestrierung parallelisieren, indem wir AWS Glue und AWS Step Functions in Kombination verwendet haben.“
Jenna Eun
Principal Data Scientist, Janssen Pharmaceuticals
Auf der Suche nach Automatisierung in MLOps zur Beschleunigung der Forschung
Das Produktportfolio von Janssen deckt ein breites Spektrum an Therapiegebieten ab, darunter Immunologie, Infektionskrankheiten, Neurowissenschaften und Onkologie. „Es ist wichtig, Patienten während ihrer komplexen Behandlungszyklen die beste Versorgung zu bieten. Deshalb nutzen wir künstliche Intelligenz und Machine Learning, um zu verstehen, wie die Menschen die Therapie erleben, und um die Bedürfnisse der Patienten während ihres Krankheitsverlaufs besser zu erfüllen“, sagt Jenna Eun, Principal Data Scientist bei Janssen.
Um die Auswirkungen von ML-basierten Lösungen auf das Patientenerlebnis zu beschleunigen, beschloss das Janssen Business Technology Commercial Data Sciences Team, sich auf MLOps zu konzentrieren, eine Reihe von Praktiken, die darauf abzielen, ML-Modelle zuverlässig und effizient in der Produktion einzusetzen und zu pflegen, die Automatisierung zu erhöhen und geschäftliche und technische Anforderungen zu erfüllen. „Unser Ziel für MLOps ist es, das Experimentieren und die Verfolgung der Modellleistung im Laufe der Zeit zu erleichtern“, sagt Eun. „Einfaches Experimentieren und gründliches Erforschen des Hyperparameterraums sind für uns wichtig, um Vertrauen in Machine-Learning-Modelle aufzubauen.“
Da es wichtig war, die technologischen Anforderungen mit den internen Sicherheitsanforderungen in Einklang zu bringen, beschloss Janssen, ein funktionsübergreifendes Team zusammenzustellen, um einen automatisierten MLOps-Prozess zu entwickeln. „Weil die Prozesse, die wir entwickeln, Daten aus dem Gesundheitswesen verwenden, müssen wir bei der Entwicklung und Implementierung unserer Technologielösungen strenge Sicherheits- und Datenschutzmaßnahmen einhalten“, sagt Eun. Ab Ende 2020 arbeiten die beiden Teams, Janssen Business Technology Commercial Data Sciences und Johnson & Johnson Technology CloudX, mit dem Amazon-SageMaker-Lösungsarchitekturteam und AWS Professional Services zusammen, einem globalen Expertenteam, das Unternehmen bei der Umsetzung ihrer gewünschten Geschäftsergebnisse in AWS unterstützt.
Höhere Geschwindigkeit und Genauigkeit von ML in AWS
In Zusammenarbeit mit dem Amazon-SageMaker-Lösungsarchitekturteam und AWS Professional Services automatisierten die beiden Teams, Janssen Business Technology Commercial Data Sciences und Johnson & Johnson Technology CloudX, die Datenvorbereitung und die Module für das Feature Engineering in weniger als 3 Monaten. Unter Feature Engineering versteht man die Erstellung von Eingabevariablen aus Patientendaten für das Training überwachter ML-Modelle. Durch die Automatisierung dieser Schritte konnten die Teams die Geschwindigkeit der Datenaufbereitung um ca. 600 Prozent und die Geschwindigkeit des Feature Engineerings um ca. 700 Prozent steigern. Janssen hat dies mithilfe von AWS Step Functions erreicht, einem visuellen Workflow-Service mit geringem Codeaufwand, der die Abfolge der für die Erfassung, Verarbeitung und Normalisierung von Quelldaten erforderlichen Schritte vereinfacht. AWS Step Functions koordiniert Aufträge in AWS Glue, einem Serverless-Datenintegrationsservice, der über eine Funktion zur mühelosen Synchronisierung von Entwicklungs- und Produktionsumgebungen für eine schnellere Bereitstellung von experimentellen und optimierten ML-Lösungen verfügt. „Anstatt jeden Schritt des Prozesses sequentiell anzuordnen, konnten wir die Datenvorbereitung und Aufträge für Feature Engineering und deren Orchestrierung durch die kombinierte Verwendung von AWS Glue und AWS Step Functions parallelisieren“, sagt Eun. „Das machte es uns einfach, die Entwicklungs- und Produktionsumgebungen nahtlos miteinander zu verbinden, sodass alles, womit wir experimentieren, schnell in AWS-Glue-Aufträge umgewandelt werden kann, die von AWS Step Functions gestartet werden.“
Nach der Implementierung der MLOps-Lösung in AWS konnte Janssen die Genauigkeit der Vorhersagemodellierung um 21 Prozent steigern. „Da die Datenpipeline stärker automatisiert ist und weniger Zeit in Anspruch nimmt, können wir uns mehr Zeit für die Leistung des Modells nehmen“, sagt Eun. Ein wesentlicher Bestandteil zur Verbesserung der Genauigkeit des ML-Modells ist die Optimierung der Hyperparameter. Sobald das Janssen-Team die Modelle und die Daten definiert hat, verwendet es Amazon SageMaker, um ein Modell automatisch abzustimmen, indem es Tausende von Kombinationen von Algorithmusparametern anpasst, um die genauesten Vorhersagen zu erhalten, die das Modell produzieren kann. Diese Automatisierung in Verbindung mit dem Bayes'schen Optimierungsalgorithmus verkürzt die Zeit für die Parametersuche erheblich. „Wir haben mehr Vertrauen in das resultierende ML-Modell, weil wir eine gründliche Hyperparametersuche durchgeführt haben“, sagt Eun.
Die Teams von Janssen und Johnson & Johnson Technology CloudX waren in der Lage, dieses Projekt zu dokumentieren und es mit anderen Johnson & Johnson-Teams zu teilen, die an ähnlichen ML-Projekten arbeiten. Die gemeinsame Nutzung der gewonnenen Erkenntnisse trägt dazu bei, die Projekte zu beschleunigen, die auch den Sicherheitsrichtlinien von Johnson & Johnson entsprechen müssen, und eine MLOps-Kultur im gesamten Unternehmen zu fördern. „Indem wir ein Muster geschaffen haben, dem andere folgen können, haben wir gezeigt, wie man verschiedene AWS-Services verbindet, um eine komplette ML-Pipeline in der Umgebung von Johnson & Johnson aufzubauen“, sagt Eun. „Die Möglichkeit, Teile unseres vorherigen ML-Entwicklungs- und Bereitstellungsprozesses effizienter zu gestalten und zu steigern, hat uns die Augen für die Flexibilität und Skalierbarkeit geöffnet, die wir haben können.“
Verbesserte Behandlungen für Patienten weltweit
Die MLOps-Lösung von Janssen ermöglicht die Bereitstellung von Datenwissenschaftslösungen in großem Umfang. Eun sagt: „Wenn wir unsere Lösung in der realen Welt einsetzen und zeigen, wie sie einen Unterschied machen kann, können wir uns vorstellen, sie auf größere geografische Regionen auszuweiten und sie auf andere Geschäftsanwendungen bei Johnson & Johnson anzuwenden.“
Über Janssen Pharmaceuticals
Janssen Pharmaceuticals, seit 1961 ein Unternehmen von Johnson & Johnson, ist ein Forschungs- und Entwicklungsunternehmen, das sich auf die Verbesserung der Behandlungsergebnisse von Patienten mit schweren Krankheiten in 6 Therapiebereichen konzentriert, darunter Herz-Kreislauf-Gesundheit, Immunologie, Neurowissenschaften und Onkologie.
Mehrwert durch AWS
- Steigerung der Geschwindigkeit der Datenaufbereitung um ca. 600 %.
- Steigerung der Geschwindigkeit des Feature Engineerings um ca. 700 %.
- Verbesserte Genauigkeit von ML-Modellen um 21 %
- Einführung einer Standard-MLOps-Referenzarchitektur für andere Johnson & Johnson-Teams
Genutzte AWS-Services
Amazon SageMaker
Amazon SageMaker unterstützt Datenwissenschaftler und Entwickler bei der Vorbereitung, der Erstellung, dem Training und der Bereitstellung hochwertiger Machine Learning (ML)-Modelle durch eine breite Palette von speziell für ML entwickelten Funktionen.
AWS Step Functions
AWS Step Functions ist ein visueller Low-Code-Workflow-Service, den Entwickler verwenden, um mit AWS-Angeboten verteilte Anwendungen zu erstellen, IT- und Geschäftsprozesse zu automatisieren und Daten- und Machine-Learning-Pipelines zu entwickeln.
AWS Glue
AWS Glue ist ein vollständig verwalteter ETL-Service (Extrahieren, Transformieren und Laden), der Kunden das Vorbereiten und Laden ihrer Daten zu Analysezwecken erleichtert.
AWS Professional Services
Die AWS-Professional-Services-Organisation ist ein weltweites Team aus Experten, die Ihnen dabei helfen können, Ihre gewünschten Geschäftsergebnisse mithilfe der AWS Cloud zu erzielen.
Erste Schritte
Organisationen aller Größen aus verschiedenen Sektoren transformieren ihre Unternehmen und erfüllen ihre Missionen täglich mithilfe von AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute Ihren Weg zu AWS.