AWS Germany – Amazon Web Services in Deutschland

Neuvorstellung von Amazon Nova Forge: Erstellen eigener Frontier-Modelle mit Nova

von Danilo Poccia, übersetzt durch Daniel Lemke

Viele Unternehmen treiben die Nutzung von generativer KI in allen Geschäftsbereichen rasant voran. Anwendungen, die tiefgreifendes Fachwissen oder spezifischen Geschäftskontext erfordern, benötigen Modelle, die proprietäres Wissen, Arbeitsabläufe und einzigartigen Anforderungen wirklich verstehen.

Während Techniken wie Prompt Engineering und Retrieval Augmented Generation (RAG) für viele Anwendungsfälle gut funktionieren, haben sie grundlegende Einschränkungen, wenn es darum geht, spezialisiertes Wissen in das Kernverständnis eines Modells einzubetten. Supervised Fine-Tuning und Reinforcement Learning helfen bei der Anpassung des Modells, aber sie greifen zu spät im Entwicklungsprozess des Modells ein. Mit diesen Techniken werden lediglich Modifikationen an bereits vollständig trainieren Modellen vorgenommen, was es schwer macht diese fundamental auf bestimmte Fokusbereiche auszurichten.

Wenn Unternehmen eine tiefere Anpassung durch Continued Pre-Training (CPT) [EN] mit proprietären Daten versuchen, stoßen sie außerdem oft auf katastrophales Vergessen, bei dem Modelle ihre grundlegenden Fähigkeiten verlieren, während neue Inhalte angelernt werden. Gleichzeitig sind die Menge und Qualität der Daten, die benötigte Rechenleistung und die resultierenden Kosten, die für das Training eines Modells von Grund auf erforderlich sind, für die meisten Unternehmen immer noch eine unüberwindbare Hürde.

Heute stellen wir Amazon Nova Forge vor, einen neuen Service zum Erstellen Ihrer eigenen Frontier-Modelle mit Nova. Nova Forge-Kunden können die Modellentwicklung von frühen Modell-Checkpoints aus starten, ihre Datensätze mit von Amazon Nova kuratierten Trainingsdaten mischen und die benutzerdefinierten Modelle sicher auf AWS hosten. Nova Forge ist der einfachste und kostengünstigste Weg, Ihr eigenes Frontier-Modell zu erstellen.

Anwendungsfälle und Anwendungen

Nova Forge ist für Unternehmen konzipiert, die Zugang zu proprietären oder branchenspezifischen Daten haben und KI aufbauen möchten, die ihre Domäne wirklich versteht. Dazu gehören:

  • Fertigung und Automatisierung – Aufbau von Modellen, die spezialisierte Prozesse, Gerätedaten und branchenspezifische Arbeitsabläufe verstehen
  • Forschung und Entwicklung – Erstellung von Modellen, die auf proprietären Forschungsdaten und domänenspezifischem Wissen trainiert sind
  • Content und Medien – Entwicklung von Modellen, die Branding, Content-Standards und spezifische Moderationsanforderungen verstehen
  • Spezialisierte Branchen – Training von Modellen auf branchenspezifischer Terminologie, Vorschriften und Best Practices

Je nach spezifischen Anwendungsfällen kann Nova Forge verwendet werden, um differenzierte Fähigkeiten hinzuzufügen, die für spezifische Aufgaben erforderliche Genauigkeit zu verbessern, sowie Kosten zu senken und die Latenz zu verringern.

Wie Nova Forge funktioniert

Nova Forge adressiert die Einschränkungen aktueller Modellanpassungsansätze, indem es Ihnen ermöglicht, die Modellentwicklung von frühen Checkpoints aus über Pre-Training-, Mid-Training- und Post-Training-Phasen hinweg zu starten. Sie können Ihre proprietären Daten während aller Trainingsphasen mit von Amazon Nova kuratierten Daten mischen und das Training mit bewährten Rezepten auf der vollständig verwalteten Infrastruktur von Amazon SageMaker AI durchführen. Dieser Ansatz reduziert katastrophales Vergessen im Vergleich zum Training mit reinen Rohdaten erheblich und hilft dabei, grundlegende Fähigkeiten des KI-Modells zu bewahren – z.B. der Fähigkeit zur Befolgung allgemeiner Anweisungen – während Ihr spezialisiertes Wissen integriert wird.

Nova Forge bietet die Möglichkeit, Belohnungsfunktionen in Ihrer eigenen Umgebung für Reinforcement Learning (RL) zu verwenden. Dies ermöglicht es dem Modell, aus Feedback zu lernen, das in Umgebungen generiert wird, die für Ihre Anwendungsfälle repräsentativ sind. Über Einzelschritt-Evaluierungen hinaus können Sie auch Ihren eigenen Orchestrator verwenden, um Multi-Turn-Rollouts zu verwalten, was RL-Training für komplexe Agenten-Workflows und sequenzielle Entscheidungsaufgaben ermöglicht. Egal, ob Sie Chemie-Tools verwenden, um molekulare Designs zu bewerten, oder Robotik-Simulationen, die effiziente Aufgabenerledigung belohnen und Kollisionen bestrafen, können Sie Ihre eigene proprietären Umgebungen direkt verbinden.

Sie können auch das in Nova Forge verfügbare integrierte „Responsible AI“-Toolkit nutzen, um die Sicherheits- und Content-Moderationseinstellungen Ihres Modells zu konfigurieren. Außerdem erlaubt Nova Forge Ihnen Einstellungen anzupassen, um Ihre spezifischen Geschäftsanforderungen in Bereichen wie Sicherheit, Security und Umgang mit sensiblen Inhalten zu erfüllen.

Erste Schritte mit Nova Forge

Nova Forge integriert sich nahtlos in Ihre bestehenden AWS-Workflows. Sie können die vertrauten Tools und die Infrastruktur in Amazon SageMaker AI verwenden, um Ihr Training durchzuführen, und dann Ihre benutzerdefinierten Nova-Modelle als private Modelle auf Amazon Bedrock importieren. Dies gibt Ihnen die gleiche Sicherheit, konsistente APIs und breitere AWS-Integrationen wie jedes Modell in Amazon Bedrock.

In Amazon SageMaker Studio können Sie jetzt Ihr Frontier-Modell mit Amazon Nova erstellen.

Amazon Nova Forge in der SageMaker AI-Konsole

Um mit dem Erstellen des Modells zu beginnen, wählen Sie aus, welchen Checkpoint Sie verwenden möchten: pre-trained, mid-trained oder post-trained. Hier können Sie auch eigene Datensätze hochladen oder vorhandene Datensätze verwenden.

Sie können Ihre Trainingsdaten mischen, indem Sie kuratierte Datensätze von Nova hinzufügen. Diese nach Domänen kategorisierten Datensätze können Ihrem Modell helfen, die allgemeinen Fähigkeiten des Modells zu erhalten und Overfitting oder katastrophales Vergessen zu verhindern.

Amazon Nova Forge Datenmischung

Optional können Sie Reinforcement Fine-Tuning (RFT) verwenden, um die faktische Genauigkeit zu verbessern und Halluzinationen in bestimmten Domänen zu reduzieren.

Wenn das Training abgeschlossen ist, importieren Sie das Modell in Amazon Bedrock und beginnen Sie, es in Ihren Anwendungen zu verwenden.

Wissenswertes

Amazon Nova Forge ist in der AWS-Region US East (N. Virginia) verfügbar. Das Programm umfasst Zugang zu mehreren Nova-Modell-Checkpoints, Trainingsrezepten zum Mischen proprietärer Daten mit von Amazon Nova kuratierten Trainingsdaten, bewährten Trainingsrezepten und Integration mit Amazon SageMaker AI und Amazon Bedrock.

Erfahren Sie mehr im Amazon Nova User Guide [EN] und erkunden Sie Nova Forge über die Amazon SageMaker AI-Konsole.

Unternehmen, die an fachkundiger Unterstützung interessiert sind, können sich auch an unser Generative AI Innovation Center wenden, um zusätzliche Unterstützung bei der Modellentwicklung zu erhalten.

Danilo

Danilo Poccia

Danilo Poccia

Danilo arbeitet mit Startups und Unternehmen jeder Größe zusammen, um deren Innovation zu unterstützen. In seiner Rolle als Chief Evangelist (EMEA) bei Amazon Web Services nutzt er seine Erfahrung, um Menschen dabei zu helfen, ihre Ideen zum Leben zu erwecken, mit Fokus auf Serverless-Architekturen und ereignisgesteuerter Programmierung sowie auf die technischen und geschäftlichen Auswirkungen von Machine Learning und Edge Computing. Er ist Autor von AWS Lambda in Action von Manning.


Dieser Inhalt wurde aus dem ursprünglichen Blogbeitrag übersetzt, der hier zu finden ist.