Il fine-tuning per rinforzo di Amazon Bedrock aggiunge il supporto ai modelli open-weight con API compatibili con OpenAI
Amazon Bedrock ora estende il supporto al fine-tuning per rinforzo (RFT) ai modelli open-weight più diffusi, inclusi i modelli OpenAI GPT-OSS e Qwen, e introduce API di fine-tuning compatibili con OpenAI. Queste funzionalità consentono agli sviluppatori di migliorare più facilmente la precisione dei modelli open-weight senza richiedere competenze avanzate di machine learning o grandi volumi di dati etichettati. Il fine-tuning per rinforzo in Amazon Bedrock automatizza il flusso di lavoro di personalizzazione end-to-end, consentendo ai modelli di apprendere dal feedback su più risposte possibili utilizzando un insieme ridotto di prompt, in alternativa ai tradizionali set di dati di addestramento di grandi dimensioni. Il fine-tuning per rinforzo consente ai clienti di utilizzare varianti di modello più piccole, più veloci e più convenienti, mantenendo al contempo un'elevata qualità.
Le aziende spesso faticano ad adattare i modelli di fondazione ai propri requisiti specifici, trovandosi costrette a scegliere tra modelli generici con prestazioni limitate e pipeline di personalizzazione complesse e costose che richiedono infrastrutture e competenze specializzate. Amazon Bedrock elimina questa complessità offrendo un'esperienza di fine-tuning per rinforzo completamente gestita e sicura. I clienti definiscono le funzioni di ricompensa tramite valutatori basati su regole verificabili o giudici basati sull'IA, inclusi modelli predefiniti per attività oggettive come la generazione di codice e il ragionamento matematico e per attività soggettive come il rispetto delle istruzioni o la qualità conversazionale. Durante l'addestramento i clienti possono utilizzare le funzioni AWS Lambda per implementare logiche di valutazione personalizzate e accedere ai checkpoint intermedi del modello per valutare, eseguire il debug e selezionare la versione con le migliori prestazioni, migliorando la velocità di iterazione e l'efficienza dell'addestramento. Tutti i dati proprietari rimangono all'interno dell'ambiente sicuro e governato di AWS durante l'intero processo di personalizzazione.
I modelli supportati in questo lancio sono: qwen.qwen3-32b e openai.gpt-oss-20b. Al termine del fine-tuning i clienti possono utilizzare immediatamente il modello risultante per l'inferenza on-demand tramite le API di Amazon Bedrock compatibili con OpenAI (API Responses e API Chat Completions), senza ulteriori passaggi di distribuzione. Per ulteriori informazioni, consulta la documentazione di Amazon Bedrock.