تتوفر الآن ثلاثة نماذج جديدة للتعرف على الكلام وتحويل النص إلى كلام في Amazon SageMaker JumpStart

:تاريخ النشر 14 مايو 2026

أعلنت AWS اليوم عن توفر Qwen3-TTS-12Hz-1.7B-CustomVoice وQwen3-TTS-12Hz-1.7B-Base وQwen3-ASR-1.7B في Amazon SageMaker JumpStart، مما أدى على توسيع مجموعة النماذج الأساسية المتاحة لعملاء AWS. توفر هذه النماذج الثلاثة من Qwen إمكانات متقدمة لتوليف الكلام والتعرف عليه عبر أكثر من 10 لغات، مما يمكّن العملاء من إنشاء تطبيقات ذكية تعمل بالصوت على البنية التحتية لـ AWS.

تتناول هذه النماذج تحديات الكلام والصوت المختلفة للمؤسسات بقدرات متخصصة:

يتفوق Qwen3-TTS-12Hz-1.7B-CustomVoice في تحويل النص إلى كلام متعدد اللغات مع أنماط صوت قابلة للتخصيص، ويدعم 10 لغات مع التحكم القائم على التعليمات في الصوت والعاطفة والنبرة. إنه مثالي لإنشاء تطبيقات صوتية تفاعلية في الوقت الفعلي، ومساعدين افتراضيين يتعاملون مع العملاء، وعمليات سير عمل إنشاء المحتوى التي تتطلب إخراجًا طبيعيًا ومعبّرًا للكلام.

يتفوق Qwen3-TTS-12Hz-1.7B-Base في تحويل النص إلى كلام متعدد اللغات مع استنساخ صوتي سريع لمدة 3 ثوانٍ من إدخال الصوت. إنه مثالي لإنشاء تطبيقات صوتية مخصصة، وإجراء ضبط دقيق لتركيب الكلام الخاص بالنطاق، والسيناريوهات التي يحتاج فيها المطورون إلى نموذج أساسي مرن لتوليد الصوت.

يتفوق Qwen3-ASR-1.7B في التعرف التلقائي على الكلام الذي يدعم 52 لغة ولهجة بدقة حديثة في البيئات الصوتية المعقدة. إنه مثالي لخدمات النسخ ودعم العملاء متعدد اللغات والتعليقات التوضيحية في الوقت الفعلي والتطبيقات التي تتطلب بثًا قويًا وتحويل الكلام إلى نص دون اتصال بالإنترنت.

من خلال SageMaker JumpStart، يمكن للعملاء نشر أي من هذه النماذج ببضع نقرات فقط لمعالجة حالات استخدام الذكاء الاصطناعي المحددة لديهم.

لبدء استخدام هذه النماذج، انتقل إلى قسم "النماذج" في SageMaker Studio أو استخدم SageMaker Python SDK لنشر النماذج في حساب AWS الخاص بك. لمزيد من المعلومات عن نشر نماذج التأسيس واستخدامها في SageMaker JumpStart، اطّلع على وثائق Amazon SageMaker JumpStart.