Amazon Polly

تحويل النص إلى حديث نابض بالحياة باستخدام التعلم العميق

Amazon Polly خدمة تحول النص إلى كلام نابض بالحياة، يمكنك من تطوير تطبيقات تتحدث وإنشاء فئات جديدة تمامًا من المنتجات التي تدعم الكلام. تعتمد خدمة Polly التي تحوّل النص إلى كلام‏‏ (TTS) على تقنيات التعلم العميق المتقدمة لتجميع كلاماً بشرياً يبدو طبيعياً. ومن خلال العشرات من الأصوات النابضة بالحياة عبر مجموعة متنوعة من اللغات، يمكنك تطوير تطبيقات تدعم الكلام تعمل في العديد من البلدان المختلفة.

بالإضافة إلى أصوات TTS القياسية، تقدم Amazon Polly أصواتًا ناتجةً عن تحويل النص إلى كلام بالاعتماد على الشبكات العصبية (NTTS)، ما يوفر تحسينات متقدمة في جودة الكلام من خلال نهج جديد لتعلم الآلة. تدعم تقنية TTS العصبية من Polly أيضًا أسلوب تحدث Newscaster الذي تم تصميمه خصيصًا لحالات استخدام السرد الإخباري.

وأخيرًا، بإمكان ميزة Brand Voice من Amazon Polly أن تطور صوتًا مخصصًا لمؤسستك. وهي عبارة عن تفاعل مخصص ستعمل من خلاله مع فريق Amazon Polly لتطوير صوت بتكنولوجيا NTTS للاستخدام الحصري لمؤسستك. تعرّف على المزيد هنا.

الاستماع إلى صوت بنمط مذيع نشرة الأخبار من Amazon Polly 

5 مليون حرف مجانًا

لكل شهر لمدة 12 شهرًا معالطبقة المجانية لخدمة AWS

اللغة الأصوات (أنثى) الأصوات (ذكر) عينة نصية
البرتغالية البرازيلية Vitória (قياسي)

Vitória (عصبي)
Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
الدانماركية نايا Naja مادس Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
الإنجليزية

جوانا (قياسي)

جوانا (عصبي)

ماثيو (قياسي) 

ماثيو (عصبي)

مرحباً. هل تتحدث لغة أجنبية؟ لغة واحدة ليست كافية أبدًا.
الفرنسية Léa (قياسية)

Léa (عصبية)
Mathieu صباح الخير. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
اليابانية Mizuki
Takumi (قياسية)

Takumi (عصبية)
こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
الكورية Seoyeon (قياسي)

Seoyeon (عصبي)

 

 

안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다.
الصينية الماندارين شيو Zhiyu (قياسية)

شيو Zhiyu (عصبية)
  你好,你会不会说其他外语?只会一种语言是不够的。
الإسبانية بينيلوبي Penélope ميجل Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
تحقق من القائمة الكاملة لأصوات Amazon Polly واللغات المدعومة هنا 

المزايا

الأصوات الطبيعية

يوفر Amazon Polly عشرات اللغات ومجموعة واسعة من الأصوات الذكور والإناث الطبيعية. يتيح لك نطق Amazon Polly السلس للنص توفير صوت عالي الجودة لجمهور عالمي.

تخزين وإعادة توزيع الكلام

تسمح Amazon Polly للإعادة غير المحدّدة للخطاب المولَّد بدون أي رسوم إضافية. يمكنك إنشاء ملفات الكلام بالتنسيقات القياسية مثل MP3 وOGG، وعرضها من السحاب أو محليًا باستخدام التطبيقات أو الأجهزة للتشغيل في وضع عدم الاتصال.

البث في الوقت الفعلي

إن تقديم الأصوات الشبيهة بالحية، وتجارب المستخدمين للمحادثة، يتطلب أوقات استجابة سريعة باستمرار. عند إرسال رسالة نصية إلى واجهة API الخاصة بـ Amazon Polly، فإنها تعيد الصوت إلى التطبيق كدفق حتى تتمكن من تشغيل الأصوات على الفور. 

التخصيص والتحكم في إخراج الكلام

قم بتعديل أصوات Amazon Polly لتناسب احتياجاتك على أفضل وجه – تدعم Amazon Polly المعاجم وعلامات SSML التي تمكنك من التحكم في جوانب الكلام، مثل النطق، الحجم، درجة الصوت، معدل السرعة، إلخ.  

منخفضة التكلفة

إن تسعير الدفع حسب الاستخدام من Amazon Polly، والتكلفة المنخفضة لكل حرف تم تحويله، والإعادة غير المحدودة، تجعله وسيلة فعالة من حيث التكلفة للتعبير عن تطبيقاتك.

حالات الاستخدام

إنشاء محتوى

يمكن استخدام الصوت كوسيلة تكميلية للاتصالات المكتوبة و/أو المرئية. من خلال التعبير عن المحتوى الخاص بك، يمكنك تزويد جمهورك بطريقة بديلة لاستهلاك المعلومات وتلبية احتياجات مجموعة أكبر من القراء. يمكن لـ Amazon Polly توليد الكلام بالعشرات من اللغات، مما يجعل من السهل إضافة الكلام إلى التطبيقات مع جمهور عالمي، مثل موجز ويب RSS أو مواقع ويب أو مقاطع فيديو.

مثال: تحويل مقال إلى حديث وتنزيله بتنسيق MP3
تحويل مقال إلى حديث وتحميله بتنسيق MP3
GoAnimate
"تمنح Amazon Polly مستخدمي GoAnimate القدرة على التعبير مباشرة عن الشخصيات التي ينشطونها باستخدام منصتنا. وهذا مفيد بشكل خاص في السيناريوهات التي يكون فيها الإرسال الصوتي المباشر إما موردًا أو وقتًا باهظًا، مثل عند تطوير فيديو بالعديد من اللغات أو في مرحلة ما قبل الإنتاج لتسريع عملية الموافقة. يتكامل الخطاب بسلاسة مع مجموعتنا الغنية بالأصول المتحركة، ما يعزز سهولة الاستخدام في GoAnimate ويمنح عملاءنا الكفاءة والسرعة في السوق".

ألفين هونغ، الرئيس التنفيذي والمؤسس - GoAnimate

الرجوع إلى دراسة الحالة 

التعلم الإلكتروني

تمكن Amazon Polly المطورين من تقديم تطبيقاتهم بتجربة مرئية محسنة مثل الرسوم المتحركة للوجه المتزامنة للكلام أو تمييز الكلمات على نمط الكاريوكي. تجعل Amazon Polly من السهل طلب دفق إضافي من البيانات الوصفية مع معلومات حول متى يتم نطق جمل معينة، والكلمات والأصوات. باستخدام تدفق البيانات الوصفية هذا إلى جانب تيار الصوت الكلامي المركب، يمكن للعملاء تحريك الصور الرمزية وتسليط الضوء على النص حيث أنه يتم نطقه حاليًا في تطبيقهم.

مثال: تشغيل الكلام وإبراز النص المنطوق
تشغيل الكلام وإبراز النص المنطوق
Duolingo
"لا أستطيع التفكير في العديد من حالات الاستخدام التي تكون فيها دقة النطق أهم من الحالات التي تتعلم فيها لغةً جديدة. لقد وجدنا أن أصوات Amazon Polly ليست عالية الجودة وحسب، بل إنها جيدة مثل الكلام البشري الطبيعي لدرجة أنها تصلح لتدريس اللغة".

سيفرين هاكر، كبير موظفي التكنولوجيا - Duolingo

قراءة منشور مدونته 

المهاتفة

مع Amazon Polly، يمكن لمراكز الاتصال الخاصة بك إشراك العملاء بأصوات تبدو طبيعية. يمكنك تخزين وإعادة إخراج مخرجات الكلام في Amazon Polly لتوجيه المتصلين عبر أنظمة الاستجابة الصوتية التفاعلية (IVR)، مثل Amazon Connect. بالإضافة إلى ذلك، يمكنك الاستفادة من واجهة برمجة تطبيقات Amazon Polly لتقديم معلومات تلقائية في الوقت الفعلي، مثل حالة الخدمة، واستفسارات الحساب، والفواتير، والعناوين، ومعلومات الاتصال.

مثال: تحويل النص إلى كلام لأنظمة الاتصالات الهاتفية
تحويل النص إلى كلام لأنظمة الاتصالات الهاتفية
للشبكة
"قامت شركة Bandwidth بتطوير تطبيق TTS صغير وموثوق وسريع مدعوم من Amazon Polly. نحن الآن نستخدم أصوات عالية الجودة بتكلفة منخفضة. كان جهد المطور المطلوب لتطوير هذه الخدمة الجديدة ضئيلاً للغاية."

يانيس فيليبوبولوس، كبير مطوّري البرامج - Bandwidth 

قراءة منشور مدونته 

معرفة المزيد حول Amazon Polly

زيارة صفحة الميزات
هل أنت جاهز للتطوير؟
البدء مع Amazon Polly
لديك مزيد من الأسئلة؟
اتصل بنا