Amazon Polly

تحويل النص إلى حديث نابض بالحياة باستخدام التعلم العميق

Amazon Polly هي خدمة تحول النص إلى خطاب نابض بالحياة، مما يسمح لك بإنشاء تطبيقات تتحدث، وبناء فئات جديدة تمامًا من المنتجات التي تدعم الكلام. Amazon Polly هي خدمة تحويل النص إلى كلام (TTS) وتستخدم تقنيات التعلم العميق المتقدمة لتجميع الكلام الذي يبدو كصوت بشري.

مع العشرات من الأصوات النابضة بالحياة عبر مجموعة متنوعة من اللغات، يمكنك تحديد الصوت المثالي وتطوير تطبيقات تمكين الكلام التي تعمل في العديد من البلدان المختلفة. بالإضافة إلى أصوات TTS القياسية، تقدم Amazon Polly الأصوات العصبية من النص إلى الكلام (NTTS)، مما يوفر تحسينات متقدمة في جودة الكلام من خلال نهج جديد لتعلم الآلة، ليوفر للعملاء واحدًا من أصوات النص إلى الكلام الأكثر طبيعية وتشبه الإنسان في السوق. تدعم تقنية TTS العصبية كذلك أسلوب قراءة Newscaster الذي تم تصميمه خصيصًا لحالات استخدام السرد الإخباري.

الاستماع إلى صوت مجلة Amazon Polly »
مقدمة لـAmazon Polly (2:08)
اللغة أنثى ذكر عينة نصية
الإنجليزية

جوانا (قياسي)

جوانا (عصبي)

ماثيو (قياسي) 

ماثيو (عصبي)

مرحبًا. هل تتحدث لغة أجنبية؟ لغة واحدة ليست كافية أبداً.
البرتغالية البرازيلية فيتوريا Vitória ريكاردو Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
الدانماركية نايا Naja مادس Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
الفرنسية ليا Léa ماتيو Mathieu صباح الخير. Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
اليابانية ميزوكي Mizuki
تاكومي Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
الكورية سيويان Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다.
الصينية الماندارين شيو Zhiyu   你好,你会不会说其他外语?只会一种语言是不够的。
الإسبانية بينيلوبي Penélope ميجل Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
تحقق من القائمة الكاملة لأصوات Amazon Polly واللغات المدعومة هنا.

الفوائد

الأصوات الطبيعية

يوفر Amazon Polly عشرات اللغات ومجموعة واسعة من الأصوات الذكور والإناث الطبيعية. يتيح لك نطق Amazon Polly السلس للنص توفير صوت عالي الجودة لجمهور عالمي.

تخزين وإعادة توزيع الكلام

تسمح Amazon Polly للإعادة غير المحدّدة للخطاب المولَّد بدون أي رسوم إضافية. يمكنك إنشاء ملفات الكلام بالتنسيقات القياسية مثل MP3 وOGG، وعرضها من السحاب أو محليًا باستخدام التطبيقات أو الأجهزة للتشغيل في وضع عدم الاتصال.

البث في الوقت الفعلي

إن تقديم الأصوات الشبيهة بالحية، وتجارب المستخدمين للمحادثة، يتطلب أوقات استجابة سريعة باستمرار. عند إرسال رسالة نصية إلى واجهة API الخاصة بـ Amazon Polly، فإنها تعيد الصوت إلى التطبيق كدفق حتى تتمكن من تشغيل الأصوات على الفور. 

التخصيص والتحكم في إخراج الكلام

قم بتعديل أصوات Amazon Polly لتناسب احتياجاتك على أفضل وجه – تدعم Amazon Polly المعاجم وعلامات SSML التي تمكنك من التحكم في جوانب الكلام، مثل النطق، الحجم، درجة الصوت، معدل السرعة، إلخ.  

 

 

منخفضة التكلفة

إن تسعير الدفع حسب الاستخدام من Amazon Polly، والتكلفة المنخفضة لكل حرف تم تحويله، والإعادة غير المحدودة، تجعله وسيلة فعالة من حيث التكلفة للتعبير عن تطبيقاتك.

حالات الاستخدام

إنشاء محتوى

يمكن استخدام الصوت كوسيلة تكميلية للاتصالات المكتوبة و/أو المرئية. من خلال التعبير عن المحتوى الخاص بك، يمكنك تزويد جمهورك بطريقة بديلة لاستهلاك المعلومات وتلبية احتياجات مجموعة أكبر من القراء. يمكن لـ Amazon Polly توليد الكلام بالعشرات من اللغات، مما يجعل من السهل إضافة الكلام إلى التطبيقات مع جمهور عالمي، مثل موجز ويب RSS أو مواقع ويب أو مقاطع فيديو.

مثال: تحويل مقال إلى حديث وتنزيله بتنسيق MP3
تحويل مقال إلى حديث وتحميله بتنسيق MP3
GoAnimate

"تمنح Amazon Polly مستخدمي GoAnimate القدرة على التعبير مباشرة عن الشخصيات التي ينشطونها باستخدام منصتنا. وهذا مفيد بشكل خاص في السيناريوهات التي يكون فيها الإرسال الصوتي المباشر إما موردًا أو وقتًا باهظًا، مثل عند تطوير فيديو بالعديد من اللغات أو في مرحلة ما قبل الإنتاج لتسريع عملية الموافقة. يتكامل الخطاب بسلاسة مع مجموعتنا الغنية من الأصول المتحركة، مما يعزز سهولة الاستخدام في GoAnimate ويمنح عملاءنا الكفاءة والسرعة في السوق".

- ألفين هونغ، الرئيس التنفيذي والمؤسس، GoAnimate

الرجوع إلى دراسة الحالة >>

التعلم الإلكتروني

تمكن Amazon Polly المطورين من تقديم تطبيقاتهم بتجربة مرئية محسنة مثل الرسوم المتحركة للوجه المتزامنة للكلام أو تمييز الكلمات على نمط الكاريوكي. تجعل Amazon Polly من السهل طلب دفق إضافي من البيانات الوصفية مع معلومات حول متى يتم نطق جمل معينة، والكلمات والأصوات. باستخدام تدفق البيانات الوصفية هذا إلى جانب تيار الصوت الكلامي المركب، يمكن للعملاء تحريك الصور الرمزية وتسليط الضوء على النص حيث أنه يتم نطقه حاليًا في تطبيقهم.

مثال: تشغيل الكلام وإبراز النص المنطوق
تشغيل الكلام وإبراز النص المنطوق
Duolingo

"لا أستطيع التفكير في العديد من حالات الاستخدام التي تكون فيها دقة النطق أهم من الحالات التي تتعلم فيها لغةً جديدة. لقد وجدنا أن أصوات Amazon Polly ليست عالية الجودة فحسب، بل هي جيدة مثل الكلام البشري الطبيعي لتدريس لغة".

- سيفرين هاكر، كبير موظفي التكنولوجيا، بشركة دوولينجو

قراءة منشور مدونتهم >>

المهاتفة

مع Amazon Polly، يمكن لمراكز الاتصال الخاصة بك إشراك العملاء بأصوات تبدو طبيعية. يمكنك تخزين وإعادة إخراج مخرجات الكلام في Amazon Polly لتوجيه المتصلين عبر أنظمة الاستجابة الصوتية التفاعلية (IVR)، مثل Amazon Connect. بالإضافة إلى ذلك، يمكنك الاستفادة من واجهة برمجة تطبيقات Amazon Polly لتقديم معلومات تلقائية في الوقت الفعلي، مثل حالة الخدمة، واستفسارات الحساب، والفواتير، والعناوين، ومعلومات الاتصال.

مثال: تحويل النص إلى كلام لأنظمة الاتصالات الهاتفية
تحويل النص إلى كلام لأنظمة الاتصالات الهاتفية
للشبكة

"قامت شركة Bandwidth بتطوير تطبيق TTS صغير وموثوق وسريع مدعوم من Amazon Polly. نحن الآن نستخدم أصوات عالية الجودة بتكلفة منخفضة. كان جهد المطور المطلوب لتطوير هذه الخدمة الجديدة ضئيلاً للغاية."

– Yiannis Philipopoulos, Sr. مطوّر برامج، النطاق الترددي 

قراءة منشور مدونتهم >>

معرفة المزيد عن حول Amazon Polly

زيارة صفحة الميزات
هل أنت جاهز للتطوير؟
البدء مع Amazon Polly
لديك مزيد من الأسئلة؟
اتصل بنا