Comience con Amazon Polly

Amazon Polly es un servicio que convierte texto en habla realista, lo que permite crear aplicaciones y categorías totalmente nuevas de productos con esta capacidad. Amazon Polly es un servicio de IA de Amazon que utiliza tecnologías de aprendizaje profundo avanzadas para sintetizar habla que se asemeje a una voz humana.

Gracias a las decenas de voces realistas en varios idiomas, puede seleccionar la voz ideal y crear aplicaciones con habla aptas para numerosos países distintos.

Lenguaje Femenino Masculino Texto de muestra
Inglés Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
Danés Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
Portugués de Brasil Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
Español Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Islandés Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.

Aquí puede consultar nuestra lista completa de voces e idiomas admitidos de Amazon Polly.


Fecha

Título

Autor

19 de julio de 2017

Building a Reliable Text-to-Speech Service with Amazon Polly

Yiannis Philipopoulos, desarrollador de software de Bandwidth

30 de junio de 2017

Using Amazon Polly to Deliver Health Care for People with Long-Term Conditions

Michael Wray, arquitecto de software sénior de Inhealthcare

26 de mayo de 2017

Personalizing Videos: BeeLiked uses Amazon Polly to Launch the #DanBrownOrigin campaign, the World’s First Virtual Book Signing

Robin Dautricourt, gerente de productos sénior de AWS, Amazon Polly

12 de mayo de 2017

Powering Language Learning on Duolingo with Amazon Polly

André Kenji Horie, ingeniero de software, Duolingo

5 de mayo de 2017

Create Audiobooks with Amazon Polly and AWS Batch

Matthew McClean, arquitecto de soluciones y socio de AWS


Voces con un sonido natural

Voces con un sonido natural

Amazon Polly proporciona decenas de voces realistas y es compatible con varios idiomas, incluida una amplia selección de voces masculinas y femeninas con diversos acentos. La pronunciación fluida del texto en varios idiomas de Amazon Polly le permite entregar voz de alta calidad y crear aplicaciones para usuarios de todo el mundo.

Interacción sencilla

Interacción sencilla

Amazon Polly facilita la incorporación de voz en su sitio web, aplicación móvil o dispositivo. Con Amazon Polly, solo tiene que escribir el texto que desea convertir a habla en la API de Amazon Polly y recibirá al instante la transmisión de audio. A diferencia de otras soluciones que requieren un largo proceso de aprobación, Amazon Polly no necesita que describa cómo utilizar el habla de Amazon Polly en su aplicación, y tampoco tiene que firmar acuerdos de distribución, de manera que puede ponerse en marcha al instante.

Almacene y redistribuya el habla

Almacene y redistribuya el habla

A diferencia de otras soluciones que requieren el pago de derechos de autor o cargos cada vez que se reproduce el audio generado con anterioridad, Amazon Polly le permite reproducirlo todas las veces que desee sin cuotas adicionales. Estas reproducciones gratuitas también se aplican al uso offline. Puede crear archivos de habla en varios formatos estándar, como MP3 y OGG, y almacenarlos en dispositivos como teléfonos móviles o dispositivos del Internet de las cosas (IoT) para su reproducción offline.

 

Bajo costo

Bajo costo

Los precios por uso, el bajo costo por carácter convertido y las reproducciones ilimitadas hacen de Amazon Polly una manera rentable de habilitar la síntesis del habla en prácticamente cualquier aplicación.

Respuesta rápida

Respuesta rápida

La entrega de voces realistas y experiencias de conversación con los usuarios requiere tiempos de respuesta siempre rápidos. Las aplicaciones con voz deben reproducir el habla sintetizado sin retrasos. Considere aplicaciones que proporcionan indicaciones de voz sobre cómo encontrar un lugar, aplicaciones de aprendizaje electrónico que proporcionan instrucciones verbales a los alumnos y aplicaciones que interactúan con los usuarios mediante el diálogo en tiempo real. Estas aplicaciones son más efectivas cuando las respuestas pueden comenzar sin retrasos perceptibles en el flujo de la conversación. Incluso cuando envía textos extensos a la API de Amazon Polly, le entrega el audio en su aplicación como transmisión para que pueda reproducir las voces al instante. Este tipo de respuestas de voz dinámicas requieren el acceso a una cantidad de audio de habla mucho mayor que la que se suele poder almacenar en los dispositivos de los usuarios. Amazon Polly se encuentra en la nube, por lo que dispone de acceso a una amplia variedad de habla sintetizado. Con Amazon Polly, su aplicación puede proporcionar respuestas aún más valiosas que incluyen datos en tiempo real.

Amazon Polly facilita la incorporación de habla a su vídeo, presentación o curso de formación online. Amazon Polly puede generar habla en 24 idiomas, con lo que resulta sencillo añadir voces a aplicaciones con una audiencia global. Con Amazon Polly, puede leer su fuente RSS, noticias o email y almacenar el habla sintetizada en formato de archivos de audio.

Creación de contenido
GoAnimate

“Amazon Polly proporciona a los usuarios de GoAnimate la capacidad de dar voz a los personajes que animan con nuestra plataforma al instante. Esto resulta especialmente útil en situaciones en las que la grabación de voz supone un problema de recursos o de tiempo, como cuando se crea un vídeo en muchos idiomas o durante la preproducción para acelerar el proceso de aprobación. El habla se integra a la perfección con nuestro rico conjunto de recursos preanimados, que fortalecen la facilidad de uso de GoAnimate y proporcionan eficacia y velocidad de comercialización a nuestros clientes”.

– Alvin Hung, consejero delegado y fundador, GoAnimate


Amazon Polly permite a los desarrolladores proporcionar a sus aplicaciones una experiencia visual mejorada, como la animación facial sincronizada con la voz o el resaltado de palabras al estilo karaoke. Amazon Polly facilita la solicitud de un flujo adicional de metadatos que contiene información sobre cuándo se pronuncian frases, palabras y sonidos concretos. Al usar este flujo de metadatos junto a la corriente de audio de voz sintetizada, los clientes pueden animar avatares y resaltar el texto a la vez que se dice el texto en su aplicación.

Creación de contenido
Wizkids

“Nos esforzamos por hacer que el aula administrada desde la nube sea más entretenida y eficaz para todos, incluidos los usuarios con discapacidades de lectura y escritura. Amazon Polly mejora nuestra plataforma de aprendizaje al integrar voces de texto a habla de calidad con nuestro conjunto de productos AppWriter. Es absolutamente esencial para nuestros usuarios ver en tiempo real el resaltado del texto mientras se lee en voz alta. Con las marcas de voz de Polly, AppWriter puede ofrecer una experiencia de lectura mejorada que realmente nivele el campo de juego para cualquier persona que tienes problemas con la lectura y la escritura".

- Stefan Pal, director ejecutivo, Wizkids

Amazon Polly hace que resulte sencillo agregar voces a sus aplicaciones y juegos móviles. Con Amazon Polly, puede almacenar respuestas de voz estándar en el dispositivo y además habilitar respuestas dinámicas en tiempo real como el diálogo interno entre personajes de un videojuego, las tablas de clasificaciones e invitaciones de videojuegos.

Aplicaciones móviles y de escritorio
The Washington Post

"Hace tiempo que estamos interesados en ofrecer versiones de audio de nuestras más de 1 200 historias diarias, pero las soluciones de texto a voz existentes hasta el momento no nos resultaban rentables ateniendo a la calidad del habla que nos ofrecían. Con la llegada de Amazon Polly y sus voces de alta calidad, esperamos ofrecer a nuestros lectores maneras más ricas y versátiles de experimentar nuestro contenido".

- Joseph Price, director sénior de producto, The Washington Post


Con Amazon Polly, sus centros de asistencia al cliente pueden responder con voces con un sonido natural. Puede reproducir el habla de salida de Amazon Polly mediante sus sistemas de respuesta de voz interactiva (IVR). Además, puede utilizar la API de Amazon Polly para proporcionar información automatizada en tiempo real, como estados del servicio, consultas sobre cuentas y facturación, direcciones e información de contacto.

Centro de asistencia al cliente

Amazon Polly facilita nuevos casos de uso del Internet de las cosas (IoT) al hacer que resulte sencillo y económico añadir habla a dispositivos de IoT. Los dispositivos de IoT pueden utilizar el habla para proporcionar respuestas y notificaciones naturales, hacer que las aplicaciones sean más accesibles y permitir a los usuarios consumir información sin tener que depender de una pantalla. Con Amazon Polly, puede generar archivos de habla y almacenarlos en sus dispositivos para una reproducción offline.

Use AWS Lambda para generar URL de Polly prefirmadas basadas en eventos del motor de reglas de AWS IoT y, a continuación, utilice Device Gateway para enviar las URL a los dispositivos de IoT y permitirles solicitar habla realista.

Internet de las cosas (IoT)

Puede utilizar Amazon Polly para mejorar la capacidad de uso de aplicaciones que enseñan a los usuarios a hablar otros idiomas. Por ejemplo, los usuarios finales pueden escribir frases en otros idiomas en su aplicación y escuchar cómo las pronuncia un hablante nativo. Amazon Polly es compatible con 24 idiomas, por lo que aporta numerosas opciones a profesores y alumnos.

Aprendizaje de idiomas
Duolingo

“No se me ocurren muchos casos de uso en los que la pronunciación exacta sea más importante que cuando se aprende un idioma nuevo. Hemos descubierto que las voces de Amazon Polly no solo son de calidad, sino que funcionan igual de bien que las voces humanas a la hora de enseñar un idioma”.

– Severin Hacker, director de tecnología, Duolingo


Con Amazon Polly, puede crear y distribuir información accesible en formato de habla sintentizada para personas con discapacidades visuales. De este modo, puede ayudar a aquellos con problemas de visión a utilizar contenido, como noticias, libros o mensajes de correo electrónico.

Real Instituto Nacional para Ciegos

“En la actualidad, utilizamos la tecnología de texto a habla de Amazon para crear y distribuir información accesible como contenido de audio sintetizado para nuestros numerosos clientes B2B y B2C, incluidas compañías de servicios públicos, instituciones financieras y compañías de medios, así como otro material para los clientes, como revistas y publicaciones. Con la presentación de Amazon Polly, estamos entusiasmados con poder proporcionar una experiencia todavía mejor a esos clientes al entregar voces extremadamente realistas que cautivarán e involucrarán a nuestro público”.

– John Worsfold, director de implementación de soluciones, Real Instituto Nacional para Ciegos

Es muy fácil comenzar a usar Amazon Polly. Inicie sesión en la consola para comenzar a generar habla a partir de su propio texto con tan solo unos clics.

Introducción