Amazon Polly
Amazon Polly es un servicio que convierte texto en habla verosímil, lo que permite crear aplicaciones que hablan y categorías totalmente nuevas de productos con esta capacidad. Polly es un servicio de texto a voz (TTS) que utiliza tecnologías de aprendizaje profundo avanzadas para sintetizar habla que se asemeja a una voz humana. Gracias a las decenas de voces realistas en varios idiomas, puede crear aplicaciones con habla aptas para numerosos países distintos.
Además de las voces de texto a voz (TTS) estándar, Amazon Polly ofrece voces de texto a voz neuronal (NTTS) que proporcionan mejoras avanzadas en la calidad del habla a través de un nuevo enfoque de aprendizaje automático. La tecnología neuronal TTS admite también dos estilos de habla que le permiten una mejor adecuación del estilo del locutor a la aplicación: un estilo de presentador de noticias adaptado a los casos en los que se utiliza narración de las noticias y un estilo conversacional, ideal para comunicación bidireccional, como las aplicaciones de telefonía.
Por último, Brand Voice de Amazon Polly puede crear una voz personalizada para su empresa. Esto es una interacción personalizada en la que trabaja con el equipo Amazon Polly para desarrollar voces de texto a voz neuronal (NTTS) para el uso exclusivo de su empresa. Obtenga más información aquí.
5 millones de caracteres gratis
por mes, durante 12 meses con la capa gratuita de AWS
Idioma | Mujer | Hombre | Texto de muestra |
Inglés | Hello. Do you speak a foreign language? One language is never enough. | ||
Portugués de Brasil | Vitória | Ricardo | Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante. |
Danés | Naja | Mads | Hej. Taler du et fremmed sprog? Et sprog er aldrig nok. |
Francés | Léa | Mathieu | Bonjour. Parlez-vous une autre langue que le français? Une langue n'est jamais assez. |
Japonés | Mizuki |
Takumi | こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。 |
Coreano | Seoyeon | 안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。 | |
Chino mandarín | Zhiyu | 你好,你会不会说其他外语?只会一种语言是不够的。 | |
Español | Penélope | Miguel | Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente. |
Beneficios
Voces con un sonido natural
Amazon Polly suministra decenas de idiomas y una amplia selección de voces masculinas y femeninas que suenan naturales. La pronunciación fluida de textos de Amazon Polly le permite producir contenido oral de salida de alta calidad destinado a una audiencia global.
Almacene y redistribuya contenido oral
Amazon Polly permite reproducir indefinidamente contenido oral generado sin implementar tarifas adicionales. Puede crear archivos de voz en formatos estándar, como MP3 y OGG, y distribuirlos a partir de la nube o localmente con aplicaciones o dispositivos de reproducción sin conexión.
Streaming en tiempo real
La entrega de voces realistas y experiencias de conversación con los usuarios requiere tiempos de respuesta siempre rápidos. Cuando envía textos a la API de Amazon Polly, esta le devuelve el audio en su aplicación como una transmisión para que pueda reproducir las voces al instante.
Personalice y controle la salida de voz
Modifique las voces de Amazon Polly para que se adapten a sus necesidades. El servicio admite diccionarios y etiquetas SSML que le permiten controlar aspectos de la voz, como la pronunciación, el volumen, el tono, la velocidad, etc.
Bajo costo
Los precios de pago por uso, el bajo costo por caracter convertido y las reproducciones ilimitadas de Amazon Polly lo convierten en un medio rentable para darle voz a sus aplicaciones.
Casos de uso
Creación de contenido
El audio se puede utilizar como un medio complementario de las comunicaciones escritas o visuales. Mediante la conversión a habla de su contenido, puede ofrecerle a su audiencia una manera diferente de consumir información y satisfacer las necesidades de un grupo mayor de lectores. Amazon Polly puede generar contenido oral en decenas de idiomas, lo que facilita la incorporación de voz en aplicaciones con una audiencia global, como videos, sitios web o fuentes RSS.


"Amazon Polly proporciona a los usuarios de GoAnimate la capacidad de dar voz a los personajes que animan con nuestra plataforma al instante. Esto resulta especialmente útil en situaciones en las que la grabación de voz supone un problema de recursos o de tiempo, como cuando se crea un vídeo en muchos idiomas o durante la preproducción para acelerar el proceso de aprobación. El habla se integra a la perfección con nuestro completo conjunto de recursos preanimados, que fortalecen la facilidad de uso de GoAnimate y proporcionan eficacia y velocidad de comercialización a nuestros clientes".
– Alvin Hung, consejero delegado y fundador, GoAnimate
Aprendizaje electrónico
Amazon Polly permite a los desarrolladores proporcionar a sus aplicaciones una experiencia visual mejorada, como la animación facial sincronizada con la voz o el resaltado de palabras al estilo karaoke. Amazon Polly facilita la solicitud de un flujo adicional de metadatos que contiene información sobre cuándo se pronuncian frases, palabras y sonidos concretos. Al usar este flujo de metadatos junto a la corriente de audio de voz sintetizada, los clientes pueden animar avatares y resaltar el texto a la vez que se dice el texto en su aplicación.


"No se me ocurren muchos casos de uso en los que la pronunciación exacta sea más importante que cuando se aprende un idioma nuevo. Hemos descubierto que las voces de Amazon Polly no solo son de calidad, sino que funcionan igual de bien que las voces humanas a la hora de enseñar un idioma".
– Severin Hacker, director de tecnología, Duolingo
Telefonía
Con Amazon Polly, sus centros de asistencia pueden interactuar con los clientes con voces que suenan de manera natural. Puede almacenar en caché y reproducir contenido oral de Amazon Polly para dar indicaciones a quienes llaman mediante un sistema de respuesta de voz interactiva (IVR), como Amazon Connect. Además, puede utilizar la API de Amazon Polly para proporcionar información automatizada en tiempo real, como estados del servicio, consultas sobre cuentas y facturación, direcciones e información de contacto.


"Bandwidth creó una aplicación de conversión de texto a habla pequeña, ágil y fiable que cuenta con la tecnología de Amazon Polly. Estamos utilizando voces de alta calidad a bajo costo. El esfuerzo por parte de los desarrolladores para crear este nuevo servicio fue sorprendentemente bajo".
– Yiannis Philipopoulos, Sr. Desarrollador de software, ancho de banda
Obtenga más información sobre Amazon Polly