API de uso sencillo

Amazon Polly proporciona una API que le permite integrar la síntesis del habla en su aplicación de manera rápida. Simplemente envía el texto que desea convertir en habla a la API de Amazon Polly, y Amazon Polly le envía al instante la transmisión de audio a su aplicación, para que pueda comenzar a transmitirla directamente o almacenarla en un formato de archivo de audio estándar, como MP3.

Frecuencia de muestreo Código de muestra
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Amplia selección de voces e idiomas

Amazon Polly incluye decenas de voces realistas y es compatible con varios idiomas, de manera que puede seleccionar la voz ideal y distribuir sus aplicaciones con voz en numerosos países.

Idioma Mujer
Hombre
Inglés australiano Nicole Russell
Portugués de Brasil Vitória Ricardo
Francés canadiense Chantal  
Danés Naja Mads
Neerlandés Lotte Ruben
Francés

Léa

Céline

Mathieu

 

Alemán Vicki Hans
  Marlene  
Hindi Aditi
 
Islandés Dóra Karl
Inglés de la India

Raveena

Aditi

 
Italiano Carla Giorgio
Japonés Mizuki Takumi
Coreano Seoyeon  
Chino mandarín Zhiyu  
Noruego Liv  
Polaco Ewa Jacek
  Maja Jan
Portugués de Portugal Inês Cristiano
Rumano Carmen  
Ruso Tatyana Maxim
Español castellano Conchita Enrique
Sueco Astrid  
Turco Filiz  
Inglés británico Amy Brian
  Emma  
Inglés estadounidense Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
Español estadounidense Penélope Miguel
Galés Gwyneth  
Inglés de Gales   Geraint

Sincronización de voz para una experiencia visual mejorada

Amazon Polly facilita la solicitud de un flujo adicional de metadatos que proporcione información sobre cuándo se pronuncian frases, palabras y sonidos concretos. Al usar este flujo de metadatos junto con el flujo de audio de voz sintetizada, ahora puede crear sus aplicaciones con una experiencia visual mejorada, como animación facial sincronizada con voz o resaltado de palabras estilo karaoke.

Consulte la documentación para obtener más información sobre cómo utilizar las marcas de voz. 

Optimice su audio de streaming

Con Amazon Polly, puede transmitir cualquier tipo de información a los usuarios mediante su aplicación en casi tiempo real. Puede elegir entre varias tasas de muestreo para optimizar el ancho de banda y la calidad de audio de su aplicación. Amazon Polly soporta MP3, Vorbis y formatos de transmisión de audio PCM sin procesar.

Frecuencia de muestreo Tamaño de MP3   Tamaño OGG
Tamaño PCM
22,05 kHz Escuchar
19,02 KB 19,14 KB N/D
16,05 kHz Escuchar 16,04 KB
16,35 KB
99,53 KB
8,00 kHz Escuchar 13,26 KB 10,40 KB 49,76 KB

Ajuste la frecuencia, el tono y el volumen de la voz

Amazon Polly es compatible con el lenguaje de etiquetado de síntesis del habla (SSML), un lenguaje de etiquetado basado en XML estándar para aplicaciones de síntesis del habla, y admite etiquetas SSML comunes para frases, énfasis y entonación. Esta flexibilidad le permite crear habla realista que atraerá y retendrá la atención de su público.

Si desea obtener más información, visite la documentación de Amazon Polly en las etiquetas SSML.

Muestra SSML
Así hablo normalmente. (ninguno)
Puedo hablar con un tono agudo o puedo hablar con un tono grave. <speak>Puedo hablar con un <prosody pitch="high">tono agudo</prosody>, o puedo hablar con un<prosody pitch="low">tono grave</prosody>.</speak>
Puedo hablar muy lento o puedo hablar muy rápido. <speak>Puedo hablar <prosody rate="x-slow">muy lento</prosody>, o puedo hablar <prosody rate="x-fast">muy rápido</prosody>.</speak>
También puedo hablar muy alto o puedo hablar muy bajo. <speak>También puedo hablar <prosody volume="x-loud">muy alto</prosody> o puedo hablar <prosody volume="x-soft">muy bajo</prosody>.</speak>
Puedo susurrar. <speak>Le voy a contar un secreto susurrando.<amazon:effect name="whispered">'<prosody rate="x-slow"> <prosody volume="loud">No soy humano.</prosody></prosody></amazon:effect>¿A que es increíble?</speak>

Ajuste de la duración máxima del habla

Amazon Polly le permite ajustar automáticamente la velocidad del habla en función del tiempo máximo asignado que defina con una característica llamada prosodia basada en tiempo. Esta función es útil en muchos casos de uso, especialmente en la localización.

Por ejemplo, supongamos que tiene habla en inglés de EE.UU. integrada en un video de formación técnica y desea localizar este video al alemán. Imaginemos que traduce el texto con Amazon Translate y lo reproduce oralmente con Polly. Es fundamental que el habla localizada al alemán se transmita en los marcos del video correspondientes, por lo que el habla en alemán no puede ser más larga que el habla en inglés de EE.UU. Puede usar esta característica para facilitar el proceso de doblaje.

Compatibilidad con plataformas y lenguajes de programación

Amazon Polly admite todos los lenguajes de programación incluidos en el AWS SDK (Java, Node.js, .NET, PHP, Python, Ruby, Go y C++) y el SDK para móviles de AWS (iOS/Android). Polly también soporta una API de HTTP para que pueda implementar su propia capa de acceso.

Síntesis del habla mediante la API, la consola o la línea de comandos

Puede accederse a Amazon Polly a través del API de Polly (y varios SDK de lenguaje específico), la consola de administración de AWS y la interfaz de línea de comandos (CLI) de AWS. Dispone de control absoluto de todas las capacidades de Amazon Polly, tanto si utiliza el servicio a través de la consola como de la API o la CLI.

Lexicones personalizados

Con los lexicones personalizados, o vocabularios, de Amazon Polly puede modificar la pronunciación de determinadas palabras, como nombres de compañías, acrónimos, palabras extranjeras y neologismos (p. ej., “ROTFL”, “C’est la vie” en una voz no francesa). Para personalizar estas pronunciaciones, debe cargar un archivo XML con entradas léxicas. Por ejemplo, puede personalizar la pronunciación de Nguyen proporcionando un fonema con este código XML:

<lexeme>
            <grapheme>Nguyen</grapheme>
            <grapheme>nguyen</grapheme>
            <grapheme>NGUYEN</grapheme>
            <phoneme>"nu.jEn'</phoneme>
</lexeme>

Más información sobre los precios de Amazon Polly

Visite la página de precios
¿Listo para comenzar?
Inscribirse
¿Tiene más preguntas?
Contacte con nosotros