Publicado en: Jul 27, 2023
Nos complace anunciar que, a partir de hoy, puede recuperar secretos de AWS Secrets Manager en Amazon EMR sin servidor desde sus trabajos de Spark y Hive. Amazon EMR sin servidor es una opción que facilita a los analistas e ingenieros de datos la ejecución de marcos de análisis de macrodatos de código abierto (como Apache Spark y Apache Hive) sin configurar, administrar ni escalar clústeres o servidores.
Los trabajos de Spark o Hive suelen necesitar acceder a información confidencial, como las credenciales de las bases de datos y las claves de API, para conectarse a otros sistemas. Es una práctica recomendada desvincular la gestión de dicha información confidencial de la configuración de la aplicación. De esta manera, se mejora la reutilización del código y se reduce la sobrecarga operativa de actualizar la configuración de la aplicación al actualizar los secretos. Ahora puede especificar de forma segura las referencias a los secretos almacenados en Secrets Manager como parte de las configuraciones o clasificaciones de los trabajos de EMR sin servidor. Durante la versión ejecutable, esas referencias se reemplazarán por valores secretos. Esta característica es especialmente útil para los casos de uso que necesitan especificar credenciales para las bases de datos de metaalmacenes de Hive externas en la configuración de la aplicación.
Esta característica está disponible para todas las versiones de EMR y en todas las regiones en las que está disponible Amazon EMR sin servidor. Para obtener más información y ver ejemplos de cómo especificar referencias a secretos, consulte Uso de SecretsManager en EMR sin servidor.