Archivos

En Amazon Glacier, los datos se almacenan en “archivos”. Cualquier archivo se puede comprimir: de fotos, videos o documentos. Puede cargar un único elemento como archivo o añadir varios elementos en un archivo TAR o ZIP y cargarlos como un solo archivo.

Cada elemento puede tener un tamaño máximo de 40 terabytes. En Amazon Glacier puede almacenar una cantidad ilimitada de archivos y de datos. Cuando se crea un archivo, se le asigna un ID de archivo único y el contenido del archivo es inmutable, es decir, no se puede actualizar una vez creado.

Almacenes

Amazon Glacier utiliza “almacenes” como contenedores para almacenar archivos. Puede ver la lista de sus almacenes en la consola de administración de AWS y utilizar los AWS SDK para realizar diversas operaciones relacionadas con los almacenes, como crearlos, eliminarlos, bloquearlos, obtener una lista de sus metadatos, recuperar su inventario, etiquetarlos para la utilización de filtros y configurar notificaciones. También puede establecer políticas de acceso para cada almacén que permitan o denieguen actividades específicas a los usuarios. Cada cuenta de AWS puede disponer hasta 1000 almacenes.

Características principales

Características de recuperación de datos

Amazon Glacier proporciona tres características de recuperación de archivos que se adaptan a los diversos requisitos de tiempo de acceso y costos: Expedited, Standard y Bulk. Los archivos solicitados mediante las recuperaciones Expedited suelen encontrarse disponibles en cuestión de 1 a 5 minutos, lo que le permite acceder a sus datos con rapidez cuando se necesitan las ocasionales solicitudes urgentes de un subconjunto de datos. Con las recuperaciones Standard, los archivos suelen estar accesibles en cuestión de 3 a 5 horas. O puede utilizar las recuperaciones Bulk para obtener acceso de forma rentable a partes significativas de los datos, cuyo tamaño puede alcanzar los petabytes, por un cuarto de céntimo por GB.

Obtenga más información sobre las características de recuperación de datos de Amazon Glacier » 

Amazon Glacier Select

Amazon Glacier Select permite que se ejecuten consultas directamente en datos almacenados en Amazon Glacier sin tener que recuperar el archivo entero. Amazon Glacier Select modifica el valor del almacenamiento de archivos porque le permite procesar y encontrar únicamente los bytes que necesita del archivo que se usará para análisis.

Su aplicación de análisis puede llamar a la API de Amazon Glacier Select para recuperar únicamente los datos relevantes para su consulta desde el archivo de Amazon Glacier. Amazon Glacier Select pronto se integrará con Amazon Athena y Amazon Redshift Spectrum, por lo que ahora puede considerar los archivos de Glacier como parte de su lago de datos.

Antes del surgimiento de Glacier Select, era necesario recuperar completamente un archivo de Amazon Glacier para poder utilizar los datos. Ahora los clientes pueden usar Glacier Select para reducir costos y obtener más información a partir de sus datos de archivos.

Integración entre AWS Snowball y Direct Connect

AWS Snowball puede acelerar la transferencia de grandes volúmenes de datos desde y hacia AWS mediante dispositivos de almacenamiento portátiles. AWS extrae o envía datos de estos dispositivos mediante la red interna de alta velocidad de Amazon, sin tener que pasar por Internet. En conjuntos de datos significativos, usar AWS Snowball suele ser más rápido que realizar transferencias a través de Internet, y más económico que invertir en mejorar la velocidad de la conectividad. Puede utilizar AWS Snowball para migrar datos a la nube, distribuir contenido a clientes, enviar backups a AWS y realizar recuperaciones de desastres.

AWS Direct Connect facilita el establecimiento de una conexión de red dedicada con gran ancho de banda desde sus instalaciones a AWS. Con AWS Direct Connect, puede transferir los datos críticos de su empresa directamente desde el centro de datos a AWS pasando por alto a su proveedor de Internet y evitando la congestión de la red. Además, AWS Direct Connect le permite escalar fácilmente su conexión para adecuarla a sus necesidades de transferencia de datos. AWS Direct Connect ofrece conexiones de 1 Gbps y 10 Gbps. Si necesita más capacidad, podrá aprovisionar fácilmente varias conexiones.

Bloqueo de almacenes

El bloqueo de almacenes de Amazon Glacier le permite implementar y aplicar fácilmente controles de cumplimiento en almacenes de Glacier individuales mediante una política de bloqueo. Puede especificar controles como “Grabación única, lectura múltiple (WORM)” en una política de bloqueo de almacenes y bloquear futuras ediciones de la política. Una vez bloqueada, la política permanece inalterable y Amazon Glacier aplicará los controles prescritos para ayudarlo a cumplir sus objetivos de conformidad. Para obtener más información, consulte Bloqueo de almacenes de Amazon Glacier en la Guía para desarrolladores de Amazon Glacier.

Control de acceso

Amazon Glacier utiliza AWS Identity and Access Management (IAM) para ayudarle a controlar el acceso a AWS y a sus datos de Amazon Glacier de manera segura. Puede crear usuarios en IAM, asignarles credenciales de seguridad individuales (es decir, claves de acceso, contraseñas y dispositivos de autenticación multifactor) y configurar políticas de IAM en cada uno de los almacenes de Amazon Glacier para autorizar a los usuarios correspondientes a realizar ciertas actividades.

Compatibilidad para etiquetado

Amazon Glacier permite etiquetar los almacenes de Glacier para facilitar la administración de recursos y costos. Puede definir etiquetas y asociarlas con sus almacenes. Mediante el etiquetado, se permite el uso de filtros en operaciones como los informes de costos de AWS. Por ejemplo, puede usar las etiquetas para asignar los costos y el uso de Glacier a numerosos departamentos de su organización o para cualquier otra categorización. Para obtener más información, consulte Etiquetado de almacenes de Amazon Glacier.

Registros de auditoría

Amazon Glacier soporta el registro de auditoría de AWS CloudTrail, que registra las llamadas a la API de Amazon Glacier de su cuenta y le proporciona los logs. Estos logs aportan visibilidad respecto a las acciones llevadas a cabo en sus activos de Amazon Glacier. Por ejemplo, puede determinar qué usuarios han obtenido acceso a un almacén en el último mes o identificar quién ha borrado un archivo concreto y cuándo lo ha hecho. Los registros de auditoría le pueden ayudar a implementar objetivos de conformidad y gobernanza para su sistema de archivado en la nube. Para obtener más información, consulte Utilización de los registros de auditoría con Amazon Glacier.

Políticas de acceso a almacenes

Las políticas de acceso a almacenes le permiten administrar con facilidad el acceso a sus almacenes individuales de Glacier. Puede definir una política de acceso directamente en un almacén para que puedan obtener acceso a este los usuarios y los grupos empresariales internos de la organización, así como socios empresariales externos. Para obtener más información, consulte Configuración de políticas de acceso a almacenes en la Guía para desarrolladores de Amazon Glacier.

Inventario de almacenes

Amazon Glacier mantiene un inventario de todos los archivos ubicados en cada uno de sus almacenes para tareas de recuperación de desastres o de reconciliación esporádica. El inventario de los almacenes se actualiza aproximadamente una vez al día. Es posible solicitar un inventario de almacenes en forma de archivo JSON o CSV, que contendrá detalles sobre los archivos, incluido el tamaño, la fecha de creación y la descripción del archivo, si la proporcionó durante la carga. El inventario representará el estado del almacén en el momento de la actualización de inventario más reciente.

Políticas de recuperación de datos

Las políticas de recuperación de datos de Amazon Glacier permiten definir sus propios límites de recuperación de datos con unos pocos clics en la consola de AWS. Puede limitar las recuperaciones a “Solo capa gratuita” o, si desea recuperar más que la capa gratuita, puede especificar una “Tasa de recuperación máxima” para limitar su velocidad de recuperación y establecer un techo para los costos de recuperación. En ambos casos, Amazon Glacier no aceptará las solicitudes de recuperación que excedan los límites de recuperación definidos. Para obtener más información, consulte Políticas de configuración de recuperación de datos en la Guía para desarrolladores de Amazon Glacier.

Consola de administración de AWS

Se puede obtener acceso a Amazon Glacier mediante la consola de administración de AWS, una interfaz web de uso sencillo que permite crear almacenes, configurar permisos de acceso a nivel de almacén y configurar notificaciones de SNS para la recuperación de datos. La consola también presenta un resumen del uso del almacenamiento de cada almacén, además del último momento en que se actualizó el inventario de almacenes.

Kits de desarrollo de software (SDK) de AWS

La carga y recuperación de datos se efectúan mediante los AWS SDK o la API subyacente de Amazon Glacier. Amazon Glacier es compatible con los AWS SDK para Java, .NET, PHP y Python (Boto). Las bibliotecas de SDK envuelven la API subyacente de Amazon Glacier, lo que simplifica las tareas de programación. Estos SDK proporcionan bibliotecas que se asignan a una API REST subyacente y le permiten crear solicitudes y procesar respuestas con facilidad. Los AWS SDK para Java y .NET ofrecen bibliotecas de API de bajo y alto nivel.

API de bajo nivel

Las bibliotecas contenedoras de bajo nivel se asignan estrechamente a la API de Amazon Glacier subyacente y proporcionan la implementación más completa de las operaciones de Amazon Glacier subyacentes.

API de alto nivel

Las API de alto nivel simplifican todavía más el desarrollo de aplicaciones con un nivel superior de abstracción para algunas de las operaciones. Por ejemplo, durante la carga de un archivo, las API de alto nivel procesarán la suma de comprobación de forma automática.

Para obtener más información sobre estas bibliotecas de SDK, consulte Utilización de AWS SDK para Java con Amazon Glacier y Utilización de AWS SDK para .NET con Amazon Glacier.

Administración integrada del ciclo de vida con Amazon S3

Amazon Glacier se combina con las normas de ciclo de vida de Amazon S3 para ayudarle a automatizar el archivado de datos de Amazon S3 y reducir sus costos de almacenamiento generales. Puede configurar fácilmente una norma que almacene todas las versiones de objetos de Amazon S3 anteriores en la clase de almacenamiento de costo inferior de Glacier y las elimine del almacenamiento de Glacier a los 100 días. Con este ejemplo, dispondría de 100 días para anular cualquier cambio realizado en los datos y reduciría automáticamente sus costos de almacenamiento. Para obtener más información sobre la configuración del ciclo de vida y la transición de objetos a Amazon Glacier, consulte la sección sobre Administración del ciclo de vida de objetos en la Guía para desarrolladores de Amazon Simple Storage Service

Protección de datos

Los datos almacenados en Amazon Glacier están protegidos por defecto; solo los propietarios de los almacenes disponen de acceso a los recursos de Amazon Glacier que han creado. Amazon Glacier cifra sus datos en descanso de manera predeterminada y soporta el tránsito de datos seguro a través de SSL. También es compatible con los mecanismos de control del acceso mediante las políticas de Identity and Access Management (IAM). Gracias a las características de protección de datos de Amazon Glacier, puede proteger los datos de errores tanto físicos como lógicos. De esta forma se evita la pérdida de datos provocada por acciones involuntarias del usuario, errores de la aplicación y errores de la infraestructura. En el caso de los clientes que deben cumplir con normas reglamentarias, como las de PCI e HIPAA, las funciones de protección de datos de Amazon Glacier se pueden utilizar como parte de una estrategia global para lograr la conformidad. A continuación, se describen detalladamente las diferentes características de fiabilidad y seguridad de datos que ofrece Amazon Glacier.

Cifrado de manera predeterminada

Amazon Glacier cifra automáticamente los datos en reposo mediante las claves simétricas del estándar de cifrado avanzado (AES) de 256 bits y soporta la transferencia segura de los datos a través de la capa de conexión segura (SSL).

Archivos inmutables

Los datos almacenados en Amazon Glacier son inmutables, lo que significa que, una vez creado un archivo, no se puede actualizar. Eso garantiza que datos como los registros de conformidad y normativos no se puedan modificar una vez archivados.

Obtenga más información sobre los archivos de Amazon Glacier »

Control de acceso flexible mediante las políticas de IAM

Amazon Glacier soporta las políticas de Identity and Access Management (IAM), lo que permite a las organizaciones con numerosos empleados crear y administrar múltiples usuarios con una sola cuenta de AWS. Con las políticas de IAM, puede crear políticas de control minuciosas de los almacenes de Amazon Glacier. Puede escribir políticas de IAM para conceder o revocar ciertos permisos y acciones determinados en cada uno de los almacenes de Amazon Glacier.

Firma de solicitud obligatoria

Amazon Glacier exige que se firmen todas las solicitudes como método de protección de la autenticación. Para firmar una solicitud, usted ha de calcular una firma digital a través de una función hash criptográfica que le proporciona un valor hash, que debe incluir en la solicitud como firma. Tras recibir su solicitud, Amazon Glacier recalcula la firma con la misma función hash y los datos que usted ha introducido para firmar la solicitud antes de procesarla.

Obtenga más información sobre la firma de solicitudes de Amazon Glacier »

Durabilidad y fiabilidad de los datos

Amazon Glacier proporciona una infraestructura de almacenamiento de alta durabilidad pensada para el almacenamiento de archivos de datos a largo plazo. Está diseñado para ofrecer una durabilidad anual media de archivos del 99,999999999%. El servicio almacena datos de manera redundante en varias zonas de disponibilidad de AWS (AZ) y en diferentes dispositivos dentro de cada una de ellas. Para aumentar la durabilidad, Amazon Glacier almacena sus datos de forma sincronizada en varias zonas de disponibilidad antes de confirmar que la carga se realizó correctamente.

Para impedir la corrupción de los paquetes de datos en el cable, Amazon Glacier carga la suma de comprobación de los datos durante el proceso de carga de estos. Compara la suma de comprobación recibida con la suma de comprobación de los datos recibidos para detectar cambios en los bits producidos en el cable. Asimismo, valida la autenticidad de los datos mediante sumas de comprobación durante la recuperación de los datos. A diferencia de los sistemas tradicionales, que pueden requerir una engorrosa tarea de verificación y reparación manual de los datos, Amazon Glacier lleva a cabo verificaciones periódicas y sistemáticas de la integridad de los datos y los recupera automáticamente.

Obtenga más información sobre las sumas de comprobación de los datos »

Administración de datos

Operaciones de archivado en Amazon Glacier

Amazon Glacier soporta las siguientes operaciones: carga, descarga y eliminación. Los archivos son inmutables y no se pueden modificar.

Carga de un archivo a Amazon Glacier

La carga de un archivo es una operación sincrónica. Puede cargar un archivo en una sola operación o cargar archivos de mayor tamaño por partes con la API MultipartUpload para mejorar el desempeño y la tolerancia a errores. Puede cargar archivos de 1 byte de tamaño como mínimo y de 40 TB como máximo. Una vez que el archivo se haya almacenado de forma duradera, obtendrá un ID de archivo único. Para obtener más información, consulte Carga de archivos en Amazon Glacier para obtener consejos sobre cuándo usar MultipartUpload para mejorar el rendimiento.

Descarga de un archivo de Amazon Glacier

La descarga de un archivo es una operación asíncrona. Primero debe iniciar el trabajo de recuperación de un archivo específico. Cuando recibe la solicitud de trabajo, Amazon Glacier prepara el archivo para su descarga. Una vez completado el trabajo, dispone de 24 horas para descargar los datos de la ubicación de almacenamiento provisional.

Eliminación de un archivo en Amazon Glacier

Para eliminar un archivo, debe usar la API REST de Amazon Glacier o los AWS SDK y especificar el ID del archivo. También puede utilizar varias herramientas de terceros para eliminar archivos. Para obtener más información, consulte Eliminación de un archivo en Amazon Glacier.

Uso previsto y restricciones

El uso que realice de este servicio está sujeto al Contrato de cliente de Amazon Web Services.

Obtenga más información sobre los precios de Amazon Glacier

Visite la página de precios
¿Listo para crear?
Introducción a Amazon Glacier
¿Tiene más preguntas?
Contáctese con nosotros