Archivos

En Amazon S3 Glacier, los datos se almacenan en "archivos". Cualquier archivo se puede comprimir: fotos, videos o documentos. Puede cargar un único elemento como archivo o añadir varios elementos en un archivo TAR o ZIP y cargarlos como un solo archivo.

Cada elemento puede tener un tamaño máximo de 40 terabytes. En Amazon S3 Glacier puede almacenar una cantidad ilimitada de archivos y datos. Cuando se crea un archivo, se le asigna un ID único y su contenido es inmutable, es decir, no se puede actualizar una vez creado.

Almacenes

Amazon S3 Glacier utiliza "almacenes" como contenedores para almacenar archivos. Puede ver la lista de sus almacenes en la consola de administración de AWS y utilizar los SDK de AWS para realizar diversas operaciones relacionadas con los almacenes, como crearlos, eliminarlos, bloquearlos, obtener una lista de sus metadatos, recuperar su inventario, etiquetarlos para utilizar filtros y configurar notificaciones. También puede establecer políticas de acceso para cada almacén que permitan o denieguen actividades específicas a los usuarios. Cada cuenta de AWS puede disponer hasta 1000 almacenes.

Características principales

Características de recuperación de datos

Amazon S3 Glacier proporciona tres características de recuperación de archivos que se adaptan a los diversos requisitos de tiempo de acceso y costos: Expedited, Standard y Bulk. Los archivos solicitados mediante las recuperaciones Expedited suelen encontrarse disponibles en cuestión de 1 a 5 minutos, lo que le permite acceder a sus datos con rapidez cuando se necesitan las ocasionales solicitudes urgentes de un subconjunto de datos. Con las recuperaciones Standard, los archivos suelen estar accesibles en cuestión de 3 a 5 horas. O puede utilizar las recuperaciones Bulk para obtener acceso de forma rentable a partes significativas de los datos, cuyo tamaño puede alcanzar los petabytes, por un cuarto de céntimo por GB.

Obtenga más información sobre las características de recuperación de datos de Amazon S3 Glacier » 

Amazon S3 Glacier Select

Amazon S3 Glacier Select permite que se ejecuten consultas directamente en datos almacenados en Amazon S3 Glacier sin tener que recuperar el archivo entero. Amazon S3 Glacier Select modifica el valor del almacenamiento de archivos porque le permite procesar y encontrar únicamente los bytes que necesita del archivo que se usará para análisis.

Su aplicación de análisis puede llamar a la API de Amazon S3 Glacier Select para recuperar únicamente los datos relevantes para su consulta del archivo de Amazon S3 Glacier. Amazon S3 Glacier Select pronto se integrará con Amazon Athena y Amazon Redshift Spectrum, por lo que ahora puede considerar los archivos de S3 Glacier como parte de su lago de datos.

Antes del surgimiento de S3 Glacier Select, era necesario recuperar completamente un archivo de Amazon S3 Glacier para poder utilizar los datos. Ahora los clientes pueden usar S3 Glacier Select para reducir costos y obtener más información a partir de sus datos de archivos.

Integración entre AWS Snowball y Direct Connect

AWS Snowball puede acelerar la transferencia de grandes volúmenes de datos desde y hacia AWS mediante dispositivos de almacenamiento portátiles. AWS extrae o envía datos de estos dispositivos mediante la red interna de alta velocidad de Amazon, sin tener que pasar por Internet. En conjuntos de datos significativos, usar AWS Snowball suele ser más rápido que realizar transferencias a través de Internet, y más económico que invertir en mejorar la velocidad de la conectividad. Puede utilizar AWS Snowball para migrar datos a la nube, distribuir contenido a clientes, enviar backups a AWS y realizar recuperaciones de desastres.

AWS Direct Connect facilita el establecimiento de una conexión de red dedicada con gran ancho de banda desde sus instalaciones a AWS. Con AWS Direct Connect, puede transferir los datos críticos de su empresa directamente desde el centro de datos a AWS pasando por alto a su proveedor de Internet y evitando la congestión de la red. Además, AWS Direct Connect le permite escalar fácilmente su conexión para adecuarla a sus necesidades de transferencia de datos. AWS Direct Connect ofrece conexiones de 1 Gbps y 10 Gbps. Si necesita más capacidad, podrá aprovisionar fácilmente varias conexiones.

Bloqueo de almacenes

El bloqueo de almacenes de Amazon S3 Glacier le permite implementar y aplicar fácilmente controles de cumplimiento en almacenes de S3 Glacier individuales mediante una política de bloqueo. Puede especificar controles como "Escritura única, lectura múltiple (WORM)" en una política de bloqueo de almacenes y bloquear futuras ediciones de la política. Una vez bloqueada, la política permanece inalterable y Amazon S3 Glacier aplicará los controles prescritos para ayudarlo a cumplir sus objetivos de conformidad. Para obtener más información, consulte Bloqueo de almacenes de Amazon S3 Glacier en la Guía para desarrolladores de Amazon S3 Glacier.

Control de acceso

Amazon S3 Glacier utiliza AWS Identity and Access Management (IAM) para ayudarlo a controlar el acceso a AWS y a sus datos de Amazon S3 Glacier de manera segura. Puede crear usuarios en IAM, asignarles credenciales de seguridad individuales (es decir, claves de acceso, contraseñas y dispositivos de autenticación multifactor) y configurar políticas de IAM en cada uno de los almacenes de Amazon S3 Glacier para autorizar a los usuarios correspondientes a realizar ciertas actividades.

Compatibilidad para etiquetado

Amazon S3 Glacier permite etiquetar los almacenes de S3 Glacier para facilitar la administración de recursos y costos. Puede definir etiquetas y asociarlas con sus almacenes. Mediante el etiquetado, se permite el uso de filtros en operaciones como los informes de costos de AWS. Por ejemplo, puede usar las etiquetas para asignar los costos y el uso de S3 Glacier a numerosos departamentos de su organización o para cualquier otra categorización. Para obtener más información, consulte Etiquetar los almacenes de Amazon S3 Glacier.

Registros de auditoría

Amazon S3 Glacier admite la creación de registros de auditoría con AWS CloudTrail, que registra las llamadas a la API de Amazon S3 Glacier de su cuenta y le proporciona los registros. Estos registros aportan visibilidad sobre las acciones llevadas a cabo en sus activos de Amazon S3 Glacier. Por ejemplo, puede determinar qué usuarios obtuvieron acceso a un almacén en el último mes o identificar quién borró un archivo concreto y cuándo lo hizo. Los registros de auditoría lo pueden ayudar a definir metas de conformidad y gobernanza para su sistema de archivado en la nube. Para obtener más información, consulte Utilización de los registros de auditoría con Amazon S3 Glacier.

Políticas de acceso a almacenes

Las políticas de acceso a almacenes le permiten administrar con facilidad el acceso a sus almacenes individuales de S3 Glacier. Puede definir una política de acceso directamente en un almacén para que puedan obtener acceso a este los usuarios y los grupos empresariales internos de la organización, así como socios empresariales externos. Para obtener más información, consulte Administración de políticas de acceso a almacenes en la Guía para desarrolladores de Amazon S3 Glacier.

Inventario de almacenes

Amazon S3 Glacier mantiene un inventario de todos los archivos ubicados en cada uno de sus almacenes para tareas de recuperación de desastres o de reconciliación esporádica. El inventario de los almacenes se actualiza aproximadamente una vez al día. Es posible solicitar un inventario de almacenes en forma de archivo JSON o CSV, que contendrá detalles sobre los archivos, incluido el tamaño, la fecha de creación y la descripción del archivo, si la proporcionó durante la carga. El inventario representará el estado del almacén en el momento de la actualización de inventario más reciente.

Políticas de recuperación de datos

Las políticas de recuperación de datos de Amazon S3 Glacier permiten definir sus propios límites de recuperación de datos con unos pocos clics en la consola de AWS. Puede limitar las recuperaciones a “Solo capa gratuita” o, si desea recuperar más que la capa gratuita, puede especificar una “Tasa de recuperación máxima” para limitar su velocidad de recuperación y establecer un techo para los costos de recuperación. En ambos casos, Amazon S3 Glacier no aceptará las solicitudes de recuperación que excedan los límites de recuperación definidos. Para obtener más información, consulte Configuración de políticas de recuperación de datos en la guía para desarrolladores de Amazon S3 Glacier.

Consola de administración de AWS

Se puede obtener acceso a Amazon S3 Glacier mediante la consola de administración de AWS, una interfaz web de uso sencillo que permite crear almacenes, configurar permisos de acceso a nivel de almacén y configurar notificaciones de SNS para la recuperación de datos. La consola también presenta un resumen del uso del almacenamiento de cada almacén, además del último momento en que se actualizó el inventario de almacenes.

Kits de desarrollo de software (SDK) de AWS

La carga y recuperación de datos se efectúan mediante los SDK de AWS o la API subyacente de Amazon S3 Glacier. Amazon S3 Glacier es compatible con los SDK de AWS para Java, .NET, PHP y Python (Boto). Las bibliotecas de SDK encapsulan la API subyacente de Amazon S3 Glacier, lo que simplifica las tareas de programación. Estos SDK proporcionan bibliotecas que se asignan a una API REST subyacente y le permiten crear solicitudes y procesar respuestas con facilidad. Los AWS SDK para Java y .NET ofrecen bibliotecas de API de bajo y alto nivel.

API de bajo nivel

Las bibliotecas encapsuladoras de bajo nivel se asignan estrechamente a la API de Amazon S3 Glacier subyacente y proporcionan la implementación más completa de las operaciones de Amazon S3 Glacier subyacentes.

API de alto nivel

Las API de alto nivel simplifican todavía más el desarrollo de aplicaciones con un nivel superior de abstracción para algunas de las operaciones. Por ejemplo, durante la carga de un archivo, las API de alto nivel procesarán la suma de comprobación de forma automática.

Para obtener más información sobre estas bibliotecas de SDK, consulte Utilización de SDK de AWS para Java con Amazon S3 Glacier y Utilización de SDK de AWS para .NET con Amazon S3 Glacier.

Administración integrada del ciclo de vida con Amazon S3

Amazon S3 Glacier se combina con las normas de ciclo de vida de Amazon S3 para ayudarlo a automatizar el archivado de datos de Amazon S3 y reducir sus costos de almacenamiento generales. Puede configurar fácilmente una norma que almacene todas las versiones de objetos de Amazon S3 anteriores en la clase de almacenamiento de costo inferior de S3 Glacier y las elimine del almacenamiento de S3 Glacier a los 100 días. Con este ejemplo, dispondría de 100 días para anular cualquier cambio realizado en los datos y reduciría automáticamente sus costos de almacenamiento. Para obtener más información sobre la configuración del ciclo de vida y la transición de objetos a Amazon S3 Glacier, consulte la sección sobre Administración del ciclo de vida de objetos en la Guía para desarrolladores de Amazon Simple Storage Service

Protección de datos

Los datos almacenados en Amazon S3 Glacier están protegidos por defecto; solo los propietarios de los almacenes disponen de acceso a los recursos de Amazon S3 Glacier que crearon. Amazon S3 Glacier cifra sus datos en descanso de manera predeterminada y admite el tránsito de datos seguro a través de SSL. También es compatible con los mecanismos de control del acceso mediante las políticas de Identity and Access Management (IAM). Gracias a las características de protección de datos de Amazon S3 Glacier, puede proteger los datos de errores tanto físicos como lógicos. De esta forma, se evita la pérdida de datos provocada por acciones involuntarias del usuario, errores de la aplicación y errores de la infraestructura. En el caso de los clientes que deben cumplir con normas reglamentarias, como las de PCI e HIPAA, las funciones de protección de datos de Amazon S3 Glacier se pueden utilizar como parte de una estrategia global para lograr dicho cumplimiento normativo. A continuación, se describen detalladamente las diferentes características de fiabilidad y seguridad de datos que ofrece Amazon S3 Glacier.

Cifrado de manera predeterminada

Amazon S3 Glacier cifra automáticamente los datos en reposo mediante las claves simétricas del estándar de cifrado avanzado (AES) de 256 bits y admite la transferencia segura de los datos a través de la capa de conexión segura (SSL).

Archivos inmutables

Los datos almacenados en Amazon S3 Glacier son inmutables, lo que significa que, una vez creado un archivo, no se puede actualizar. Eso garantiza que datos como los registros de conformidad y normativos no se puedan modificar una vez archivados.

Obtenga más información sobre los archivos de Amazon S3 Glacier »

Control de acceso flexible mediante las políticas de IAM

Amazon S3 Glacier admite las políticas de Identity and Access Management (IAM), lo que permite a las organizaciones con muchos empleados crear y administrar múltiples usuarios con una sola cuenta de AWS. Con las políticas de IAM, puede crear políticas de control minuciosas de los almacenes de Amazon S3 Glacier. Puede escribir políticas de IAM para conceder o revocar ciertos permisos y acciones determinados en cada uno de los almacenes de Amazon S3 Glacier.

Firma de solicitud obligatoria

Amazon S3 Glacier exige que se firmen todas las solicitudes como método de protección de la autenticación. Para firmar una solicitud, usted debe calcular una firma digital a través de una función hash criptográfica que le proporciona un valor hash, que debe incluir en la solicitud como firma. Tras recibir su solicitud, Amazon S3 Glacier recalcula la firma con la misma función hash y los datos que usted introdujo para firmar la solicitud antes de procesarla.

Obtenga más información sobre la firma de solicitudes de Amazon S3 Glacier »

Durabilidad y fiabilidad de los datos

Amazon S3 Glacier proporciona una infraestructura de almacenamiento de larga duración diseñada para el almacenamiento de archivos de datos a largo plazo. Está diseñado para ofrecer una durabilidad anual media de archivos del 99,999999999 %. El servicio almacena datos de manera redundante en varias zonas de disponibilidad de AWS y en diferentes dispositivos dentro de cada una de ellas. Para aumentar el porcentaje de durabilidad, Amazon S3 Glacier almacena sus datos de forma sincronizada en varias zonas de disponibilidad antes de confirmar que la carga se realizó correctamente.

Para impedir que los paquetes de datos se corrompan durante el envío por cable, Amazon S3 Glacier carga la suma de comprobación de los datos mientras se realiza el proceso de carga de estos. Compara la suma de comprobación recibida con la suma de comprobación de los datos recibidos para detectar cambios en los bits producidos durante el envío por cable. Asimismo, valida la autenticidad de los datos mediante sumas de comprobación durante la recuperación de los datos. A diferencia de los sistemas tradicionales, que pueden requerir una ardua tarea de verificación y reparación manual de los datos, Amazon S3 Glacier lleva a cabo verificaciones periódicas y sistemáticas de la integridad de los datos y los recupera automáticamente.

Obtenga más información sobre las sumas de comprobación de los datos »

Administración de datos

Operaciones de archivado en Amazon S3 Glacier

Amazon S3 Glacier admite las siguientes operaciones: carga, descarga y eliminación. Los archivos son inmutables y no se pueden modificar.

Carga de un archivo a Amazon S3 Glacier

La carga de un archivo es una operación sincrónica. Puede cargar un archivo en una sola operación o cargar archivos de mayor tamaño por partes con la API MultipartUpload para mejorar el desempeño y la tolerancia a errores. Puede cargar archivos de 1 byte de tamaño como mínimo y de 40 TB como máximo. Una vez que el archivo se haya almacenado de forma duradera, obtendrá un ID de archivo único. Para obtener más información, consulte Carga de archivos en Amazon S3 Glacier para obtener consejos sobre cuándo usar MultipartUpload para mejorar el rendimiento.

Descarga de un archivo de Amazon S3 Glacier

La descarga de un archivo es una operación asíncrona. Primero debe iniciar el trabajo de recuperación de un archivo específico. Cuando recibe la solicitud de trabajo, Amazon S3 Glacier prepara el archivo para su descarga. Una vez completado el trabajo, dispone de 24 horas para descargar los datos de la ubicación de almacenamiento provisional.

Eliminación de un archivo en Amazon S3 Glacier

Para eliminar un archivo, debe usar la API REST de Amazon S3 Glacier o los SDK de AWS y especificar el ID del archivo. También puede utilizar varias herramientas de terceros para eliminar archivos. Para obtener más información, consulte Eliminación de un archivo en Amazon S3 Glacier.

Uso previsto y restricciones

El uso que realice de este servicio está sujeto al Contrato de cliente de Amazon Web Services.

Más información sobre los precios de Amazon S3 Glacier

Visite la página de precios
¿Listo para crear?
Introducción a Amazon S3 Glacier
¿Tiene más preguntas?
Contacte con nosotros