Big data se puede describir en torno a desafíos de administración de datos que, debido al incremento en el volumen, la velocidad y la variedad de los datos, no se puede resolver con las bases de datos tradicionales. Aunque existen numerosas definiciones de big data, la mayoría incluyen el concepto de lo que se conoce como las “tres V” de los big data:

Volumen: va desde terabytes hasta petabytes de datos

Variedad: incluye datos de una amplia variedad de orígenes y formatos (p. ej., registros web, interacciones en las redes sociales, transacciones en línea y de comercio electrónico, transacciones financieras, etc.)

Velocidad: cada vez más, las empresas tienen requisitos exigentes desde el momento en que se generan los datos al momento en que se entrega información procesable a los usuarios. Por lo tanto, es necesario recopilar, almacenar, procesar y analizar los datos en periodos relativamente cortos, que van desde una vez al día hasta en tiempo real


A pesar de que se habla mucho de ellos, muchas empresas no se dan cuenta de que tienen un problema de big data, o simplemente no lo consideran en términos de big data. Por lo general, una organización probablemente se beneficiará de las tecnologías de big data cuando las bases de datos y las aplicaciones existentes ya no puedan escalarse para soportar aumentos repentinos de volumen, variedad y velocidad de los datos.

No hacer frente a los desafíos de big data puede resultar en el incremento gradual de los costos, así como en la reducción de la productividad y la competitividad. Por otro lado, una estrategia de big data adecuada puede ayudar a las empresas a reducir los costos y adquirir eficacia operativa al migrar las cargas de trabajo intensivas existentes a tecnologías de big data, así como al implementar nuevas aplicaciones para aprovechar nuevas oportunidades.


BigData__hadoop

Con nuevas herramientas que se ocupan de todo el ciclo de administración de datos, las tecnologías de big data hacen que resulte técnica y económicamente viable no solo recopilar y almacenar conjuntos grandes de datos, sino también analizarlos para descubrir información nueva y valiosa. En la mayoría de los casos, el procesamiento de big data sigue un flujo de datos común, desde la recopilación de datos sin procesar al consumo de información procesable.

Recopilar. Recopilar los datos sin procesar, como transacciones, registros, dispositivos móviles y más, es el primer desafío de big data al que se enfrentan las empresas. Una plataforma de big data adecuada facilita este paso y permite a los desarrolladores la recepción de una gran variedad de datos, tanto estructurados como no estructurados, a cualquier velocidad, ya sea en tiempo real o en lotes.

Almacenar. Cualquier plataforma de big data necesita un repositorio seguro, escalable y duradero donde almacenar los datos antes o incluso después de procesarlos. En función de sus requisitos específicos, también podría necesitar almacenes temporales para los datos en tránsito.

Procesar y analizar. En este paso, los datos se transforman de datos sin procesar a datos consumibles, normalmente al ordenar, acumular, unir e incluso realizar funciones y algoritmos más avanzados. Los conjuntos de datos resultantes se almacenan para procesarlos todavía más o para que se encuentren disponibles para su consumo mediante herramientas de visualización de datos e inteligencia empresarial.

Consumir y visualizar. El objetivo de big data consiste en obtener información procesable y valiosa a partir de los activos de datos. Lo ideal es que las partes interesadas puedan acceder a los datos mediante herramientas ágiles de visualización de datos e inteligencia empresarial de autoservicio que permitan explorar los conjuntos de datos de forma rápida y sencilla. Según el tipo de análisis, los usuarios finales también podrían consumir los datos resultantes como “predicciones” estadísticas (en el caso del análisis predictivo) o como acciones recomendadas (en el caso del análisis prescriptivo).


El ecosistema de big data sigue evolucionando a un ritmo impresionante. Hoy en día, un diverso conjunto de estilos analíticos respaldan numerosas funciones al interior de la organización.

BigData__collection-processing

El análisisdescriptivo ayuda a los usuarios a contestar la pregunta: “¿Qué ocurrió y por qué?” Algunos ejemplos son la consultas tradicionales y los entornos de generación de informes con tarjetas de puntuaciones y paneles.

El análisis predictivo ayuda a los usuarios a estimar la probabilidad de que se produzca un evento determinado en la característica. Entre los ejemplos se incluyen sistemas de alerta, detección del fraude, aplicaciones de mantenimiento preventivo y predicciones.

El análisis prescriptivo proporciona recomendaciones (prescriptivas) específicas al usuario. Estas responden a la pregunta: ¿Qué debería hacer si ocurre “x”?

En un principio, los marcos de big data como Hadoop solamente eran compatibles con las cargas de trabajo por lotes, en las que los conjuntos de datos grandes se procesaban por lotes durante un periodo de tiempo determinado, que normalmente abarcaba horas si no días. Sin embargo, a medida que el tiempo de obtención de la información se volvió más importante, la “velocidad” del big data ha motivado la evolución de nuevos marcos, como Apache Spark, Apache Kafka, Amazon Kinesis y otros, compatibles con el procesamiento de datos de streaming y en tiempo real.


Amazon Web Services proporciona una cartera amplia y totalmente integrada de servicios de informática en la nube que le ayudan a crear, proteger e implementar las aplicaciones de big data. Con AWS, no es necesario aprovisionar hardware ni mantener y escalar infraestructura, de modo que puede concentrar sus recursos en descubrir información nueva. Además, se añaden nuevas capacidades y características constantemente, por lo que siempre puede beneficiarse de las tecnologías más recientes sin compromisos de inversiones a largo plazo.

Más información sobre la plataforma y las herramientas de big data de AWS »

Disponibilidad inmediata

La mayoría de las tecnologías de big data necesitan clústeres de servidores de gran tamaño, lo que resulta en largos ciclos de configuración y aprovisionamiento. Con AWS puede implementar la infraestructura que necesita prácticamente al instante. Gracias a ello, sus equipos pueden incrementar su productividad, resulta más sencillo probar cosas nuevas y los proyectos se pueden poner en marcha antes.

Capacidades amplias y profundas

Las cargas de trabajo de big data son tan diversas como los activos de datos que analizan. Con una plataforma amplia y profunda puede crear prácticamente cualquier aplicación de big data y admitir cualquier carga de trabajo, independientemente del volumen, la velocidad y la variedad de los datos. Con más de 50 servicios y cientos de características agregadas todos los años, AWS proporciona todo lo necesario para recopilar, almacenar, procesar, analizar y visualizar big data en la nube. Más información sobre la plataforma de big data de AWS.

Confianza y seguridad

Los big data son datos confidenciales. Por lo tanto, es fundamental proteger los activos de datos y la infraestructura sin perder agilidad. AWS proporciona capacidades en instalaciones, redes, software y procesos empresariales para satisfacer los requisitos más exigentes. Se realizan auditorías de los entornos constantemente, de acuerdo con certificaciones como ISO 27001, FedRAMP, DoD SRG y PCI DSS. Los programas de control ayudan a demostrar su conformidad con más de 20 estándares, incluidos HIPAA, NCSC y más. Visite el centro de seguridad en la nube para obtener más información.

Cientos de socios y soluciones

Un ecosistema de socios de gran tamaño puede ayudarle a solventar la carencia de habilidades y comenzar con los big data con incluso mayor rapidez. Visite la red de socios de AWS para obtener ayuda de un socio consultor o elegir entre las numerosas herramientas y aplicaciones en toda la pila de administración de datos.


Permítanos ayudarle a resolver sus desafíos de big data. Déjenos las arduas tareas administrativas a nosotros y concentre más tiempo y recursos en los objetivos de su negocio o empresa.

Más información sobre lassoluciones de big data de AWS »