Amazon EMR

Apache HBase в Amazon EMR

Преимущества Apache HBase для EMR

Amazon EMR изначально поддерживает Apache HBase, предоставляя доступ в реальном времени к таблицам, которые можно масштабировать до миллиардов строк и миллионов столбцов. Amazon EMR сочетает преимущества Apache HBase с открытым исходным кодом – хранилища данных, ориентированного на столбцы, в распределенных системах – с надежностью, производительностью, интеграцией и инструментами Amazon EMR. Вы можете обеспечить стабильную запись и чтение, а также запрашивать результаты по петабайтам данных за миллисекунды для выполнения критически важных рабочих нагрузок в сфере финансовых услуг, рекламных технологий, веб-аналитики и приложений с использованием данных временных рядов. Существующие приложения Apache HBase будут работать в Amazon EMR без изменений кода. Подробнее об Apache HBase на Amazon EMR.

Функции и преимущества

HFiles) в Amazon S3.

и томов Amazon EBS, поэтому аппаратное обеспечение кластера можно настроить для оптимизации затрат и производительности.

e для получения дополнительной информации о возможностях Amazon EMR.

с использованием файловой системы EMR. Разделение хранилища и вычислительных узлов кластера путем использования Amazon S3 в качестве хранилища данных обеспечивает ряд преимуществ по сравнению с файловой системой HDFS на кластере. Можно сэкономить, определив размер кластера на основе требований к вычислительным ресурсам, а не требований к хранилищу данных HDFS, и получить при этом доступное и надежное хранилище на базе S3. Можно масштабировать вычислительные узлы без влияния на базовое хранилище, прекращать работу кластера для сокращения расходов, а затем быстро его восстанавливать. Можно также создавать и настраивать кластер реплики чтения в другой зоне доступности Amazon EC2, обеспечивающей доступ только для чтения к тем же данным, что и основной кластер, и обеспечивать непрерывный доступ к используемым данным, даже если основной кластер становится недоступным.

Истории успеха клиентов, использующих HBase и EMR

Истории успеха клиентов: FINRA

FINRA использует Amazon EMR для запуска Apache HBase на Amazon S3, благодаря чему удается быстро получить доступ к триллионам торговых записей и сократить расходы более чем на 60 %.

Ознакомиться с FINRA

Истории успеха клиентов: Monster

Monster использует Apache HBase в Amazon EMR для хранения данных об анализе навигации и рекламных кампаниях, а также выполнения SQL-запросов с помощью Apache Hive.

Ознакомиться с Monster