- Аналитика
- Amazon EMR
- Apache HBase на EMR
Apache HBase в Amazon EMR
Преимущества Apache HBase для EMR
Функции и преимущества
HFiles) в Amazon S3.
и томов Amazon EBS, поэтому аппаратное обеспечение кластера можно настроить для оптимизации затрат и производительности.
e для получения дополнительной информации о возможностях Amazon EMR.
с использованием файловой системы EMR. Разделение хранилища и вычислительных узлов кластера путем использования Amazon S3 в качестве хранилища данных обеспечивает ряд преимуществ по сравнению с файловой системой HDFS на кластере. Можно сэкономить, определив размер кластера на основе требований к вычислительным ресурсам, а не требований к хранилищу данных HDFS, и получить при этом доступное и надежное хранилище на базе S3. Можно масштабировать вычислительные узлы без влияния на базовое хранилище, прекращать работу кластера для сокращения расходов, а затем быстро его восстанавливать. Можно также создавать и настраивать кластер реплики чтения в другой зоне доступности Amazon EC2, обеспечивающей доступ только для чтения к тем же данным, что и основной кластер, и обеспечивать непрерывный доступ к используемым данным, даже если основной кластер становится недоступным.
Истории успеха клиентов, использующих HBase и EMR
Истории успеха клиентов: FINRA
FINRA использует Amazon EMR для запуска Apache HBase на Amazon S3, благодаря чему удается быстро получить доступ к триллионам торговых записей и сократить расходы более чем на 60 %.
Истории успеха клиентов: Monster
Monster использует Apache HBase в Amazon EMR для хранения данных об анализе навигации и рекламных кампаниях, а также выполнения SQL-запросов с помощью Apache Hive.