Amazon Redshift позволяет охватить запросами к хранилищу данных еще и озеро данных без дополнительной загрузки данных. Сервис может выполнять запросы к петабайтам данных, хранящихся на локальных дисках Redshift, и непосредственно к эксабайтам данных, хранящихся в Amazon S3. Этот простой в настройке сервис позволяет автоматизировать большую часть задач администрирования и обеспечивает высокую производительность при любых масштабах.

Основные возможности

Повышенная производительность

Массово-параллельная обработка. Amazon Redshift обеспечивает высокую скорость выполнения запросов к наборам данных объемом от нескольких гигабайтов до нескольких эксабайтов. В Redshift реализовано колоночное хранилище, сжатие данных и карты зон для сокращения количества операций ввода-вывода, требуемых для выполнения запросов. В его технологии используется архитектура хранилища с массово-параллельной обработкой (MPP), которая распределяет и параллельно выполняет операции SQL для максимального использования всех доступных ресурсов. Базовое оборудование сервиса предназначено для высокопроизводительной обработки данных с помощью локально подключенного хранилища для максимального увеличения объема данных, проходящих между ЦПУ и дисками в единицу времени, а также с помощью сотовой сети с высокой пропускной способностью для максимального увеличения объема данных, проходящих между узлами в единицу времени.

Машинное обучение. В Amazon Redshift используется машинное обучение, с помощью которого анализируются рабочие нагрузки и обеспечивается высокая пропускная способность. Redshift применяет сложные алгоритмы, чтобы прогнозировать скорость выполнения входящих запросов, и по итогам анализа приписывает запросы к подходящей очереди так, чтобы оптимизировать их обработку. Например, запросы для панелей управления и отчетов, для которых прежде всего требуется параллельное выполнение, направляются в экспресс-очередь, где они обрабатываются моментально.

Кэширование результатов. Кэширование результатов в Amazon Redshift позволяет обрабатывать повторяющиеся запросы за доли секунды. Благодаря этому значительно увеличивается производительность инструментов панелей управления, визуализации и бизнес-аналитики, которые выполняют повторяющиеся запросы. При получении запроса Redshift выполняет поиск по кэшу, в котором может храниться кэшированный результат прошлой обработки такого запроса. Если кэшированный результат обнаружен и данные не изменились, сервис незамедлительно выдает кэшированный результат вместо того, чтобы повторно выполнять запрос.

Простая настройка, развертывание и управление

Автоматическое выделение ресурсов. Amazon Redshift отличает простота настройки и управления. Выполнить развертывание нового хранилища данных можно за несколько щелчков мышью в Консоли AWS, после чего Redshift автоматически выделит инфраструктуру. Этот сервис автоматизирует большую часть задач администрирования, таких как создание резервных копий и репликация, позволяя пользователям сконцентрироваться непосредственно на данных. Если требуются дополнительные настройки, в Redshift предусмотрена возможность внесения корректировок с учетом конкретных рабочих нагрузок. Выпуск новых возможностей осуществляется в фоновом режиме, пользователям не приходится планировать и выполнять обновление или установку исправлений.

Автоматическое резервное копирование. Amazon Redshift в автоматическом режиме непрерывно создает резервные копии данных и сохраняет их в Amazon S3. Сервис Redshift может асинхронно копировать снимки состояния в S3 в другом регионе для аварийного восстановления. Чтобы восстановить кластер с помощью Консоли управления AWS или API Redshift, можно использовать любые снимки состояния системы, в том числе пользовательские. Кластер становится доступным, как только восстановлены метаданные системы. Это позволяет начать отправку запросов, пока данные пользователя загружаются в буфер в фоновом режиме.

Устойчивость к сбоям. В Amazon Redshift предусмотрено несколько возможностей, которые повышают надежность кластера хранилища данных. Redshift выполняет непрерывный мониторинг состояния кластера, автоматически реплицирует данные с неисправных дисков и заменяет узлы по мере необходимости обеспечения устойчивости к сбоям.

Интеграция с инструментами сторонних разработчиков. Возможности Amazon Redshift можно расширить, используя лучшие в отрасли инструменты и опыт экспертов по загрузке, преобразованию и визуализации данных. Решения партнеров из нашего обширного списка сертифицированы для использования с Amazon Redshift.

Экономичность

Оплата по факту использования без авансовых платежей. Amazon Redshift – это самое экономичное хранилище данных, которое оплачивается только по факту использования выделенных ресурсов. Работу с сервисом можно начать по тарифу 0,25 USD в час без каких-либо обязательств, а затем масштабировать объем работы, оплачивая всего 250 USD за терабайт данных в год. Redshift – это единственное облачное хранилище данных, которое предлагает сразу несколько вариантов оплаты: плату по требованию без каких-либо авансовых платежей, резервирование инстансов на 1 или 3 года, что позволяет сэкономить до 75 %, либо плату за выполнение конкретных запросов на основании объема данных, просканированных сервисом в озере данных Amazon S3. Подробности см. на странице цен на Amazon Redshift.

Возможность выбора типа узла. Пользователи могут выбирать из двух типов узлов так, чтобы Redshift максимально отвечал их требованиям к хранению данных. С помощью узлов Dense Compute (DC) можно создать хранилища данных с очень высокой производительностью, в которых используются мощные ЦПУ, большие объемы ОЗУ и твердотельные накопители (SSD). Чтобы сократить издержки или расширить возможности масштабирования, пользователи могут перейти на более экономичные узлы типа Dense Storage (DS), в которых используются жесткие диски большего объема по крайне низкой цене. Для масштабирования или переключения между типами узлов достаточно одного вызова API или нескольких щелчков мышью в Консоли AWS.

Быстрое масштабирование в зависимости от потребностей

Хранение данных в объемах, исчисляемых в петабайтах. Amazon Redshift можно просто и быстро масштабировать по мере изменения потребностей пользователя. Чтобы изменить количество или тип узлов в хранилище данных или осуществить масштабирование в любом направлении по мере изменения потребностей, достаточно нескольких щелчков мышью в консоли или простого вызова API.

Анализ озер данных, объем которых измеряется эксабайтами. Redshift Spectrum – это возможность Redshift, которая позволяет выполнять запросы к эксабайтам данных в Amazon S3 без необходимости загружать или преобразовывать их. Высокодоступное, безопасное и экономичное озеро данных Amazon S3 можно использовать для хранения неограниченных объемов данных в открытых форматах.

Безграничные возможности параллельной обработки. Redshift Spectrum открывает безграничные возможности параллельной обработки, позволяя выполнять множество запросов с доступом к одним и тем же данным в Amazon S3 одновременно. Redshift Spectrum выполняет запросы на огромном количестве узлов, работающих параллельно, чтобы пользователи могли быстро получить результаты вне зависимости от сложности запроса или объема данных.

Запросы к озеру данных

Озеро данных в Amazon S3. Amazon Redshift – это единственное хранилище данных, которое позволяет выполнять запросы к озеру данных Amazon S3 без необходимости загрузки данных. Можно выполнять запросы к файлам в привычных открытых форматах, таких как Avro, CSV, Grok, JSON, ORC, Parquet и многие другие, непосредственно в Amazon S3. В результате пользователи получают гибкие возможности, которые позволяют сохранять хорошо структурированные, часто запрашиваемые данные на локальных дисках Redshift, хранить эксабайты структурированных и неструктурированных данных в S3 и эффективно выполнять запросы ко всем этим данным. Это обеспечивает уникальную аналитическую информацию, которую невозможно получить из отдельных наборов данных.

Система аналитических инструментов на AWS. Amazon Redshift обеспечивает встроенную интеграцию с системой аналитических инструментов AWS. AWS Glue предназначен для извлечения, преобразования и загрузки (ETL-задачи) данных в Redshift. Amazon Kinesis Data Firehose предоставляет самый простой способ захвата, преобразования и загрузки потоковых данных в Redshift для анализа в режиме, близком к реальному времени. С помощью Amazon QuickSight можно создавать отчеты, визуализации и панели управления. Чтобы ускорить миграцию в Amazon Redshift, можно в течение полугода использовать AWS Database Migration Service (DMS) бесплатно. Подробнее »

Безопасность

Комплексное шифрование. С помощью нескольких параметров можно настроить сервис Amazon Redshift на использование сертификата SSL для обеспечения безопасности данных при передаче и шифрования AES-256 с аппаратным ускорением для шифрования данных при хранении. Если активировать шифрование данных при хранении, все данные, записанные на диск, а также их резервные копии будут зашифрованы. По умолчанию сервис Amazon Redshift самостоятельно осуществляет управление ключами шифрования.

Сетевая изоляция. Amazon Redshift позволяет настроить правила брандмауэра для управления сетевым доступом к кластеру хранилища данных. Amazon Redshift можно запустить в Amazon VPC, чтобы изолировать кластер хранилища данных в своей виртуальной сети и подключить его к имеющейся ИТ-инфраструктуре с помощью зашифрованного по стандартному протоколу IPsec VPN-подключения.

Аудит и соответствие требованиям. Amazon Redshift интегрирован с AWS CloudTrail, что обеспечивает возможность аудита всех вызовов API Redshift. Сервис Redshift вносит в журнал все операции SQL, включая попытки подключения, запросы и изменения базы данных. Доступ к этим журналам можно получить с помощью SQL-запросов к системным таблицам. Журналы также можно загрузить в защищенное хранилище Amazon S3. Amazon Redshift соответствует требованиям SOC 1, SOC 2, SOC 3 и PCI DSS Level 1. Подробнее см. на странице «Соответствие облака AWS нормативным требованиям».

Подробнее о ценах на Amazon Redshift

Перейти на страницу цен
Готовы приступить?
Начало работы с Amazon Redshift
Есть вопросы?
Свяжитесь с нами