Amazon Redshift – самое популярное и быстрое облачное хранилище данных. Сервис Redshift интегрирован с вашим озером данных, а также в 3 раза более производителен и стоит на 75 % дешевле, чем любое другое облачное хранилище данных.

Возможности и преимущества

Каждый год мы выпускаем сотни возможностей и улучшений продукта, руководствуясь примерами использования и отзывами клиентов. Узнайте больше о новых возможностях.

Самые широкие возможности интеграции с вашим озером данных и сервисами AWS

Amazon Redshift позволяет быстро и просто работать с данными в открытых форматах, а также без труда подключаться к экосистеме AWS.

Экспорт в озеро данных и из него, а также запросы к данным. Это единственное облачное хранилище данных, в котором настолько удобно выполнять запросы к данным и записывать их обратно в озеро данных, используя открытые форматы. Сервис позволяет выполнять запросы к данным непосредственно в S3 в таких открытых форматах, как Parquet, ORC, JSON, Avro, CSV и другие, используя привычный ANSI SQL. Чтобы экспортировать данные в озеро данных, просто используйте команду Redshift UNLOAD в своем коде SQL и укажите Parquet в качестве формата файла. Redshift автоматически возьмет на себя форматирование данных и перемещение их в S3. Это позволит вам хранить высокоструктурированные и часто используемые данные в хранилище данных Redshift, а эксабайты структурированных, частично структурированных и неструктурированных данных – в S3. Экспорт данных из Redshift обратно в озеро данных позволяет дополнительно проводить их анализ с помощью таких сервисов AWS, как Amazon Athena, Amazon EMR и Amazon SageMaker

Федеративные запросы (режим ознакомления). Новые возможности Redshift в виде федеративных запросов позволят вам получить доступ к содержимому своей операционной реляционной базе данных. Выполните запрос к оперативным данным в одной или нескольких базах данных Amazon RDS и Aurora PostgreSQL, чтобы получить мгновенную видимость комплексных бизнес‑операций без необходимости перемещения данных. Вы можете объединять данные из своего хранилища Redshift, озера данных, а теперь и данные из операционных хранилищ, чтобы принимать более взвешенные решения на их основе. Redshift предлагает комплексные методы оптимизации для сокращения объема данных, перемещаемых по сети, и дополняет их возможностями массово‑параллельной обработки данных для высокопроизводительных запросов. Начните работу в режиме ознакомления уже сегодня.

Аналитическая экосистема AWS. Встроенная интеграция с аналитической экосистемой AWS радикально упрощает управление комплексными аналитическими рабочими процессами. Например, AWS Lake Formation – сервис для удобной настройки безопасного озера данных всего за несколько дней. AWS Glue можно использовать для действий по извлечению, преобразованию и загрузке (ETL) данных в Redshift. Amazon Kinesis Data Firehose предоставляет самый простой способ захвата, преобразования и загрузки потоковых данных в Redshift для анализа в режиме, близком к реальному времени. Вы можете использовать Amazon EMR для обработки данных с помощью Hadoop / Spark и загружать результаты в Amazon Redshift для нужд анализа и бизнес‑аналитики. Amazon QuickSight – это первый сервис бизнес‑аналитики с оплатой по количеству сеансов. Его можно использовать для создания отчетов, визуализаций и информационных панелей при работе с данными Redshift. Вы можете использовать Redshift для подготовки данных к выполнению рабочих нагрузок машинного обучения с помощью Amazon SageMaker. Чтобы ускорить миграцию в Amazon Redshift, вы можете использовать AWS Schema Conversion Tool и AWS Database Migration Service (DMS). Amazon Redshift также тесно интегрирован с Amazon Key Management Service (KMS) и Amazon CloudWatch для обеспечения безопасности, осуществления мониторинга и соответствия требованиям.

Наилучшая производительность

Amazon Redshift предлагает производительность и гибкость, соответствующие лучшим показателям в отрасли.

Инстансы RA3. Производительность инстансов RA3 в 3 раза превышает возможности любого другого сервиса облачного хранения данных. Эти инстансы Amazon Redshift обеспечивают максимальную скорость при обработке ресурсоемких рабочих нагрузок с высокими требованиями к вычислительным мощностям. С RA3 вы можете указывать необходимое количество инстансов и оплачивать вычислительные ресурсы отдельно от услуг хранилища.

Эффективное хранение и высокопроизводительная обработка запросов. Amazon Redshift обеспечивает высокую производительность запросов для любых наборов данных объемом от гигабайтов до петабайтов. Столбчатое хранилище, сжатие данных и карты зон сокращают количество операций ввода‑вывода, необходимых для выполнения запросов. Наряду с такими стандартными для отрасли алгоритмами кодирования, как LZO и Zstandard, Amazon Redshift также предлагает специализированное кодирование при сжатии AZ64 для таких типов данных, как числовые данные и данные даты и времени. Это необходимо, чтобы обеспечить как экономию объема хранилища, так и оптимизацию производительности запросов.

Материализованные представления. Материализованные представления Amazon Redshift позволяют значительно повысить производительность запросов для аналитических рабочих нагрузок, таких как отображение информации на информационных панелях, выполнение запросов из инструментов бизнес‑аналитики (BI) и задания по извлечению, загрузке и преобразованию данных (ELT). Материализованные представления можно использовать для кэширования промежуточных результатов, чтобы ускорить выполнение медленных запросов. Amazon Redshift может эффективно поддерживать материализованные представления в постепенной манере, в то время как преимущества производительности с низкой задержкой предоставляются непрерывно. Подробнее

Машинное обучение для оптимизации пропускной способности и производительности. Продвинутые возможности машинного обучения в Amazon Redshift обеспечивают высокую пропускную способность и производительность даже при переменных рабочих нагрузках или значительной одновременной активности пользователей. Amazon Redshift использует сложные алгоритмы для прогнозирования и классификации входящих запросов на основе их времени выполнения и требований к ресурсам. Такой подход позволяет осуществлять динамическое управление производительностью и параллельными операциями, а также помогает расставлять приоритеты для критически важных рабочих нагрузок. Функция ускорения коротких запросов (SQA) отправляет короткие запросы от таких приложений, как информационные панели, в экспресс‑очередь для немедленной обработки, позволяя им не простаивать в очереди за объемными запросами. Автоматическое управление рабочими нагрузками (WLM) использует машинное обучение для динамического управления памятью и параллельными операциями. Такой подход помогает оптимизировать пропускную способность запросов. Кроме того, теперь вы можете без труда расставить приоритеты для наиболее важных запросов, даже когда их число достигает нескольких сотен. Amazon Redshift – это в том числе самообучающаяся система, которая непрерывно следит за рабочей нагрузкой пользователя, определяет возможности для повышения производительности по мере роста объема использования, эффективно оптимизирует работу и дает рекомендации через Redshift Advisor, когда дальнейшее повышение производительности Amazon Redshift требует явных действий пользователя. 

Кэширование результатов. С возможностью кэширования результатов в Amazon Redshift можно обрабатывать повторяющиеся запросы за доли секунды. Благодаря этому значительно увеличивается производительность панелей управления, а также инструментов визуализации и бизнес‑аналитики, которые выполняют повторяющиеся запросы. При получении запроса Amazon Redshift выполняет поиск по кэшу, в котором может храниться результат прошлой обработки такого запроса. Если результат был найден в кэше и данные не изменились, сервис незамедлительно выдает этот результат вместо повторного выполнения запроса.

Широчайшие возможности масштабирования

Независимо от того, масштабируете ли вы данные или число пользователей, ресурс Amazon Redshift практически безграничен. 

Хранение петабайтов данных. Amazon Redshift можно быстро и просто масштабировать по мере изменения потребностей пользователя. Чтобы изменить количество или тип узлов в хранилище данных либо осуществить масштабирование в любом направлении в зависимости от текущих потребностей, достаточно нескольких щелчков мышью в консоли или простого вызова API. С управляемым хранилищем емкость добавляется автоматически для поддержки рабочих нагрузок объемом до 8 ПБ сжатых данных. 

Анализ озер данных, объем которых измеряется петабайтами. Вы можете выполнять запросы к петабайтам данных в Amazon S3 без необходимости загружать или преобразовывать эти данные благодаря возможности Redshift Spectrum. Безопасное и экономичное озеро данных с высокой доступностью Amazon S3 можно использовать для хранения неограниченных объемов данных в открытых форматах. Amazon Redshift Spectrum выполняет запросы к тысячам параллельно работающих узлов, чтобы пользователи могли быстро получать результаты вне зависимости от сложности запроса или объема данных.  

Неограниченное число параллельных операций. Amazon Redshift обеспечивает стабильно высокую производительность даже при параллельном выполнении тысяч запросов вне зависимости от того, обращаются они к данным в хранилище Amazon Redshift или напрямую к озеру данных в Amazon S3. Возможность параллельного масштабирования Amazon Redshift поддерживает практически неограниченное число одновременно работающих пользователей и одновременных запросов с неизменным качеством обслуживания. Таким образом сервис может добавлять временные ресурсы за несколько секунд по мере роста параллельной нагрузки. 

Наилучшее соотношение цены и качества

Использование Amazon Redshift в качестве облачного хранилища данных позволяет оплачивать вычислительные ресурсы отдельно от услуг хранилища, обеспечивает предсказуемые расходы благодаря механизмам управления, а также предоставляет возможность оплаты в процессе работы или экономии до 75 % с обязательством по использованию зарезервированного инстанса.

Гибкие варианты цен. Amazon Redshift является наиболее экономичным хранилищем данных и предоставляет пользователям возможность оптимизировать оплату хранения. Работу с сервисом можно начать по тарифу 0,25 USD в час без обязательств, а затем масштабировать операции всего за 1000 USD за терабайт данных в год. Amazon Redshift – это единственное облачное хранилище данных, которое предлагает сразу несколько вариантов оплаты: оплату ресурсов по требованию без авансовых платежей, резервирование инстансов на 1 или 3 года с экономией вплоть до 75 % либо плату за выполнение конкретных запросов на основании объема данных, считанных сервисом в озере данных Amazon S3. Цены Amazon Redshift включают в себя встроенную защиту и сжатие данных, резервное хранилище и плату за передачу данных. По мере увеличения объема данных вы можете использовать управляемое хранилище на инстансах RA3 для экономичного хранения по цене 0,024 USD за гигабайт в месяц.

Предсказуемая стоимость даже в случае непредсказуемых нагрузок. Amazon Redshift позволяет клиентам масштабировать ресурсы с минимальными колебаниями стоимости операций, поскольку каждый кластер накапливает до одного часа бесплатных кредитов для параллельного масштабирования в день. Этого объема бесплатных кредитов достаточно для обеспечения потребностей в параллельных операциях 97 % клиентов. Благодаря такому подходу клиенты сервиса могут уверенно прогнозировать свои месячные расходы даже в периоды колебания спроса на проведение аналитики. 

Выберите тип узла, чтобы получить инстанс с оптимальной стоимостью для ваших рабочих нагрузок. Вы можете выбрать один из трех типов инстансов, чтобы оптимизировать Amazon Redshift под ваши потребности в хранении данных.

Узлы RA3 позволяют масштабировать хранилище независимо от проводимых вычислений. С RA3 вы получаете высокопроизводительное хранилище данных, которое хранит данные в отдельном уровне хранилища. Вам нужно лишь указать объем хранилища данных для обеспечения требуемой производительности запросов.

С помощью узлов Dense Compute (DC) вы можете создавать хранилища данных с очень высокой производительностью, в которых используются мощные ЦПУ, большие объемы ОЗУ и твердотельные накопители (SSD). Это лучший вариант в том случае, если объемы данных не превышают 500 ГБ.

Узлы DS2 (Dense Storage) позволяют создавать большие хранилища данных с использованием жестких дисков (HDD) по низкой цене при резервировании инстансов сроком на 3 года. Такой подход делает этот тип узла наиболее экономичным для рабочих нагрузок, которым требуется большой объем хранилища. Большинство клиентов, работающих на кластерах DS2, могут перенести рабочие нагрузки на кластеры RA3 и получить в 2 раза больше производительности и объема хранилища по цене DS2.
Для масштабирования кластера или переключения между типами узлов достаточно одного вызова API или нескольких щелчков мышью в Консоли AWS. Подробнее см. на странице цен.

Удобство управления

Amazon Redshift автоматизирует стандартные задачи обслуживания, поэтому вы можете сосредоточиться на анализе данных, не отвлекаясь обеспечение работы хранилища.

Автоматическое выделение ресурсов. Amazon Redshift отличается удобством настройки и управления. Выполнить развертывание нового хранилища данных можно за несколько щелчков мышью в Консоли AWS, после чего Redshift автоматически выделит необходимую инфраструктуру. Большинство административных задач, таких как резервное копирование и репликация, автоматизированы. Если требуются дополнительные настройки, в сервисе можно вносить корректировки с учетом конкретных рабочих нагрузок. Выпуск новых возможностей осуществляется в фоновом режиме, поэтому пользователям не нужно планировать и выполнять обновление или установку исправлений.

Автоматическое резервное копирование. Данные Amazon Redshift автоматически копируются в Amazon S3, и сервис может асинхронно реплицировать ваши снимки состояния в S3 в другой регион для аварийного восстановления. Чтобы восстановить кластер с помощью Консоли управления AWS или API сервиса Redshift, можно использовать любые снимки состояния системы, в том числе пользовательские. Кластер становится доступным сразу после восстановления метаданных системы. Это позволяет начать отправку запросов, пока данные пользователя загружаются в буфер в фоновом режиме.

Отказоустойчивость. В сервисе предусмотрено несколько возможностей для повышения надежности кластера хранилища данных. Amazon Redshift ведет непрерывный мониторинг состояния кластера, автоматически реплицирует данные с неисправных дисков и заменяет узлы по мере необходимости для обеспечения отказоустойчивости.

Гибкие возможности работы с запросами. Amazon Redshift позволяет выполнять запросы из консоли или подключать клиентские инструменты SQL, библиотеки и инструменты бизнес‑аналитики. Редактор запросов Консоли AWS предоставляет функциональный интерфейс для выполнения SQL‑запросов в кластерах Amazon Redshift, просмотра результатов и плана выполнения запросов, смежных с запросами пользователя (в том случае, если они исполняются на вычислительных узлах).

Встроенная обработка пространственных данных. В Amazon Redshift встроены функциональные возможности обработки пространственных данных. Они позволяют клиентам хранить, извлекать и обрабатывать пространственные данные и повышают эффективность аналитической бизнес‑информации путем интеграции пространственных данных в аналитические запросы. Amazon Redshift предоставляет полиморфный тип данных GEOMETRY, который поддерживает множество геометрических фигур, таких как Точка, Линия, Полигон и т. д. Redshift также предоставляет соответствующие возможности SQL для построения геометрических фигур, импорта, экспорта, обеспечения доступа к пространственным данным и их обработки. Вы можете добавлять столбцы GEOMETRY в таблицы Redshift и создавать запросы SQL, охватывающие как пространственные, так и непространственные данные. Кроме того, благодаря возможности Redshift эффективно выполнять запросы к озерам данных вы можете легко распространить на них обработку пространственных данных, интегрируя внешние таблицы в пространственные запросы.

Интеграция с инструментами сторонних разработчиков. Возможности Amazon Redshift можно расширить, используя лучшие отраслевые инструменты и опыт экспертов по загрузке, преобразованию и визуализации данных. Решения партнеров из нашего обширного списка прошли сертификацию для использования с Amazon Redshift.

Максимальная безопасность и соответствие требованиям

AWS обладает широкими возможностями обеспечения безопасности для удовлетворения самых высоких требований, а Amazon Redshift обеспечивает готовую защиту данных без дополнительных затрат.

Комплексное шифрование. С помощью всего нескольких параметров вы можете настроить использование сертификата SSL в сервисе Amazon Redshift для обеспечения безопасности данных во время передачи, а для шифрования данных при хранении можно использовать протокол AES‑256 с аппаратным ускорением. Если включить шифрование данных при хранении, все данные, записанные на диск, будут зашифрованы вместе с их резервными копиями. По умолчанию сервис Amazon Redshift осуществляет управление ключами шифрования самостоятельно.

Изолирование сети. Amazon Redshift позволяет настроить правила брандмауэра для управления сетевым доступом к кластеру хранилища данных. Вы можете запустить Amazon Redshift внутри сервиса Amazon Virtual Private Cloud (VPC), чтобы изолировать кластер хранилища данных в собственной виртуальной сети и подключить его к имеющейся ИТ‑инфраструктуре с помощью зашифрованной сети IPsec VPN отраслевого стандарта.

Аудит и соответствие требованиям. Сервис Amazon Redshift интегрирован с AWS CloudTrail, что обеспечивает возможность проведения аудита всех вызовов API Redshift. Сервис Redshift вносит в журнал все операции SQL, включая попытки подключения, запросы и изменения хранилища данных. Доступ к этим журналам можно получить с помощью SQL‑запросов к системным таблицам. Также журналы можно сохранить в надежном расположении в Amazon S3. Amazon Redshift соответствует требованиям стандартов SOC 1, SOC 2, SOC 3 и PCI DSS Level 1. Подробнее см. на странице «Соответствие облака AWS требованиям».

Точное управление доступом. Детальный контроль безопасности на уровне отдельных строк и столбцов позволяет давать пользователям доступ к конкретным данным. Amazon Redshift интегрирован с AWS Lake Formation, что обеспечивает принятый в Lake Formation контроль доступа на уровне столбцов в том числе для запросов Redshift к данным в озере данных.

Узнайте больше о новых возможностях.

Более подробную информацию о продукте см. в документации Amazon Redshift.

Подробнее о ценах на Amazon Redshift

Перейти на страницу цен
Готовы приступить к разработке?
Начать работу с Amazon Redshift
Есть вопросы?
Свяжитесь с нами