Типы узлов Amazon Redshift

Amazon Redshift содержит различные типы узлов, которые можно подобрать в соответствии с рабочими нагрузками. Рекомендуем выбирать RA3 или DC2 в зависимости от требований к производительности, размера данных и их роста. Amazon Redshift Serverless автоматически распределяет ресурсы, необходимые для обслуживания рабочей нагрузки, поэтому вам не требуется выбирать тип узла.

Узлы RA3 с управляемым хранилищем позволяют получить оптимальное хранилище данных. Менять масштаб вычислительных ресурсов и управляемого хранилища можно независимо друг от друга. Плата за них начисляется по отдельности. Используя RA3, вы выбираете нужное количество узлов на основе требований к производительности и платите только за используемый объем управляемого хранилища. Размер кластера RA3 следует подбирать на основе объема данных, обрабатываемых ежедневно.

В качестве локального хранилища, поддерживающего быструю скорость записи и чтения, в каждом узле RA3 управляемого хранилища Redshift (RMS) используются объемные высокопроизводительные твердотельные накопители (SSD). Для долгосрочного надежного хранения используется Amazon Simple Storage Service (Amazon S3). Если объем данных в узле начинает превышать размер крупных локальных SSD, RMS автоматически отправляет эти данные в Amazon S3. Независимо от того, где хранятся данные – на высокопроизводительных твердотельных накопителях или в Amazon S3, – цена за использование RMS остается неизменной и низкой. Если для рабочих нагрузок требуется постоянно увеличиваемое хранилище, объем управляемого хранилища данных может масштабироваться автоматически. При этом добавлять дополнительные узлы (и, следовательно, платить за них) не придется.

Узлы DC2 позволяют создать хранилища данных, в которых используются локальные SSD, входящие в комплект поставки, с интенсивным потреблением вычислительных ресурсов. Количество узлов зависит от объема данных и требований к производительности. Узлы DC2 хранят данные локально для обеспечения высокой производительности. По мере роста объема данных можно добавлять вычислительные узлы, чтобы увеличить объем хранилища кластера. Если объем набора данных без сжатия не превышает 1 ТБ, рекомендуем выбирать узлы DC2. Это способ получить наиболее высокую производительность по оптимальной цене. Если ожидается рост данных, рекомендуется использовать узлы RA3, чтобы изменять размер вычислительных ресурсов и хранилища независимо для оптимизации затрат и производительности.

Возможности Redshift с оплатой по факту использования

  • Типы узлов Amazon Redshift. Выберите самую лучшую конфигурацию кластера и тип узла для ваших нужд. Вы можете оплачивать ресурсы почасово, используя модель оплаты Amazon Redshift по требованию. Если вы выберете модель с оплатой по требованию, то можете пользоваться функцией приостановки и возобновления, чтобы остановить выставление счетов по требованию, когда кластер не используется. Вместо инстансов по требованию можно выбрать зарезервированные инстансы для стабильных рабочих нагрузок и получить большие скидки по сравнению с ценами на инстансы по требованию.
  • Цены на Amazon Redshift Spectrum. Этот сервис позволяет выполнять прямые SQL‑запросы по всему объему данных в озере данных Amazon S3 (в масштабе эксабайтов), при этом плата начисляется только по количеству обработанных байтов.
  • Цены на параллельное масштабирование. Каждый кластер за сутки накапливает до одного часа бесплатных кредитов для параллельного масштабирования, и для 97 % клиентов этого достаточно. Это обеспечивает стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. При превышении объема накопленных кредитов плата за масштабирование по требованию начисляется на посекундной основе.
  • Цены на RMS. Платите только за объем данных, который хранится в кластерах RA3, независимо от числа выделенных вычислительных узлов. Оплате подлежит каждый час использования общего объема управляемого хранилища, занятого данными. RMS также используется для работы с Amazon Redshift Serverless.
  • Redshift ML. Используйте SQL для создания, обучения и развертывания моделей машинного обучения (МО). После исчерпания объема, предусмотренного уровнем бесплатного пользования для Amazon SageMaker, с вас будет взиматься плата за создание моделей и занимаемое в хранилище место. Redshift ML также доступен при работе с бессерверным Amazon Redshift.

Бесплатная пробная версия Amazon Redshift

Если вы никогда раньше не пользовались бессерверным Amazon Redshift, вы имеете право получить кредит в размере 300 USD со сроком действия 90 дней на использование вычислительных ресурсов и хранилища. Скорость использования кредита зависит от фактического потребления вычислительных ресурсов бессерверного адреса.

В регионах, где бессерверный Amazon Redshift пока недоступен, клиенты могут начать бесплатно использовать пробную версию выделенных кластеров. Вы имеете право на двухмесячную бесплатную пробную версию нашего большого узла DC2. Вашей организации предоставляется 750 часов в месяц бесплатно. Этого достаточно для поддержки одного узла DC2 Large с SSD‑хранилищем сжатых данных объемом 160 ГБ. По окончании действия двухмесячной бесплатной пробной версии или при превышении объема использования в 750 часов в месяц можно остановить кластер, избежав дополнительных затрат, или продолжить его использование с оплатой согласно стандартному тарифу по требованию. Чтобы узнать больше, посетите эту страницу.

Цены по требованию

Модель оплаты Amazon Redshift по требованию позволяет оплачивать выделенные ресурсы исходя из почасового потребления, без каких-либо обязательств и авансовых платежей за определенный тип узла, выбранный для запуска хранилища данных. Счет выставляется за все время работы узла в соответствии с почасовым тарифом, который зависит от количества и типа узлов в кластере. Неполные часы работы подлежат оплате на посекундной основе с момента изменения статуса кластера (например, с момента его создания, удаления, приостановки или возобновления работы). Функция приостановки и возобновления работы дает возможность приостановить оплату по требованию в то время, когда кластер не используется. Функция приостановки и возобновления работы – это операции, которые осуществляются вручную или автоматически на узлах типа Redshift. В период, когда работа кластера приостановлена, вы платите только за хранение резервных данных. Это избавляет от планирования, а также предварительного приобретения ресурсов для хранилища данных, когда объем потребностей еще неизвестен. Кроме того, сервис позволяет экономично управлять средами разработки или тестирования. При развертывании в нескольких зонах доступности вы платите по тем же тарифам, но за вдвое больше вычислений, чем при развертывании в одной зоне.

Текущее поколение

* Общий объем доступной памяти в управляемом хранилище на каждом узле RA3.

Предыдущее поколение

Расчет фактической цены за терабайт в год при оплате по требованию

При использовании тарифов по требованию фактическая цена за терабайт в год – это цена за час пользования инстансом, умноженная на количество часов в году и поделенная на количество терабайтов на инстансе. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Amazon Redshift бессерверный

Вы можете начать использовать Amazon Redshift бессерверный всего за три доллара в час и платить только за вычислительные ресурсы, потребляемые хранилищем данных во время его активности. Ресурсы хранилища автоматически масштабируются, чтобы соответствовать аналитическим нагрузкам приложения, и отключаются во время бездействия, позволяя сократить расходы и время администрирования. Емкость хранилища данных в Amazon Redshift измеряется в единицах обработки Redshift (RPU). Оплата за выполняемые рабочие нагрузки, в том числе за запросы, которые отправляются к данным в форматах открытых файлов в Amazon S3, начисляется в RPU-часах на основе посекундного тарифа. Минимальный порог оплаты составляет 60 секунд. За подключение хранилища данных плата не взимается. Автоматическое масштабирование и возможности комплексных систем безопасности включены. Также не нужно отдельно платить за параллельное масштабирование и Redshift Spectrum, поскольку обе функции также включены в бессерверный Amazon Redshift.

При желании можно использовать базовые настройки, максимальные настройки в RPU-часах и параметр MaxRPU (максимальная вместимость) для управления производительностью и стоимостью хранилища данных.

  • Базовая настройка позволяет задать базовый объем ресурсов хранилища Amazon Redshift для обработки запросов. Базовая емкость указывается в RPU. Установка более высокого базового объема вычислительных ресурсов может повысить производительность обработки запросов, особенно при выполнении заданий по обработке и ETL (извлечение, преобразование, загрузка) больших объемов данных, с преобразованием и обогащением. Базовые настройки можно менять с 8 RPU до 512 RPU с шагом в 8 единиц (8, 16, 24, 32, 40, 48 и так далее до 512) с помощью консоли управления или API Amazon Redshift.
  • Максимальная настройка позволяет указать ограничения потребления и выбрать действия, которые Amazon Redshift автоматически предпримет при их достижении, чтобы не превысить заданный бюджет. Максимальная настройка измеряется в RPU-часах и связана с ежедневной, еженедельной или ежемесячной продолжительностью. Установка более высокого максимального объема вычислительных ресурсов может повысить общую пропускную способность системы, что особенно выгодно для рабочих нагрузок с высокий уровнем параллелизма и неизменно высокой производительностью. Максимальные настройки можно менять с помощью консоли управления или API Amazon Redshift.
  • Параметр MaxRPU (максимальная вместимость) определяет максимальное количество RPU, которое бессерверный Amazon Redshift может использовать для целей масштабирования. Когда требуется автоматическое масштабирование вычислений, более высокое значение MaxRPU может повысить пропускную способность запросов. При достижении предела MaxRPU вычислительные ресурсы рабочей группы больше не масштабируются.

Плата за ресурсы основного хранилища начисляется как за хранилище Redshift Managed Storage (RMS), а хранилище для пользовательских снимков состояний оплачивается по стандартным тарифам резервного копирования, указанным на этой странице. Плата за хранение данных взимается согласно тем же тарифам, что и при использовании выделенных кластеров Amazon Redshift. С помощью бессерверного Amazon Redshift можно бесплатно восстановить хранилище данных на основании конкретных точек, сохраненных за последние 24 часа с шагом в 30 минут. Плата за передачу данных и машинное обучение взимается отдельно, как и за выделенные кластеры. Платежи за репликацию снимков состояния и обмен данными между Регионами AWS начисляются в соответствии с тарифами за передачу данных, указанными на этой странице.

Цены на управляемое хранилище Amazon Redshift

Плата за хранение данных в управляемом хранилище начисляется по фиксированному тарифу, установленному для соответствующего региона, за гигабайт‑месяц. Управляемое хранилище предлагается исключительно в составе узлов типа RA3. Цена на управляемое хранилище Redshift не зависит от объема данных и остается неизменно низкой. Плата за использование управляемого хранилища начисляется по почасовому тарифу в зависимости от общего объема данных, хранящихся в управляемом хранилище. Пример перевода гигабайт‑часов в гигабайт‑месяцы приведен ниже. Отслеживать объем данных в кластере RA3 можно с помощью Amazon CloudWatch или Консоли управления AWS. Плата за перенос данных между узлами RA3 и управляемым хранилищем не взимается. В стоимость управляемого хранилища не включена стоимость хранилища резервных копий (используются снимки состояния, созданные вручную и автоматически – см. Хранилище резервных копий). После отключения кластера плата за хранение вручную созданных резервных копий продолжает взиматься.

Пример расчета цены на управляемое хранилище

Предположим, вы храните 100 ГБ данных в управляемом хранилище, выделенном с узлом RA3, в течение первых 15 дней апреля и 100 ТБ данных в течение последних 15 дней апреля.
 
Сначала необходимо посчитать объем использования в ГБ-часах. В течение первых 15 дней использование составит: 100 ГБ x 15 дней x (24 часа / сутки) = 36 000 ГБ‑часов. В течение последних 15 дней использование составит: 100 ТБ X 1024 ГБ/ТБ X 15 дней X (24 часа / сутки) = 36 864 000 ГБ‑часов.
 
В конце апреля использование в ГБ‑часах составляет: 36 000 ГБ‑часов + 36 864 000 ГБ‑часов = 36 900 000 ГБ‑часов
Переведем это в ГБ‑месяцы: 36 900 000 ГБ‑часов / 720 часов в месяц в апреле = 51 250 ГБ‑месяцев.
 
Если эти данные хранились в регионе Восток США (Сев. Вирджиния), цена на управляемое хранилище составляет 0,024 USD / ГБ‑месяц. За месяц использования хранилища, которое составило 51 250 ГБ‑месяцев, будет начислено: 51 250 ГБ‑месяцев x 0,024 USD за ГБ‑месяц = 1230 USD.
 
Общий платеж за RMS в апреле: 1230 USD

Цены на Amazon Redshift Spectrum

Amazon Redshift Spectrum позволяет напрямую выполнять SQL‑запросы к эксабайтам данных, хранящихся в Amazon S3. Плата начисляется по количеству байтов, просканированных Redshift Spectrum, с округлением до ближайшего мегабайта. Минимальный объем на каждый запрос – 10 МБ. Плата не взимается за выполнение команд языка определения данных (DDL), таких как CREATE / ALTER / DROP TABLE, команд управления и разбиения на разделы, а также за выполнение запросов, которые завершились ошибкой.

Запросы Amazon Redshift Serverless к внешним данным в Amazon S3 не оплачиваются отдельно, их стоимость включена в платеж за Amazon Redshift Serverless (в RPU-час).

Можно повысить производительность запросов и сократить расходы, сохраняя данные в столбчатом формате, используя сжатие и деление на разделы. При сжатии данных с использованием одного из поддерживаемых Redshift Spectrum форматов стоимость использования снижается, поскольку уменьшается объем данных для сканирования. При хранении данных в столбчатом формате, например Apache Parquet или Optimized Row Columnar (ORC), затраты будут снижаться, поскольку Redshift Spectrum будет только считывать столбцы, необходимые для выполнения запроса.

При работе с Redshift Spectrum плата будет начисляться за каждый терабайт считанных данных с округлением объема до ближайшего мегабайта. Минимальный объем на каждый запрос – 10 МБ. Например, при сканировании 10 ГБ данных стоимость составит 0,05 USD. При сканировании 1 ТБ данных плата составит 5,00 USD.

Дополнительные расходы

Оплате подлежит работа кластера Amazon Redshift, который используется для выполнения запросов Redshift Spectrum к данным. Запросы Redshift Spectrum выполняются непосредственно в Amazon S3. Хранение объектов в корзинах S3 и выполнение запросов к корзинам S3 оплачиваются по стандартным тарифам Amazon S3. Подробные сведения см. на странице Цены на Amazon S3

При использовании каталога данных AWS Glue с Amazon Redshift Spectrum плата начисляется по стандартным тарифам каталога данных AWS Glue. Подробные сведения см. на странице Цены на AWS Glue.

При использовании сервиса Amazon Redshift Spectrum для запроса зашифрованных данных AWS Key Management Service (KMS) в сервисе Amazon S3 плата начисляется по стандартным тарифам AWS KMS. Подробные сведения см. на странице Цены на AWS KMS.

Примеры расчета стоимости Redshift Spectrum на основе цен в регионе Восток США (Сев. Вирджиния)

Рассмотрим таблицу со ста столбцами равного размера, сохраненную в Amazon S3 в виде несжатого текстового файла общим размером 4 ТБ. При выполнении запроса на извлечение данных из одного столбца таблицы Redshift Spectrum придется обработать весь файл, поскольку данные в текстовом формате нельзя разделить. Запрос просканирует 4 ТБ данных, его стоимость составит 20 USD (5 USD / ТБ х 4 ТБ = 20 USD)

Если сжать файл в формат GZIP, его размер можно уменьшить в 4 раза. Сжатый файл будет иметь размер 1 ТБ. Redshift Spectrum необходимо просканировать весь файл, но поскольку его размер составляет всего четверть от исходного, стоимость также составит лишь четверть – 5 USD (5 USD / ТБ х 1 ТБ = 5 USD)

Если сжать исходный файл и конвертировать его в столбчатый формат вроде Apache Parquet, коэффициент сжатия может достичь значения до 4:1. Таким образом, размер сжатого файла может уменьшиться до 1 ТБ. Выполняя запрос, аналогичный приведенному выше, Redshift Spectrum просканирует лишь один столбец в файле Parquet. Стоимость такого запроса составит 0,05 USD (5 USD / ТБ х 1 ТБ (размер файла) х 1/100 столбцов, или суммарно 10 ГБ просканированных данных = 0,05 USD)

Примечание. Примеры расчета стоимости выше приведены исключительно в справочных целях. Коэффициент сжатия у разных файлов и столбцов может различаться.

Цены на параллельное масштабирование

Amazon Redshift автоматически добавляет переходные ресурсы, обеспечивая стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. Не требуется управлять ресурсами; авансовые платежи отсутствуют, плата за время запуска и завершения работы переходных кластеров не взимается. За сутки использования основного кластера можно накопить кредиты, дающие право на один час использования кластера параллельного масштабирования. При предоставлении кластера параллельного масштабирования по требованию сверх бесплатной нормы кредитов посекундная плата начисляется только тогда, когда кластер обрабатывает запросы. При этом при каждой активации кластера параллельного масштабирования начисляется минимальная плата в размере одной минуты. Посекундный тариф по требованию зависит от типа и количества узлов в кластере Amazon Redshift.

Amazon Redshift бессерверный по умолчанию автоматически масштабирует ресурсы в соответствии с потребностями рабочей нагрузки. За параллельное масштабирование отдельная плата не взимается.

Кредиты для параллельного масштабирования

Кластеры Redshift за сутки накапливают до одного часа бесплатных кредитов для параллельного масштабирования. Кредиты для каждого активного кластера вашего аккаунта AWS зарабатываются на почасовой основе; кредиты могут быть потрачены только для того же кластера, который их заработал. Для каждого активного кластера можно накопить до 30 часов бесплатных кредитов для параллельного масштабирования. Кредиты действуют бессрочно до тех пор, пока не удален кластер.

Пример расчета стоимости параллельного масштабирования

Кластер Redshift узла 10 DC2.8XL в регионе US-East стоит 48 USD в час. Рассмотрим сценарий, в котором два переходных кластера используются в течение пяти минут сверх бесплатных кредитов для параллельного масштабирования. Посекундный тариф по требованию для параллельного масштабирования составляет 48 USD х 1/3600 = 0,013 USD в секунду. Дополнительные затраты для параллельного масштабирования в этом случае составляют 0,013 USD в секунду х 300 секунд х 2 переходных кластера = 8 USD. Таким образом, общие затраты на кластер Amazon Redshift и два переходных кластера в этом случае составляют 56 USD.

Цены на Redshift ML

Если вы не использовали Amazon SageMaker ранее, то начиная работу с Redshift ML, вы соответствуете уровню бесплатного пользования. Этот уровень включает два бесплатных запроса CREATE MODEL (количество ячеек в каждом запросе не должно превышать 100 000) в месяц в течение двух месяцев. Уровень бесплатного пользования начинается с первого месяца, когда вы создаете свою первую модель в Redshift ML.

Цены на Amazon S3
Во время выполнения запросов CREATE MODEL также взимается небольшая плата за Amazon S3. Затраты на S3 составляют менее 1 USD в месяц, поскольку количество данных S3, генерируемых запросом CREATE MODEL, составляет не более нескольких гигабайт. К тому же, они быстро стираются во время сборки мусора. Сперва Amazon S3 используется для хранения данных для обучения, созданных запросом SELECT для CREATE MODEL. Потом также сохраняются различные артефакты, связанные с моделью, которые необходимы для прогнозирования. По умолчанию режим удаления ненужных данных сотрет данные для обучения и артефакты, связанные с моделью, в конце запроса CREATE MODEL.

Варианты управления издержками
Вы можете управлять издержками на обучение, настроив параметр MAX_CELLS. Если этого не сделать, для параметра MAX_CELLS будет установлено значение по умолчанию – 1 млн ячеек. Благодаря этому в большинстве случаев затраты на обучение не превысят 20 USD. Если набор данных для обучения превышает 1 миллион ячеек, цены увеличатся таким образом:

Количество ячеек Цена

Первые 10 млн ячеек

20 USD за миллион ячеек

Следующие 90 млн ячеек

15 USD за миллион ячеек

Более 100 млн ячеек

7 USD за миллион ячеек

 

Примечание. В большинстве случаев фактические цены ниже верхних границ, представленных выше. 

Примеры затрат на CREATE MODEL

  • 100 000 ячеек – 20 USD (= 1 x 20)
  • 2 000 000 ячеек – 40 USD (= 2 x 20)
  • 23 млн ячеек – 395 USD (= 10 x 20 + 13 x 15)
  • 99 млн ячеек – 1535 USD (= 10 x 20 + 89 x 15) и
  • 211 млн ячеек – 2327 USD (= 10 x 20 + 90 x 15 + 111 x 7)

Если количество данных для обучения, сгенерированных запросом SELECT для запроса CREATE MODEL, превышает установленный вами лимит для параметра MAX_CELLS (или значение в 1 млн по умолчанию, если вы не указали собственное), CREATE MODEL случайным образом выберет приблизительное значение для количества столбцов с записями параметра MAX_CELLS из набора данных для обучения и продолжит обучение, используя случайным образом выбранные кортежи. Выбор случайным образом осуществляется для того, чтобы избавиться от какого-либо акцента в уменьшенном количестве данных для обучения. Однако задав значение для параметра MAX_CELLS, вы установите рамки для своих расходов.

Цены на зарезервированные инстансы

Зарезервированные инстансы подходят в качестве ресурсов для рабочих сред со стабильной нагрузкой и позволяют значительно экономить по сравнению с ценами на типы узлов Amazon Redshift по требованию. Клиенты обычно приобретают зарезервированные инстансы после проведения экспериментов и создания опытных образцов для проверки рабочих конфигураций.

Вы можете существенно сэкономить по сравнению с тарифами по требованию, взяв на себя обязательство использовать сервис Amazon Redshift на срок один или три года. Цена на зарезервированный инстанс зависит от типа приобретенного узла и действует до окончания срока резервирования. В стоимость включены две дополнительных копии данных – одна на узлах кластера, другая в корзине Amazon S3. Мы позаботимся о резервном копировании, надежности, доступности, безопасности, мониторинге и обслуживании для вас.

Доступны три варианта оплаты зарезервированных инстансов.

Без авансовых платежей: предоплата отсутствует. Вы берете на себя обязательство вносить помесячную оплату на протяжении одного года.

С частичной предоплатой: вы вносите частичную предоплату за зарезервированные инстансы, а оставшуюся часть оплачиваете в течение одного или трех лет.

С полной предоплатой: вы полностью оплачиваете зарезервированные инстансы (за период один или три года) одним авансовым платежом.

Обратите внимание, что резервирование инстансов является схемой оплаты и не используется для создания кластеров хранения данных. Когда вы совершите покупку, с вас будет взиматься соответствующая предоплата и ежемесячная плата даже при отсутствии запущенного кластера или приостановке имеющегося кластера. Чтобы приобрести зарезервированные инстансы, перейдите на вкладку Reserved Nodes (Зарезервированные инстансы) в консоли Redshift.

Мы можем прекратить действие ценовой программы для зарезервированных инстансов в любое время. Кроме стоимости зарезервированных инстансов, необходимо оплачивать передачу данных и другие услуги, как это указано в Пользовательском соглашении AWS или других документах, согласно которым мы предоставляем вам услуги.

* Это средний размер ежемесячного платежа на протяжении всего срока действия зарезервированного инстанса. Каждый месяц фактический ежемесячный платеж равен фактическому количеству часов в этом месяце, умноженному на почасовой тариф, или количеству секунд в данном месяце, умноженному на почасовой тариф, разделенный на 3600, в зависимости от используемого типа инстанса Redshift. Почасовой тариф равна сумме средних ежемесячных платежей на протяжении срока действия зарезервированного инстанса, деленной на общее количество часов (при допущении, что в году 365 дней) за тот же период.

** Фактические почасовые цены помогают вам рассчитать экономию при использовании зарезервированного инстанса вместо инстанса по требованию. При покупке зарезервированного инстанса вы оплачиваете каждый час на протяжении выбранного срока действия вне зависимости от того, работает ли в это время инстанс. Фактическая почасовая цена соответствует амортизированным почасовым расходам на инстанс. Для ее расчета общая стоимость зарезервированного инстанса за весь период его действия, включая авансовые платежи, делится на срок резервирования инстанса в часах.

*** При использовании зарезервированных инстансов необходимо прибавить авансовые платежи к почасовым тарифам, умноженным на количество часов в выбранном периоде, и разделить на количество лет в выбранном периоде и количество терабайтов на узел. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Стоимость интеграции с нулевым использованием ETL НОВИНКА

Amazon Redshift обеспечивает интеграцию с нулевым использованием ETL с базами данных OLTP, что устраняет необходимость в создании конвейеров ETL и управлении ими. Поддерживаемые базы данных включают Amazon Aurora, Amazon DynamoDB и Amazon Relational Database Service (Amazon RDS) для MySQL. Эти интеграции обеспечивают гибкость, поэтому вы можете выбрать определенные таблицы данных в базе данных для автоматической репликации в Amazon Redshift. Такая гибкость позволяет проводить унифицированную аналитику в нескольких приложениях и источниках данных. AWS не взимает дополнительную плату за интеграцию с нулевым использованием ETL. Вы платите за существующие ресурсы, применяемые для создания и обработки данных изменений, которые разработаны в рамках интеграции с нулевым использованием ETL. Сюда входят дополнительное хранилище Amazon Redshift для сберегания реплицированных данных, вычислительные ресурсы для обработки репликации данных (или RPU в бессерверном Amazon Redshift) и затраты на передачу данных между зонами доступности при перемещении информации из источника в целевой объект. Непрерывная обработка данных об изменениях с помощью интеграции с нулевым использованием ETL выполняется бесплатно. Дополнительные сведения см. на страницах цен на Aurora, RDS для MySQL и DynamoDB.

Хранилище резервных копий

Хранилище резервных копий данных – это хранилище, связанное со снимками состояния, выполненными для хранилища данных. Увеличение срока хранения резервных копий или сохранение дополнительных снимков состояния увеличивает объем хранилища резервных копий, который требуется для хранилища данных. Плата за Amazon Redshift взимается за снимки состояния, сделанные вручную с помощью консоли, интерфейса прикладного программирования (API) или интерфейса командной строки (CLI). Автоматические снимки, по умолчанию созданные с использованием расписания для снимков Amazon Redshift, предоставляются бесплатно и хранятся не более 35 дней. Плата за точки восстановления бессерверного Amazon Redshift, срок действия которых составляет менее 24 часов, не взимается. При необходимости хранения точек восстановления на период более 24 часов плата за них будет включена в платеж RMS. Данные, хранящиеся в кластерах RA3, входят в состав RMS и оплачиваются по тарифам RMS, но созданные вручную снимки состояния кластеров RA3 оплачиваются как резервное хранилище по стандартным тарифам Amazon S3, представленным на этой странице.

Например, если кластер RA3 содержит 10 ТБ данных и 30 ТБ созданных вручную снимков состояния, оплате подлежат 10 ТБ RMS и 30 ТБ резервного хранилища. В случае кластеров Dense Compute (DC) и Dense Storage (DS) хранилище включено в кластер и не оплачивается отдельно, но резервные копии хранятся во внешнем сервисе Amazon S3. Резервное хранилище сверх размера выделенных кластеров DC и DS оплачивается как резервное хранилище по стандартным тарифам S3. Снимки состояния оплачиваются до окончания срока их действия или до их удаления, в том числе при приостановке или удалении кластера.

Передача данных

Плата за передачу данных между Amazon Redshift и Amazon S3 при резервном копировании, восстановлении, при операциях загрузки и выгрузки в пределах одного региона AWS не начисляется. Все прочие случаи передачи данных в Amazon Redshift или из него оплачиваются по стандартным тарифам AWS на передачу данных. В частности, если кластер Amazon Redshift работает в Amazon Virtual Private Cloud (VPC), при передаче данных через JDBC/ODBC на адрес кластера Amazon Redshift будет начисляться стандартная плата за передачу данных AWS. Кроме того, если используется улучшенная маршрутизация VPC и данные выгружаются в Amazon S3 в другом регионе, за это тоже будет взиматься стандартная плата за передачу данных AWS. Подробнее о расценках на передачу данных в AWS см. на странице цен на Amazon Elastic Cloud Compute (Amazon EC2).

Amazon Redshift взимает плату за обмен данными и копирование снимков состояния между регионами. Платеж за обмен данными начисляется в регионе потребителя, в котором происходит доступ к данным. Платеж за копирование снимков состояния начисляется в исходном регионе, в котором располагается создавший снимок кластер. Плата за передачу данных распространяется на все снимки (как автоматические, так и ручные) и точки восстановления. Все платежи за передачу данных при копировании снимка относятся только к добавочным данным.

Входящий перенос данных с общим доступом или исходящий перенос данных из копий снимков

Примеры расчета стоимости

Пример для RMS

Вы используете четыре узла ra3.xlarge и 40 ТБ RMS в месяц. В течение месяца вы также можете отсканировать 20 ТБ данных с помощью Redshift Spectrum. Вы пользуетесь ценами по требованию.

Стоимость будет рассчитываться следующим образом:

  • цена на инстанс Redshift RA3 = 4 инстанса x 3,26 USD в час x 730 часов в месяц = 9519,20 USD в месяц
  • цена на RMS = 40 ТБ x 1024 ГБ за ТБ x 0,024 USD = 983,04 USD
  • цена на Redshift Spectrum = 20 ТБ x 5,00 USD = 100,00 USD

Итого за месяц: 10 602,24 USD

Пример для нескольких зон доступности

Вы используете кластер с несколькими зонами доступности, который развернут одновременно в двух зонах доступности. В вашем кластере четыре узла ra3.4xlarge на одну зону доступности, и вы используете 40 ТБ RMS в течение месяца. Вы пользуетесь ценами по требованию.

Стоимость будет рассчитываться следующим образом:

  • цена на инстанс Redshift RA3 для зоны доступности 1 = 4 инстанса x 3,26 USD в час x 730 часов в месяц = 9519,20 USD в месяц
  • цена на инстанс Redshift RA3 для зоны доступности 2 = 4 инстанса x 3,26 USD в час x 730 часов в месяц = 9519,20 USD в месяц
  • цена на RMS = 40 ТБ x 1024 ГБ за ТБ x 0,024 USD = 983,04 USD

Итого за месяц: 20 021,44 USD

Пример для Amazon Redshift бессерверного
Этот пример показывает, как начисляется плата за бессерверный вариант Amazon Redshift в режиме пропускной способности по требованию.
Простой пример

Предположим, вам необходимо выполнять задание по обработке данных в хранилище Amazon Redshift, расположенном в регионе Восток США (Сев. Вирджиния) каждый час с 7 до 19 часов. Для простоты расчетов примем, что каждое выполнение задания занимает одинаковое время – 10 минут и 30 секунд. Емкость используемых для выполнения задания ресурсов Amazon Redshift составляет 128 RPU.

В таблице ниже кратко описано использование приложения за день.

Период запроса

Задание выполняется 13 раз между 7 и 19 часами. Каждый запуск занимает 10 минут и 30 секунд = 136 минут и 30 секунд = 8190 секунд

Используемая пропускная способность

128 RPU

Дневной платеж

109,20 USD ((8190 x 128 RPU x 0,375 USD за RPU-час) /3600) 

Пример с базовой настройкой и автоматическим масштабированием

Предположим, что у вас есть приложение панели управления, расположенное в хранилище данных Amazon Redshift в регионе Восток США (Сев. Вирджиния). Приложение применяют различные пользователи (например, аналитики данных, разработчики и специалисты по обработке данных) в пределах организации, и в течение дня наблюдаются периоды пика и спада трафика. В частности, всплеск активности происходит с 9 до 11 утра и с 14:00 до 16:00, когда большинство пользователей выполняет задачи по аналитике и запрашивает доступ к данным из хранилища. Укажем, что с 11:00 до 14:00 в приложении наблюдается четыре 15-минутных интервала бездействия. Также пользовательской активности нет с 22:00 до 05:00.

Теперь посмотрим на потребление ресурсов хранилища данных Amazon Redshift. Предположим, что для обеспечения наилучшего соотношения цены и производительности вы установили базовую конфигурацию Amazon Redshift без Serverless на 64 RPU. В пиковые периоды утром и днем Amazon Redshift автоматически масштабируется и использует в общей сложности 192 RPU и 128 RPU соответственно.

В таблице ниже кратко описано использование приложения за день.

Длительность

Общий срок выполнения запроса

05:00 – 09:00

64 RPU в течение 4 часов = 64 x 4 = 256 RPU-часов

09:00 – 11:00

192 RPU в течение 2 часов = 384 RPU-часа

11:00 – 14:00

Исключая четыре 15-минутных интервала бездействия, время активности составляет 2 часа.

64 RPU в течение 2 часов = 64 x 2 = 128 RPU-часов

14:00 – 15:00

128 RPU в течение 1 часа = 128 RPU-часов

15:00 – 22:00

64 RPU в течение 7 часов = 64 x 7 = 448 RPU-часов

22:00 – 05:00

Нет активности

Дневной платеж

504 USD ((256 + 384 + 128 + 128 +448) x 0,375 USD за RPU-час) 

Пример параллельного масштабирования Amazon Redshift

Кластер Redshift узла 10 DC2.8XL в регионе Восток США стоит 48 USD в час. Рассмотрим сценарий, в котором два переходных кластера используются в течение пяти минут сверх бесплатных кредитов для параллельного масштабирования. Посекундный тариф по требованию для параллельного масштабирования составляет 48 USD х 1/3600 = 0,013 USD в секунду. Дополнительные затраты для параллельного масштабирования в этом случае составляют 0,013 USD в секунду х 300 секунд х 2 переходных кластера = 8 USD. Таким образом, общие затраты на кластер Redshift и два переходных кластера составляют 56 USD.

Пример для Amazon Redshift Spectrum

Рассмотрим таблицу со ста столбцами равного размера, сохраненную в Amazon S3 в виде несжатого текстового файла общим размером 4 ТБ. При выполнении запроса на извлечение данных из одного столбца таблицы Redshift Spectrum придется обработать весь файл, поскольку данные в текстовом формате нельзя разделить. Если применяются цены на Redshift Spectrum для Востока США (Сев. Вирджиния), этот запрос отсканирует 4 ТБ и будет стоить 20 USD (5,00 USD / ТБ x 4 ТБ = 20 USD)

Если сжать файл в формат GZIP, его размер можно уменьшить в 4 раза. Сжатый файл будет иметь размер 1 ТБ. Redshift Spectrum необходимо просканировать весь файл, но поскольку его размер составляет всего четверть от исходного, стоимость также составит лишь четверть – 5 USD (5 USD / ТБ х 1 ТБ = 5 USD)

Если сжать исходный файл и конвертировать его в столбчатый формат вроде Apache Parquet, коэффициент сжатия может достичь значения до 4:1. Таким образом, размер сжатого файла может уменьшиться до 1 ТБ. Выполняя запрос, аналогичный приведенному выше, Redshift Spectrum просканирует лишь один столбец в файле Parquet. Стоимость такого запроса составит 0,05 USD (5 USD / ТБ х 1 ТБ (размер файла) х 1/100 столбцов, или суммарно 10 ГБ просканированных данных = 0,05 USD).

Примечание. Примеры расчета стоимости выше приведены исключительно в справочных целях. Коэффициент сжатия у разных файлов и столбцов может различаться.

Дополнительные ресурсы по ценам

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Получить консультацию о ценах

Связаться со специалистами AWS и получить индивидуальное предложение

Дополнительные ресурсы по Amazon Redshift

Перейти на страницу ресурсов
Готовы приступить к разработке?
Начать работу c Amazon Redshift
Есть дополнительные вопросы?
Свяжитесь с нами