Обзор

Расходы при использовании Amazon Redshift ниже по сравнению с другими хранилищами данных. Начните с малого по цене 0,25 USD в час и увеличивайте масштаб – до нескольких петабайтов хранилища и тысяч одновременно работающих пользователей. Опирайтесь на потребности бизнеса. Чтобы увеличить размер хранилища, не придется выделять избыточные вычислительные ресурсы, а чтобы расширить вычислительные ресурсы, не нужно повышать расходы на хранилище.

Ожидания
В первую очередь следует определить оптимально подходящую конфигурацию кластера. В этом поможет калькулятор ресурсов в консоли Amazon Redshift. В случае необходимости можно просто изменить масштаб кластера или типы узлов. Для этого достаточно одного вызова API или пары щелчков мышью в консоли Amazon Redshift.
На этапе выбора узлов отображаются цены на ресурсы по требованию. В дальнейшем можно приобрести зарезервированные узлы со значительными скидками.

Типы узлов Amazon Redshift

Чтобы обеспечить оптимальный выбор для различных рабочих нагрузок, узлы в Amazon Redshift бывают трех типов. В зависимости от необходимой производительности и объема данных можно выбрать между узлами RA3, DC2 и DS2.
 
Узлы Amazon Redshift RA3 с управляемым хранилищем позволяют получить оптимальное хранилище данных. Менять масштаб вычислительных ресурсов и хранилища можно независимо друг от друга; плата за них так же начисляется по отдельности. Сделав свой выбор в пользу RA3, можно выбирать количество узлов в зависимости от требований к производительности хранилища данных и платить только за тот объем управляемого хранилища, который используется. В качестве локального хранилища, поддерживающего быструю скорость записи и чтения, в каждом узле RA3 управляемого хранилища Redshift используются объемные высокопроизводительные SSD. Для долгосрочного надежного хранения используется Amazon S3. Если объем данных в узле начинает превышать размер крупных локальных SSD, управляемое хранилище Redshift автоматически отправляет эти данные в Amazon S3. Независимо от того, где находятся данные – на высокопроизводительных SSD или в S3, – цена за использование управляемого хранилища Redshift остается неизменной и низкой. Если для рабочих нагрузок требуется большое хранилище, но не так много вычислительных ресурсов, объем хранилища данных может масштабироваться автоматически. При этом добавлять дополнительные узлы (и, следовательно, платить за них) не придется.

Чтобы данные выгружались в Amazon S3 с наибольшей эффективностью и так же извлекались из него, в управляемом хранилище Redshift применяются разнообразные современные методы управления данными. Кроме того, в основе узлов RA3 лежит система AWS Nitro, которая обеспечивает их высокую производительность и повышенную безопасность. В этих узлах используются скоростные ЦПУ нового поколения, объемные локальные твердотельные накопители (SSD) и сеть с высокой пропускной способностью. Все это обеспечивает оптимальную производительность при пиковых нагрузках.

Узлы DC2 позволяют создать хранилища данных, в которых используются локальные SSD, с интенсивным потреблением вычислительных ресурсов. Количество узлов зависит от объема данных и требований к производительности. Если объем данных не превышает 10 ТБ, рекомендуем выбирать узлы DC2. Это способ получить наиболее высокую производительность по оптимальной цене. Если есть основания полагать, что объем данных будет быстро расти, рекомендуем выбрать узлы RA3.

Узлы DS2 позволяют создавать крупные хранилища данных с применением жестких дисков (HDD) по низкой цене. Для большинства рабочих нагрузок подходят узлы RA3 или DC2. Рекомендуем ознакомиться с ними, прежде чем остановить свой выбор на узлах DS2. Если сейчас вы используете более трех узлов DS2.8xl, можно перейти на узлы RA3.16xl, при этом вдвое повысить производительность и увеличить объем хранилища в два раза при стоимости инстансов по требованию, равной стоимости DS2.

В консоли Redshift можно найти калькулятор цен и информацию, которая поможет выбрать наиболее подходящий тип узла. Изменить масштаб кластера или тип узлов можно в любой момент с помощью одного вызова API или пары щелчков мышью в консоли.

Возможности Redshift с оплатой по факту использования

  • Цены на Amazon Redshift Spectrum. Этот сервис позволяет выполнять прямые SQL‑запросы по всему объему данных в озере данных S3 (в масштабе эксабайтов), при этом плата начисляется только по количеству обработанных байтов.
  • Цены на параллельное масштабирование. Каждый кластер за сутки накапливает до одного часа бесплатных кредитов для параллельного масштабирования, и для 97 % клиентов этого достаточно. Это обеспечивает стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. При превышении объема накопленных кредитов плата за масштабирование по требованию начисляется на посекундной основе. 
  • Цены на управляемое хранилище Redshift. Плата гибко начисляется только за объем данных, который хранится в кластерах RA3, независимо от числа выделенных вычислительных узлов. Оплате подлежит каждый час использования общего объема управляемого хранилища, занятого данными.

Цены по требованию

Цены по требованию в Amazon Redshift позволяют платить за объем используемых ресурсов и не предусматривают каких‑либо обязательств или авансовых платежей: вы просто вносите почасовую оплату, исходя из типа и количества узлов в кластере. Это позволяет избежать планирования, а также предварительного приобретения ресурсов для хранилища данных, когда объем потребностей еще неизвестен. Сервис позволяет экономично расширять или удалять среды разработки или тестирования.

Текущее поколение

* Общий объем доступной памяти в управляемом хранилище на каждом узле RA3.

Предыдущее поколение

Расчет фактической цены за терабайт в год при оплате по требованию

При использовании тарифов по требованию фактическая цена за терабайт в год – это цена за час пользования инстансом, умноженная на количество часов в году и поделенная на количество терабайтов на инстансе. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Цены на Redshift Spectrum

Amazon Redshift Spectrum позволяет напрямую выполнять SQL‑запросы к эксабайтам данных, хранящихся в Amazon S3. Плата начисляется по количеству байтов, просканированных Redshift Spectrum, с округлением до ближайшего мегабайта. Минимальный объем на каждый запрос – 10 МБ. Плата не взимается за выполнение команд языка определения данных (DDL), таких как CREATE / ALTER / DROP TABLE, команд управления и разбиения на разделы, а также за выполнение запросов, которые завершились ошибкой.

Можно повысить производительность запросов и сократить расходы, сохраняя данные в столбчатом формате, используя сжатие и деление на разделы. При сжатии данных с использованием одного из поддерживаемых Redshift Spectrum форматов стоимость использования снижается, поскольку уменьшается объем данных для сканирования. При хранении данных в столбчатом формате, например, Parquet или ORC, затраты будут еще меньше, поскольку Redshift Spectrum будет только считывать столбцы, необходимые для выполнения запроса.

Дополнительная плата

При работе с Amazon Redshift Spectrum плата будет начисляться за каждый терабайт считанных данных с округлением объема до ближайшего мегабайта. Минимальный объем на один запрос – 10 МБ. Например, при сканировании 10 ГБ данных стоимость составит 0,05 USD. При сканировании 1 ТБ данных плата составит 5,00 USD.

Дополнительные расходы

Оплате подлежит работа кластера Amazon Redshift, который используется для выполнения запросов Redshift Spectrum к данным. Запросы Redshift Spectrum выполняются непосредственно в Amazon S3. Хранение объектов в корзинах S3 и выполнение запросов к корзинам S3 оплачиваются по стандартным тарифам Amazon S3. Подробные сведения см. на странице Цены на Amazon S3

При использовании каталога данных AWS Glue с Amazon Redshift Spectrum плата начисляется по стандартным тарифам каталога данных AWS Glue. Подробные сведения см. на странице Цены на AWS Glue.

При использовании сервиса Amazon Redshift Spectrum для запроса зашифрованных данных AWS Key Management Service (KMS) в сервисе Amazon S3 плата начисляется по стандартным тарифам AWS KMS. Подробные сведения см. на странице Цены на AWS KMS.

Примеры расчета стоимости Redshift Spectrum на основе цен в регионе Восток США (Сев. Вирджиния)

Рассмотрим таблицу со ста столбцами равного размера, сохраненную в Amazon S3 в виде несжатого текстового файла общим размером 4 ТБ. При выполнении запроса на извлечение данных из одного столбца таблицы Redshift Spectrum придется обработать весь файл, поскольку данные в текстовом формате нельзя разделить. Запрос просканирует 4 ТБ данных, его стоимость составит 20 USD (5 USD / ТБ х 4 ТБ = 20 USD).

Если сжать файл в формат GZIP, его размер можно уменьшить в 4 раза. Сжатый файл будет иметь размер 1 ТБ. Redshift Spectrum необходимо просканировать весь файл, но поскольку его размер составляет всего четверть от исходного, стоимость также составит лишь четверть – 5 USD (5 USD / ТБ х 1 ТБ = 5 USD).

Если сжать исходный файл и конвертировать его в столбчатый формат вроде Apache Parquet, коэффициент сжатия может достичь значения до 4:1. Таким образом, размер сжатого файла может уменьшиться до 1 ТБ. Выполняя запрос, аналогичный приведенному выше, Redshift Spectrum просканирует лишь один столбец в файле Parquet. Стоимость такого запроса составит 0,05 USD (5 USD / ТБ х 1 ТБ х 1/100 столбцов, или суммарно 10 ГБ просканированных данных = 0,05 USD).

Примечание. Примеры расчета стоимости выше приведены исключительно в справочных целях. Коэффициент сжатия у разных файлов и столбцов может различаться.

Цены на параллельное масштабирование

Amazon Redshift автоматически добавляет переходные ресурсы, обеспечивая стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. Не требуется управлять ресурсами; авансовые платежи отсутствуют, плата за время запуска и завершения работы переходных кластеров не взимается. За сутки использования основного кластера можно накопить кредиты, дающие право на один час использования кластера параллельного масштабирования. При предоставлении кластера параллельного масштабирования по требованию сверх бесплатной нормы кредитов посекундная плата начисляется только тогда, когда кластер обрабатывает запросы. При этом при каждой активации кластера параллельного масштабирования начисляется минимальная плата в размере одной минуты. Посекундный тариф по требованию зависит от типа и количества узлов в кластере Amazon Redshift.

Кредиты для параллельного масштабирования

Кластеры Amazon Redshift за сутки накапливают до одного часа бесплатных кредитов для параллельного масштабирования. Кредиты для каждого активного кластера вашего аккаунта AWS зарабатываются на почасовой основе; кредиты могут быть потрачены только для того же кластера, который их заработал. Для каждого активного кластера можно накопить до 30 часов бесплатных кредитов для параллельного масштабирования. Кредиты действуют бессрочно до тех пор, пока не удален кластер.

Пример расчета стоимости параллельного масштабирования

Кластер Redshift узла 10 DC2.8XL в регионе US-East стоит 48 USD в час. Рассмотрим сценарий, в котором два переходных кластера используются в течение пяти минут сверх бесплатных кредитов для параллельного масштабирования. Посекундный тариф по требованию для параллельного масштабирования составляет 48 USD х 1/3600 = 0,013 USD в секунду. Дополнительные затраты для параллельного масштабирования в этом случае составляют 0,013 USD в секунду х 300 секунд х 2 переходных кластера = 8 USD. Таким образом, общие затраты на кластер Amazon Redshift и два переходных кластера в этом случае составляют 56 USD.

Цены на управляемое хранилище Redshift

Плата за хранение данных в управляемом хранилище начисляется по фиксированному тарифу, установленному для соответствующего региона, за гигабайт‑месяц. Управляемое хранилище предлагается исключительно в составе узлов типа RA3. Цена на управляемое хранилище Redshift не зависит от объема данных и остается неизменно низкой. Плата за использование управляемого хранилища начисляется по почасовому тарифу в зависимости от общего объема данных, хранящихся в управляемом хранилище. Пример перевода гигабайт‑часов в гигабайт‑месяцы приведен ниже. Отслеживать объем данных в кластере RA3 можно с помощью Amazon Cloudwatch или Консоли управления AWS. Плата за перенос данных между узлами RA3 и управляемым хранилищем не взимается. В стоимость управляемого хранилища не включена стоимость хранилища резервных копий (используются снимки состояния, созданные вручную и автоматически – см. Хранилище резервных копий). После отключения кластера плата за хранение вручную созданных резервных копий продолжает взиматься.

Пример расчета цены на управляемое хранилище

Предположим, вы храните 100 ГБ данных в управляемом хранилище, выделенном с узлом RA3, в течение первых 15 дней апреля и 100 ТБ данных в течение последних 15 дней апреля.
Сначала определим использование хранилища в ГБ‑часах для приведенного выше примера. В течение первых 15 дней использование в ГБ‑часах составит: 100 ГБ x 15 дней x ( 24 часа / сутки) = 36 000 ГБ‑часов.
В течение последних 15 дней использование в ГБ‑часах составит: 100 ТБ X 1024 ГБ/ТБ X 15 дней X ( 24 часа / сутки) = 36 864 000 ГБ‑часов

В конце апреля использование в ГБ‑часах суммируется: 36 000 ГБ‑часов + 36 864 000 ГБ‑часов = 36 900 000 ГБ‑часов
Переведем это в ГБ‑месяцы: 36 900 000 ГБ‑часов / 720 часов в месяц в апреле = 51 250 ГБ‑месяцев.

Если эти данные хранились в регионе Восток США (Северная Вирджиния), цена на управляемое хранилище составляет 0,024 USD / ГБ‑месяц. За месяц использования хранилища, которое составило 51 250 ГБ‑месяцев, будет начислено: 51 250 ГБ‑месяцев x 0,024 USD за ГБ‑месяц = 1230 USD
Итоговая стоимость использования управляемого хранилища в апреле = 1230 USD.

Цены на зарезервированные инстансы

Зарезервированные инстансы подходят в качестве ресурсов для рабочих сред со стабильной нагрузкой и позволяют значительно экономить по сравнению с ценами по требованию. Клиенты обычно приобретают зарезервированные инстансы после проведения экспериментов и создания опытных образцов для проверки рабочих конфигураций.

Вы можете существенно сэкономить по сравнению с тарифами по требованию, взяв на себя обязательство использовать сервис Amazon Redshift на срок 1 или 3 года. Цена на зарезервированный инстанс зависит от типа приобретенного узла и действует до окончания срока резервирования. В стоимость включены две дополнительных копии данных – одна на узлах кластера, другая в корзине Amazon S3. Мы позаботимся о резервном копировании, надежности, доступности, безопасности, мониторинге и обслуживании для вас.

Доступны три варианта оплаты зарезервированных инстансов.

Без авансовых платежей: предоплата отсутствует. Вы берете на себя обязательство вносить помесячную оплату на протяжении одного года.

С частичной предоплатой: вы вносите частичную предоплату за зарезервированные инстансы, а оставшуюся часть оплачиваете в течение одного или трех лет.

С полной предоплатой: вы полностью оплачиваете зарезервированные инстансы (за период один или три года) одним авансовым платежом.

Обратите внимание, что резервирование инстансов является схемой оплаты и не используется для создания кластеров хранения данных. В случае резервирования будет взиматься соответствующая предоплата и помесячная оплата даже при отсутствии запущенного кластера. Чтобы приобрести зарезервированные инстансы, перейдите на вкладку «Reserved Nodes» (Зарезервированные инстансы) в консоли.

Мы можем прекратить действие ценовой программы для зарезервированных инстансов в любое время. Кроме стоимости зарезервированных инстансов, требуется оплачивать передачу данных и другие услуги, как это указано в Пользовательском соглашении AWS или других документах, согласно которым мы предоставляем услуги. 

* Указанный ниже ежемесячный тариф получен умножением фактического почасового тарифа на среднее количество часов в месяце.

** Указанный ниже фактический почасовой тариф соответствует амортизированным почасовым расходам на инстанс на протяжении всего срока резервирования, включая авансовые платежи.

Текущее поколение

Предыдущее поколение

Расчет фактической цены за терабайт в год для зарезервированных инстансов

При использовании зарезервированных инстансов, необходимо прибавить авансовые платежи к почасовым тарифам, умноженным на количество часов в выбранном периоде, и поделить на количество лет в выбранном периоде и количество терабайтов на узел. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Текущее поколение

Предыдущее поколение

Калькулятор цен

Хранилище резервных копий

Хранилище резервных копий данных – это хранилище, связанное с автоматическими и выполненными вручную снимками хранилища данных. Увеличение срока хранения резервных копий или сохранение дополнительных снимков состояния увеличивает потребляемый хранилищем данных объем хранилища резервных копий. За хранение резервных копий, занимающих до 100 % выделенного объема хранилища активного кластера хранилища данных, плата не начисляется. Например, если у вас есть активный кластер с одним узлом XL с хранилищем на 2 ТБ, мы предоставим хранилище резервных копий до 2 ТБ в месяц бесплатно. За хранение резервных копий объемом больше предоставленного хранилища, а также за хранение резервных копий после окончания срока действия кластера начисляется плата по стандартным тарифам Amazon S3.

Передача данных

Плата за передачу данных между Amazon Redshift и Amazon S3 при резервном копировании, восстановлении, при операциях загрузки и выгрузки в пределах одного региона AWS не начисляется. Все прочие случаи передачи данных в Amazon Redshift или из него оплачиваются по стандартным тарифам AWS на передачу данных. В частности, если кластер Amazon Redshift работает в Amazon VPC, при передаче данных через JDBC / ODBC на адрес кластера Amazon Redshift будет начисляться стандартная плата за передачу данных AWS. Кроме того, если используется улучшенная маршрутизация VPC и данные выгружаются в Amazon S3 в другом регионе, за это тоже будет взиматься стандартная плата за передачу данных AWS. Подробнее о расценках на передачу данных в AWS см. на странице цен на Amazon EC2.

Дополнительные ресурсы по ценам

Калькулятор совокупной стоимости владения (TCO)

Рассчитать совокупную стоимость владения (TCO)

Калькулятор

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по экономике

Дополнительные ресурсы для перехода на AWS

Дополнительные ресурсы по Amazon Redshift

Перейти на страницу ресурсов
Готовы приступить к разработке?
Начать работу с Amazon Redshift
Есть вопросы?
Свяжитесь с нами