Обзор

Расходы при использовании Amazon Redshift ниже по сравнению с другими хранилищами данных. Начните с малого по цене 0,25 USD в час и увеличивайте масштаб – до нескольких петабайтов хранилища и тысяч одновременно работающих пользователей. Опирайтесь на потребности бизнеса. Чтобы увеличить размер хранилища, не придется выделять избыточные вычислительные ресурсы, а чтобы расширить вычислительные ресурсы, не нужно повышать расходы на хранилище.

Ожидания
Сначала выберите наилучшую конфигурацию кластера для своих потребностей, изучив дополнительные сведения о типах узлов в следующем разделе. Работу кластера можно быстро приостанавливать и возобновлять, а также менять его масштаб и типы узлов. Для этого достаточно одного вызова API или пары щелчков мышью в консоли Amazon Redshift. На этапе выбора узлов отображаются цены на ресурсы по требованию. В дальнейшем можно приобрести зарезервированные узлы со значительными скидками.

После выбора можно воспользоваться эластичным изменением размера, чтобы легко регулировать выделенный объем вычислительных ресурсов за несколько минут для стабильной обработки. С помощью планировщика изменения размера можно добавлять и удалять узлы ежедневно или еженедельно для оптимизации затрат и достижения максимальной производительности. Для динамических рабочих нагрузок можно использовать параллельное масштабирование, чтобы автоматически выделять дополнительный объем вычислительных ресурсов и платить только за используемые ресурсы на посекундной основе после того, как бесплатные кредиты будут исчерпаны (см. раздел «Цены на параллельное масштабирование»).

Типы узлов Amazon Redshift

Amazon Redshift содержит различные типы узлов, которые можно подобрать в соответствии с рабочими нагрузками. Рекомендуем выбирать RA3 или DC2 в зависимости от требований к производительности, размера данных и их роста.
 
Узлы RA3 с управляемым хранилищем позволяют получить оптимальное хранилище данных. Менять масштаб вычислительных ресурсов и управляемого хранилища можно независимо друг от друга. Плата за них начисляется по отдельности. Используя RA3, вы выбираете нужное количество узлов на основе требований к производительности и платите только за используемый объем управляемого хранилища. Размер кластера RA3 следует подбирать на основе объема данных, обрабатываемых ежедневно.

В качестве локального хранилища, поддерживающего быструю скорость записи и чтения, в каждом узле RA3 управляемого хранилища Redshift используются объемные высокопроизводительные SSD. Для долгосрочного надежного хранения используется Amazon S3. Если объем данных в узле начинает превышать размер крупных локальных SSD, управляемое хранилище Redshift автоматически отправляет эти данные в Amazon S3. Независимо от того, где находятся данные, на высокопроизводительных SSD или в S3, цена за использование управляемого хранилища Redshift остается неизменной и низкой. Если для рабочих нагрузок требуется постоянно увеличиваемое хранилище, объем управляемого хранилища данных может масштабироваться автоматически. При этом добавлять дополнительные узлы (и, следовательно, платить за них) не придется.

Узлы DC2 позволяют иметь хранилища данных, в которых используются локальные SSD, с интенсивным потреблением вычислительных ресурсов. Количество узлов зависит от объема данных и требований к производительности. Узлы DC2 хранят данные локально для обеспечения высокой производительности. По мере роста объема данных можно добавлять вычислительные узлы, чтобы увеличить объем хранилища кластера. Если объем набора данных без сжатия не превышает 1 ТБ, рекомендуем выбирать узлы DC2. Это способ получить наиболее высокую производительность по оптимальной цене. Если ожидается рост данных, рекомендуется использовать узлы RA3, чтобы изменять размер вычислительных ресурсов и хранилища независимо для оптимизации затрат и производительности.

Узлы DS2 позволяют создавать крупные хранилища данных с применением жестких дисков (HDD). Рекомендуем использовать вместо них узлы RA3. При использовании узлов DS2 см. раздел «Обзор типов узлов RA3» в руководстве по управлению кластерами, где приведены указания по переходу. Клиенты, использующие как минимум восемь узлов DS2.xlarge или любое число узлов DS2.8xlarge, могут теперь перейти на RA3, увеличив хранилище в 2 раза и повысив производительность по требованию при той же стоимости.

Возможности Redshift с оплатой по факту использования

  • Цены на Amazon Redshift Spectrum. Этот сервис позволяет выполнять прямые SQL‑запросы по всему объему данных в озере данных S3 (в масштабе эксабайтов), при этом плата начисляется только по количеству обработанных байтов.
  • Цены на параллельное масштабирование. Каждый кластер за сутки накапливает до одного часа бесплатных кредитов для параллельного масштабирования, и для 97 % клиентов этого достаточно. Это обеспечивает стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. При превышении объема накопленных кредитов плата за масштабирование по требованию начисляется на посекундной основе. 
  • Цены на управляемое хранилище Redshift. Плата гибко начисляется только за объем данных, который хранится в кластерах RA3, независимо от числа выделенных вычислительных узлов. Оплате подлежит каждый час использования общего объема управляемого хранилища, занятого данными.

Цены по требованию

Цены по требованию в Amazon Redshift позволяют платить за объем используемых ресурсов и не предусматривают каких‑либо обязательств или авансовых платежей: вы просто вносите почасовую оплату, исходя из типа и количества узлов в кластере. Неполные часы работы подлежат оплате на посекундной основе с момента изменения статуса кластера (например, с момента его создания, удаления, приостановки или возобновления работы). Функция приостановки и возобновления работы дает возможность приостановить оплату по требованию в то время, когда кластер не используется. В период, когда работа кластера приостановлена, вы платите только за хранение резервных данных. Это избавляет от планирования, а также предварительного приобретения ресурсов для хранилища данных, когда объем потребностей еще неизвестен. Кроме того, сервис позволяет экономично управлять средами разработки или тестирования.

Текущее поколение

* Общий объем доступной памяти в управляемом хранилище на каждом узле RA3.

Предыдущее поколение

Расчет фактической цены за терабайт в год при оплате по требованию

При использовании тарифов по требованию фактическая цена за терабайт в год – это цена за час пользования инстансом, умноженная на количество часов в году и поделенная на количество терабайтов на инстансе. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Цены на Redshift Spectrum

Amazon Redshift Spectrum позволяет напрямую выполнять SQL‑запросы к эксабайтам данных, хранящихся в Amazon S3. Плата начисляется по количеству байтов, просканированных Redshift Spectrum, с округлением до ближайшего мегабайта. Минимальный объем на каждый запрос – 10 МБ. Плата не взимается за выполнение команд языка определения данных (DDL), таких как CREATE / ALTER / DROP TABLE, команд управления и разбиения на разделы, а также за выполнение запросов, которые завершились ошибкой.

Можно повысить производительность запросов и сократить расходы, сохраняя данные в столбчатом формате, используя сжатие и деление на разделы. При сжатии данных с использованием одного из поддерживаемых Redshift Spectrum форматов стоимость использования снижается, поскольку уменьшается объем данных для сканирования. При хранении данных в столбчатом формате, например, Parquet или ORC, затраты будут еще меньше, поскольку Redshift Spectrum будет только считывать столбцы, необходимые для выполнения запроса.

Дополнительные расходы

Оплате подлежит работа кластера Amazon Redshift, который используется для выполнения запросов Redshift Spectrum к данным. Запросы Redshift Spectrum выполняются непосредственно в Amazon S3. Хранение объектов в корзинах S3 и выполнение запросов к корзинам S3 оплачиваются по стандартным тарифам Amazon S3. Подробные сведения см. на странице Цены на Amazon S3

При использовании каталога данных AWS Glue с Amazon Redshift Spectrum плата начисляется по стандартным тарифам каталога данных AWS Glue. Подробные сведения см. на странице Цены на AWS Glue.

При использовании сервиса Amazon Redshift Spectrum для запроса зашифрованных данных AWS Key Management Service (KMS) в сервисе Amazon S3 плата начисляется по стандартным тарифам AWS KMS. Подробные сведения см. на странице Цены на AWS KMS.

Примеры расчета стоимости Redshift Spectrum на основе цен в регионе Восток США (Сев. Вирджиния)

Рассмотрим таблицу со ста столбцами равного размера, сохраненную в Amazon S3 в виде несжатого текстового файла общим размером 4 ТБ. При выполнении запроса на извлечение данных из одного столбца таблицы Redshift Spectrum придется обработать весь файл, поскольку данные в текстовом формате нельзя разделить. Запрос просканирует 4 ТБ данных, его стоимость составит 20 USD (5 USD / ТБ х 4 ТБ = 20 USD).

Если сжать файл в формат GZIP, его размер можно уменьшить в 4 раза. Сжатый файл будет иметь размер 1 ТБ. Redshift Spectrum необходимо просканировать весь файл, но поскольку его размер составляет всего четверть от исходного, стоимость также составит лишь четверть – 5 USD (5 USD / ТБ х 1 ТБ = 5 USD).

Если сжать исходный файл и конвертировать его в столбчатый формат вроде Apache Parquet, коэффициент сжатия может достичь значения до 4:1. Таким образом, размер сжатого файла может уменьшиться до 1 ТБ. Выполняя запрос, аналогичный приведенному выше, Redshift Spectrum просканирует лишь один столбец в файле Parquet. Стоимость такого запроса составит 0,05 USD (5 USD / ТБ х 1 ТБ х 1/100 столбцов, или суммарно 10 ГБ просканированных данных = 0,05 USD).

Примечание. Примеры расчета стоимости выше приведены исключительно в справочных целях. Коэффициент сжатия у разных файлов и столбцов может различаться.

Цены на параллельное масштабирование

Amazon Redshift автоматически добавляет переходные ресурсы, обеспечивая стабильно высокую производительность даже при одновременном наличии тысяч запросов и пользователей. Не требуется управлять ресурсами; авансовые платежи отсутствуют, плата за время запуска и завершения работы переходных кластеров не взимается. За сутки использования основного кластера можно накопить кредиты, дающие право на один час использования кластера параллельного масштабирования. При предоставлении кластера параллельного масштабирования по требованию сверх бесплатной нормы кредитов посекундная плата начисляется только тогда, когда кластер обрабатывает запросы. При этом при каждой активации кластера параллельного масштабирования начисляется минимальная плата в размере одной минуты. Посекундный тариф по требованию зависит от типа и количества узлов в кластере Amazon Redshift.

Кредиты для параллельного масштабирования

Кластеры Amazon Redshift за сутки накапливают до одного часа бесплатных кредитов для параллельного масштабирования. Кредиты для каждого активного кластера вашего аккаунта AWS зарабатываются на почасовой основе; кредиты могут быть потрачены только для того же кластера, который их заработал. Для каждого активного кластера можно накопить до 30 часов бесплатных кредитов для параллельного масштабирования. Кредиты действуют бессрочно до тех пор, пока не удален кластер.

Пример расчета стоимости параллельного масштабирования

Кластер Redshift узла 10 DC2.8XL в регионе US-East стоит 48 USD в час. Рассмотрим сценарий, в котором два переходных кластера используются в течение пяти минут сверх бесплатных кредитов для параллельного масштабирования. Посекундный тариф по требованию для параллельного масштабирования составляет 48 USD х 1/3600 = 0,013 USD в секунду. Дополнительные затраты для параллельного масштабирования в этом случае составляют 0,013 USD в секунду х 300 секунд х 2 переходных кластера = 8 USD. Таким образом, общие затраты на кластер Amazon Redshift и два переходных кластера в этом случае составляют 56 USD.

Цены на управляемое хранилище Redshift

Плата за хранение данных в управляемом хранилище начисляется по фиксированному тарифу, установленному для соответствующего региона, за гигабайт‑месяц. Управляемое хранилище предлагается исключительно в составе узлов типа RA3. Цена на управляемое хранилище Redshift не зависит от объема данных и остается неизменно низкой. Плата за использование управляемого хранилища начисляется по почасовому тарифу в зависимости от общего объема данных, хранящихся в управляемом хранилище. Пример перевода гигабайт‑часов в гигабайт‑месяцы приведен ниже. Отслеживать объем данных в кластере RA3 можно с помощью Amazon Cloudwatch или Консоли управления AWS. Плата за перенос данных между узлами RA3 и управляемым хранилищем не взимается. В стоимость управляемого хранилища не включена стоимость хранилища резервных копий (используются снимки состояния, созданные вручную и автоматически – см. Хранилище резервных копий). После отключения кластера плата за хранение вручную созданных резервных копий продолжает взиматься.

Пример расчета цены на управляемое хранилище

Предположим, вы храните 100 ГБ данных в управляемом хранилище, выделенном с узлом RA3, в течение первых 15 дней апреля и 100 ТБ данных в течение последних 15 дней апреля.
Сначала определим использование хранилища в ГБ‑часах для приведенного выше примера. В течение первых 15 дней использование в ГБ‑часах составит: 100 ГБ x 15 дней x ( 24 часа / сутки) = 36 000 ГБ‑часов.
В течение последних 15 дней использование в ГБ‑часах составит: 100 ТБ X 1024 ГБ/ТБ X 15 дней X ( 24 часа / сутки) = 36 864 000 ГБ‑часов

В конце апреля использование в ГБ‑часах суммируется: 36 000 ГБ‑часов + 36 864 000 ГБ‑часов = 36 900 000 ГБ‑часов
Переведем это в ГБ‑месяцы: 36 900 000 ГБ‑часов / 720 часов в месяц в апреле = 51 250 ГБ‑месяцев.

Если эти данные хранились в регионе Восток США (Северная Вирджиния), цена на управляемое хранилище составляет 0,024 USD / ГБ‑месяц. За месяц использования хранилища, которое составило 51 250 ГБ‑месяцев, будет начислено: 51 250 ГБ‑месяцев x 0,024 USD за ГБ‑месяц = 1230 USD
Итоговая стоимость использования управляемого хранилища в апреле = 1230 USD.

Цены на зарезервированные инстансы

Зарезервированные инстансы подходят в качестве ресурсов для рабочих сред со стабильной нагрузкой и позволяют значительно экономить по сравнению с ценами по требованию. Клиенты обычно приобретают зарезервированные инстансы после проведения экспериментов и создания опытных образцов для проверки рабочих конфигураций.

Вы можете существенно сэкономить по сравнению с тарифами по требованию, взяв на себя обязательство использовать сервис Amazon Redshift на срок 1 или 3 года. Цена на зарезервированный инстанс зависит от типа приобретенного узла и действует до окончания срока резервирования. В стоимость включены две дополнительных копии данных – одна на узлах кластера, другая в корзине Amazon S3. Мы позаботимся о резервном копировании, надежности, доступности, безопасности, мониторинге и обслуживании для вас.

Доступны три варианта оплаты зарезервированных инстансов.

Без авансовых платежей: предоплата отсутствует. Вы берете на себя обязательство вносить помесячную оплату на протяжении одного года.

С частичной предоплатой: вы вносите частичную предоплату за зарезервированные инстансы, а оставшуюся часть оплачиваете в течение одного или трех лет.

С полной предоплатой: вы полностью оплачиваете зарезервированные инстансы (за период один или три года) одним авансовым платежом.

Обратите внимание, что резервирование инстансов является схемой оплаты и не используется для создания кластеров хранения данных. Когда вы совершите покупку, с вас будет взиматься соответствующая предоплата и ежемесячная плата даже при отсутствии запущенного кластера или приостановке имеющегося кластера. Чтобы приобрести зарезервированные инстансы, перейдите на вкладку Reserved Nodes (Зарезервированные инстансы) в консоли.

Мы можем прекратить действие ценовой программы для зарезервированных инстансов в любое время. Кроме стоимости зарезервированных инстансов, требуется оплачивать передачу данных и другие услуги, как это указано в Пользовательском соглашении AWS или других документах, согласно которым мы предоставляем услуги. 

* Указанный ниже ежемесячный тариф получен умножением фактического почасового тарифа на среднее количество часов в месяце.

** Указанный ниже фактический почасовой тариф соответствует амортизированным почасовым расходам на инстанс на протяжении всего срока резервирования, включая авансовые платежи.

Текущее поколение

Предыдущее поколение

Расчет фактической цены за терабайт в год для зарезервированных инстансов

При использовании зарезервированных инстансов, необходимо прибавить авансовые платежи к почасовым тарифам, умноженным на количество часов в выбранном периоде, и поделить на количество лет в выбранном периоде и количество терабайтов на узел. При использовании RA3 счета за хранение данных в управляемом хранилище выставляются отдельно в зависимости от фактического объема данных, хранящихся в узлах типа RA3. Фактическая цена за терабайт в год рассчитывается только для вычислительных узлов.

Текущее поколение

Предыдущее поколение

Калькулятор цен

Хранилище резервных копий

Хранилище резервных копий данных – это хранилище, связанное со снимками состояния хранилища данных. Увеличение срока хранения резервных копий или сохранение дополнительных снимков состояния увеличивает потребляемый хранилищем данных объем хранилища резервных копий. Данные, хранящиеся в кластерах RA3, входят в состав Redshift Managed Storage (RMS) и оплачиваются по тарифам RMS, но созданные вручную снимки состояния кластеров RA3 оплачиваются как резервное хранилище по стандартным тарифам Amazon S3. Например, если кластер RA3 содержит 10 ТБ данных и 30 ТБ созданных вручную снимков состояния, то оплачиваются 10 ТБ RMS и 30 ТБ резервного хранилища. В случае кластеров Dense Compute (DC) и Dense Storage (DS) хранилище включено в кластер и не оплачивается отдельно, но резервные копии хранятся во внешнем сервисе S3. Резервное хранилище сверх размера выделенных кластеров DC и DS оплачивается как резервное хранилище по стандартным тарифам Amazon S3. Снимки состояния оплачиваются до окончания срока их действия или до их удаления, в том числе при приостановке или удалении кластера.

Передача данных

Плата за передачу данных между Amazon Redshift и Amazon S3 при резервном копировании, восстановлении, при операциях загрузки и выгрузки в пределах одного региона AWS не начисляется. Все прочие случаи передачи данных в Amazon Redshift или из него оплачиваются по стандартным тарифам AWS на передачу данных. В частности, если кластер Amazon Redshift работает в Amazon VPC, при передаче данных через JDBC / ODBC на адрес кластера Amazon Redshift будет начисляться стандартная плата за передачу данных AWS. Кроме того, если используется улучшенная маршрутизация VPC и данные выгружаются в Amazon S3 в другом регионе, за это тоже будет взиматься стандартная плата за передачу данных AWS. Подробнее о расценках на передачу данных в AWS см. на странице цен на Amazon EC2.

Дополнительные ресурсы по ценам

Калькулятор полной стоимости владения (TCO)

Рассчитать полную стоимость владения (TCO)

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по экономике

Дополнительные ресурсы для перехода на AWS

Дополнительные ресурсы по Amazon Redshift

Перейти на страницу ресурсов
Готовы приступить к разработке?
Начать работу с Amazon Redshift
Есть вопросы?
Свяжитесь с нами