При работе с Amazon Kinesis Data Analytics вы платите только за то, что реально используете. При использовании Amazon Kinesis Data Analytics не требуется выделять ресурсы или вносить авансовые платежи.
Оплата начисляется на почасовой основе, исходя из среднего числа единиц обработки Kinesis (KPU), использованных при работе приложения потоковой обработки. KPU представляет собой единицу ресурса потоковой обработки, которая включает 1 виртуальный ЦПУ и 4 ГБ оперативной памяти. Amazon Kinesis Data Analytics автоматически масштабирует количество KPU, необходимых приложению для обработки потоков данных, по мере изменения требований к памяти и вычислительной мощности в зависимости от сложности обработки и скорости обработки потоковых данных.
При оркестрации приложений Apache Flink и Apache Beam взимается дополнительная плата за единицу KPU на каждое приложение. При использовании приложений Apache Flink и Apache Beam также взимается плата за хранилище запущенного приложения и за надежные резервные копии приложения. Хранилище запущенного приложения используется для обработки данных с фиксацией состояния в Amazon Kinesis Data Analytics и оплачивается с учетом количества ГБ-месяц. Создание постоянных резервных копий приложений (с оплатой по количеству использованных гигабайтов в месяц) предоставляется в качестве дополнительной возможности и позволяет выполнять восстановление на момент времени.
Цены
Общие рекомендации по использованию KPU
Рекомендуем испытать приложение с рабочими нагрузками, чтобы получить точное представление о количестве KPU, необходимом для его работы. Количество используемых KPU может существенно меняться в зависимости от объема данных, скорости их поступления, сложности кода, интеграции и других факторов. Это особенно актуально при использовании среды выполнения Apache Flink в Amazon Kinesis Data Analytics. Например, в ходе внутренних испытаний мы установили, что пропускная способность для простых приложений без фиксации состояния составляет сотни МБ в секунду на KPU, а пропускная способность сложных приложений с интенсивным применением алгоритмов машинного обучения – менее 1 МБ в секунду на KPU. Учитывая эти оговорки, до тестирования приложения рекомендуется рассчитывать на пропускную способность 1 МБ в секунду на KPU.
Примеры расчета цен
Пример расчета цены 1: приложение Apache Flink с простым фильтром потоковых данных
Клиент использует приложение Apache Flink в Amazon Kinesis Data Analytics для считывания потоковых данных, собранных темой Apache Kafka в кластере Amazon MSK. Клиент применяет непрерывную фильтрацию, чтобы сохранялись только интересующие его записи. Клиент создает по одной надежной резервной копии приложения ежедневно и сохраняет эти копии в течение семи дней. Ежемесячная плата за использование Amazon Kinesis Data Analytics рассчитывается следующим образом.
Стоимость за месяц
Цена в регионе Восток США составляет 0,11 USD за час работы единицы KPU, используемой в работе приложения потоковой обработки. Это простое приложение использует для обработки входящего потока данных 1 KPU. Каждое приложение Apache Flink использует по дополнительной единице KPU.
Приложения Apache Flink используют 50 ГБ хранилища запущенного приложения на каждую единицу KPU. В регионе «Восток США» это хранилище оплачивается по тарифу 0,10 USD за ГБ-месяц.
Стоимость хранилища запущенного приложения за месяц = 720 часов в месяц х 1 KPU х 50 ГБ/KPU х 0,10 USD/ГБ‑месяц = 5,00 USD
В регионе «Восток США» надежные резервные копии приложений Apache Flink оплачиваются по тарифу 0,023 USD за ГБ-месяц. Размер каждой резервной копии этого приложения составляет 1 МБ. При этом у клиента хранятся последние 7 резервных копий, и ежедневно создаются новые и удаляются старые копии.
Стоимость надежного хранилища приложения за месяц = 7 резервных копий * (1 МБ/резервная копия * 1 ГБ/1000 МБ) * 0,023 USD/ГБ‑месяц = 0,01 USD (с округлением до цента)
Общая стоимость = 158,40 USD + 5,00 USD + 0,01 USD = 163,41 USD
Пример расчета стоимости 2: SQL‑приложение со скользящим окном и всплесками нагрузки
Клиент использует в Amazon Kinesis Data Analytics SQL‑приложение для подсчета количества товаров, которые проданы в интернет‑магазине с использованием онлайн‑транзакций, захватываемых в потоке Kinesis. Подсчет производится методом «скользящего окна» с интервалом в 1 минуту. Обычно такой поток импортирует данные со скоростью 1000 записей в секунду, но при этом раз в день во время рекламных кампаний имеют место пиковые нагрузки, при которых скорость импорта составляет 6000 записей в секунду в течение часа. Ежемесячная плата за использование Amazon Kinesis Data Analytics рассчитывается следующим образом.
Стоимость за месяц
Цена в регионе Восток США составляет 0,11 USD за час работы единицы KPU, используемой в работе приложения потоковой обработки. Входящий поток данных Kinesis передает данные со скоростью 1000 записей в секунду. Раз в день на протяжении одного часа скорость возрастает до 6000 записей в секунду.
При устойчивом состоянии, которое длится 23–24 часа в день, запросы скользящего окна используют для обработки рабочей нагрузки 1 KPU.
При пиковом состоянии, которое длится 1 час в сутки ежедневно, запросы скользящего окна используют от 1 до 2 KPU. В течение этого одного часа в сутки будет начисляться плата за 2 KPU.
Общая сумма = 75,90 USD + 6,60 USD = 82,50 USD
Пример расчета цены 3: приложение Apache Flink, выполняющее ETL‑операции с потоковыми данными, при которых возникают изменения рабочих нагрузок
Клиент использует в сервисе Amazon Kinesis Data Analytics приложение Apache Flink для непрерывного преобразования и доставки данных журналов, собранных потоком Kinesis Data Stream и помещенных в Amazon S3. Данные журналов преобразуются с помощью нескольких операций, включая применение схемы к различным событиям журналов, разбиение данных по типам событий, сортировку данных по временным отметкам и буферизацию данных в течение одного часа перед доставкой. В приложении может выполняться множество шагов преобразования, но ни один из них не требует интенсивного использования вычислительных ресурсов. Этот поток загружает данные со скоростью 2000 записей в секунду в течение 12 часов в сутки, а в оставшиеся 12 часов скорость возрастает до 8000 записей в секунду. Клиент не создает надежных резервных копий. Ежемесячная плата за использование Amazon Kinesis Data Analytics рассчитывается следующим образом.
Стоимость за месяц
Цена в регионе Восток США составляет 0,11 USD за час работы единицы KPU. Kinesis Data Analytics выделяет 50 ГБ хранилища для запущенного приложения на единицу KPU. Хранилище оплачивается по цене 0,10 USD за гигабайт в месяц.
Повышенная рабочая нагрузка. На протяжении 12 часов повышенной рабочей нагрузки приложение Kinesis Data Analytics обрабатывает 8000 записей в секунду и автоматически масштабируется до 8 KPU. После этого периода через 6 часов работы с пониженной пропускной способностью приложение Kinesis Data Analytics сокращает количество выделенных ресурсов. Приложение масштабируется до 8 KPU в совокупности 18 часов в сутки.
Пониженная рабочая нагрузка. В течение периода пониженной рабочей нагрузки в оставшиеся 6 часов сервис Kinesis Data Analytics обрабатывает 2000 записей в секунду и автоматически масштабируется до 2 KPU.
Каждое приложение Apache Flink использует по дополнительной единице KPU.
Стоимость за месяц = 30 х 24 х 1 KPU х 0,11 USD в час = 79,20 USD
Общая стоимость = 515,20 USD + 49,60 USD + 79,20 USD = 644,00 USD
Примечание. Мы оставляем за собой право взимать плату по стандартному тарифу AWS за передачу данных в приложения Amazon Kinesis Data Analytics и из них.
Дополнительные ресурсы по ценам
Простой расчет ежемесячных расходов на AWS
Дополнительные ресурсы для перехода на AWS
Начать работу с Amazon Kinesis Data Analytics

Из этого пошагового руководства вы узнаете, как использовать Amazon Kinesis Data Analytics для работы с SQL илиApache Flink.

Создайте свое приложение потоковой передачи в консоли Amazon Kinesis Data Analytics.