Amazon Athena позволяет платить только за выполняемые запросы. Плата начисляется за объем данных, обработанных при выполнении каждого запроса. Чтобы увеличить производительность и значительно сократить стоимость запросов, можно сжать данные, разбить их на разделы или преобразовать в табличный формат. Эти операции сокращают объем данных, необходимых для выполнения запроса.

Цена запроса

Табличный формат, разбиение на разделы и сжатие данных для дополнительной экономии

Чтобы сократить стоимость запросов на 30–90 % и увеличить производительность, можно сжать данные, разбить их на разделы и преобразовать в табличный формат.

Сведения о ценах

Плата начисляется по количеству байтов, обработанных Amazon Athena, с округлением до мегабайтов. Минимальный объем на каждый запрос – 10 МБ. Плата не взимается, если выполнение запроса завершилось с ошибкой, а также за выполнение команд языка определения данных (DDL), таких как CREATE/ALTER/DROP TABLE, и команд управления и разбиения на разделы. При отмене запросов плата начисляется в зависимости от объема обработанных данных.

Если сжать данные, сервис будет обрабатывать меньший объем. Преобразование данных в столбцовые форматы позволяет Athena при обработке данных выборочно считывать только необходимые столбцы. Athena поддерживает Apache ORC и Apache Parquet. Разбиение данных на разделы также приводит к уменьшению объема данных, обрабатываемых Athena. Все это обеспечивает сокращение затрат и повышение производительности. Объем данных, обработанных при выполнении запроса, можно посмотреть в консоли Athena. Дополнительные сведения о ценах см. в разделе «Пример расчета стоимости».

Цены на федеративные запросы

Плата начисляется по количеству байтов, обработанных Amazon Athena суммарно для всех источников данных, с округлением до мегабайтов. Минимальный объем на каждый запрос – 10 МБ.

Дополнительная плата

Поскольку запросы Amazon Athena выполняются непосредственно в Amazon S3, дополнительная плата за хранение данных не взимается. Плата по стандартному тарифу начисляется только за хранение данных в S3, запросы и передачу данных. По умолчанию результаты выполнения запросов сохраняются в выбранной корзине S3; за них также начисляется плата по стандартному тарифу Amazon S3.

При использовании каталога данных AWS Glue с Athena вы платите по стандартным тарифам для каталога данных AWS Glue. Подробные сведения см. на странице цен AWS Glue.

Дополнительно начисляются платежи по стандартным тарифам сервисов AWS, используемых вместе с Athena, например Amazon S3, AWS Lambda, AWS Glue и Amazon SageMaker. К примеру, начисляется стандартная плата за хранение данных в S3, выполнение запросов и передачу данных между регионами. По умолчанию результаты выполнения запросов сохраняются в выбранной корзине S3; их хранение также подлежит оплате по стандартным тарифам Amazon S3. При использовании AWS Lambda плата начисляется на основе количества запросов к функциям и их продолжительности, т. е. времени, в течение которого исполняется код.

Федеративные запросы выполняют вызов функций AWS Lambda на вашем аккаунте, оплата за работу AWS Lambda начисляется по стандартным расценкам. Функции Lambda, вызываемые федеративными запросами, относятся к уровню бесплатного использования Lambda. Подробнее см. на странице цен на AWS Lambda.

Пример расчета стоимости

Рассмотрим таблицу с тремя столбцами равного размера, сохраненную в Amazon S3 в виде несжатого текстового файла общим размером 3 ТБ. При выполнении запроса на извлечение данных из одного столбца таблицы Amazon Athena обработает весь файл, поскольку данные в текстовом формате нельзя разделить.

  • Стоимость данного запроса составит 15 USD. (Стоимость обработки 3 ТБ данных составит 3 х 5 USD/1 TБ = 15 USD.)

Если сжать файл в формат GZIP, его размер можно уменьшить в 3 раза. Тогда сжатый файл будет иметь размер 1 ТБ. Теперь этот же запрос будет стоить 5 USD. Athena все равно будет обрабатывать весь файл, но поскольку его размер стал в три раза меньше, пользователь будет платить в три раза меньше.

Если сжать файл и преобразовать его в табличный формат, такой как Apache Parquet, его размер уменьшится в 3 раза, но в Amazon S3 все равно будет 1 ТБ данных. Но в этот раз, за счет табличного формата Parquet, для выполнения запроса Amazon Athena достаточно обработать только требуемый столбец. Поскольку в запросе указан только один столбец, Athena прочитает только его, т. е. третью часть файла. Таким образом, будет обработано 0,33 ТБ данных.

  • Стоимость данного запроса составит 1,67 USD. Стоимость снижается в три раза за счет сжатия и еще в три раза – за счет чтения только одного столбца.
    (Размер файла = 3 ТБ/3 = 1 ТБ. Объем обрабатываемых данных в одном столбце = 1 ТБ/3 = 0,33 ТБ. Цена за 0,33 ТБ = 0,33 х 5 USD/1 ТБ = 1,67 USD)

Дополнительные ресурсы по ценам

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по экономике

Дополнительные ресурсы для перехода на AWS

Узнайте, как начать работу с Amazon Athena

Перейти на страницу начала работы
Готовы приступить к разработке?
Начало работы с Amazon Athena
Есть вопросы?
Свяжитесь с нами