Amazon Athena – интерактивный сервис запросов, позволяющий с легкостью анализировать данные непосредственно в Amazon S3 стандартными средствами SQL. Всего за несколько нажатий мышью в Консоли управления AWS пользователи могут указать расположение данных в S3, начать выполнять специальные запросы с помощью стандартных средств SQL и получить результаты в течение несколько секунд. Athena – это бессерверный сервис, поэтому не нужно управлять инфраструктурой, а плата начисляется только за запросы. Сервис можно использовать для обработки журналов, выполнения специального анализа и интерактивных запросов данных. Athena масштабируется автоматически и выполняет запросы параллельно, поэтому результаты возвращаются очень быстро, даже при выполнении сложных запросов на больших объемах данных. 

Теперь сервис Amazon Athena доступен всем

Попробуйте сервис Athena сейчас

Начать работу очень просто. Чтобы начать выполнять запросы, достаточно просто загрузить данные в Amazon S3 и запустить Amazon Athena.

Подробнее об уровне бесплатного пользования AWS »

100x100_benefit_cloud

Amazon Athena работает без сервера, поэтому не нужно управлять инфраструктурой. Не нужно беспокоиться о настройке, обновлениях ПО, сбоях и масштабировании инфраструктуры при увеличении объемов данных и количества пользователей. Об этом позаботится Athena, так что можно сконцентрироваться на анализе данных.  

100x100_benefit_easy-setup

Чтобы начать работу, войдите в консоль Athena, задайте схему с помощью мастера консоли или выражения DDL и начните тут же выполнять запросы во встроенном редакторе запросов. Можно также использовать AWS Glue для автоматического поиска данных в указанных источниках и для заполнения каталога данных информацией о новых или измененных таблицах и определениями разделов. Результаты отображаются в консоли в течение нескольких секунд и будут автоматически сохранены в указанном местоположении в S3. Их также можно загрузить на рабочий стол. Для подготовки данных к анализу больше не нужно использовать сложные задания ETL. Таким образом, любой специалист со знанием SQL может быстро анализировать большие наборы данных.

100x100_benefit_check

Amazon Athena использует открытый распределенный движок запросов SQL, оптимизированный для быстрого выполнения специального анализа данных. Это означает, что можно выполнять запросы на огромных объемах данных в Amazon S3, используя ANSI SQL с полной поддержкой объединения больших таблиц, оконных функций и массивов данных. Athena поддерживает множество форматов данных, таких как CSV, JSON, ORC, Avro или Parquet. К Athena также можно подключать различные инструменты бизнес-аналитики, используя драйвер JDBC.

100x100_benefit_pay-as-you-go

В Amazon Athena можно платить только за выполняемые запросы. Плата начисляется за объем данных, обработанных при выполнении каждого запроса. Чтобы увеличить производительность и значительно сократить стоимость запросов, можно сжать данные, разбить их на разделы или преобразовать в табличный формат. Эти операции сокращают объем данных, необходимых для выполнения запроса.

100x100_benefit_performance

С Amazon Athena не нужно беспокоиться об управлении кластерами и их настройке. Athena оптимизирован для быстрой и производительной работы с Amazon S3. Запросы автоматически выполняются параллельно, поэтому даже на больших объемах данных результаты готовы за несколько секунд.

100x100_benefit_available

Amazon Athena выполняет запросы с помощью вычислительных ресурсов на нескольких объектах, автоматически перенаправляя запросы соответствующим образом, если какой-то объект недоступен. В качестве основного хранилища Athena использует Amazon S3, что гарантирует высокую доступность и надежность данных. Устойчивая инфраструктура Amazon S3 обеспечивает надежное хранение 99,999999999 % объектов. Резервные копии данных распределяются между несколькими объектами и несколькими устройствами на каждом объекте.

100x100_benefit_secure

В Amazon Athena можно управлять доступом к данным с помощью политик AWS Identity and Access Management (IAM), списков контроля доступа или политик использования корзин Amazon S3. С помощью политик IAM можно управлять доступом пользователей к корзинам Amazon S3. Контролируя доступ к данным в S3, можно запретить пользователям отправлять запросы к этому хранилищу через Athena. Athena также позволяет легко выполнять запросы к зашифрованным данным, хранящимся в Amazon S3, и записывать зашифрованные результаты обратно в корзину S3. Поддерживается как шифрование на стороне сервера, так и шифрование на стороне клиента.

100x100_benefit_ingergration

В сервисе Amazon Athena предусмотрена встроенная интеграция с AWS Glue. Каталог данных AWS Glue позволяет создать единый репозиторий метаданных для различных сервисов, сканировать источники данных для обнаружения схем и наполнять каталог новыми или измененными таблицами и определениями разделов, а также обеспечивать версионность схем. Кроме того, полностью управляемые инструменты ETL сервиса Glue позволяют обрабатывать данные и преобразовывать их в табличный формат для оптимизации производительности запросов и снижения их стоимости. Подробнее об AWS Glue.