Перейти к главному контенту

Amazon Data Firehose

Надежная загрузка потоков в реальном времени в озера и хранилища данных и аналитические службы

Преимущества

Простой захват, преобразование и загрузка потоковых данных. Создание потока доставки, выбор целевого объекта и организация потоковой передачи данных в режиме реального времени всего в несколько щелчков мышью.

Автоматическое распределение и масштабирование вычислений, объема памяти и сетевых ресурсов без постоянного администрирования.

Преобразование необработанных потоков данных в такие форматы, как Apache Parquet, и динамическое их разделение без создания собственных конвейеров обработки.

Как это работает

Сервис Amazon Data Firehose – самый простой способ за считаные секунды получать, преобразовывать потоковые данные и доставлять их в озера данных, хранилища и аналитические сервисы. Чтобы начать использовать Amazon Data Firehose, достаточно настроить источник потока, назначение и необходимые преобразования. Amazon Data Firehose непрерывно обрабатывает поток, автоматически масштабируется с учетом объема данных и доставляет их в целевую систему всего за несколько секунд.

Выберите для потока данных источник, например раздел в Amazon Managed Streaming for Kafka (MSK) или поток в Потоках данных Kinesis, или напрямую передайте данные с помощью API Firehose Direct PUT. Amazon Data Firehose имеет встроенную интеграцию с более 20 сервисами AWS, поэтому вы можете легко настроить поток из Databases (ознакомительная версия), Журналов Amazon CloudWatch, веб-журналов ACL AWS WAF, журналов Сетевого брандмауэра AWS, Amazon SNS, AWS IoT и других источников.

Укажите, нужно ли преобразовывать поток данных в другой формат (например, Parquet или ORC), распаковывать данные, выполнять произвольные преобразования данных с помощью вашей функции AWS Lambda или на основе значений атрибутов динамически распределять входные записи по нескольким целевым назначениям.

Выберите конечную точку для потока, например Amazon S3, Сервис Amazon OpenSearch, таблицы Amazon S3 (ознакомительная версия), Amazon Redshift, Splunk, Snowflake, таблицы Apache Iceberg Tables или пользовательский HTTP-адрес.

Дополнительные сведения о сервисе Amazon Data Firehose см. в этой документации.

Примеры использования

Потоковая передача данных в Amazon S3 и преобразование данных в необходимые форматы для анализа без создания конвейеров обработки.

Мониторинг безопасности сети в реальном времени и создание предупреждений при выявлении потенциальных угроз с помощью поддерживаемых инструментов информации в сфере безопасности и управления событиями (SIEM).

Обогатите свои потоки данных моделями машинного обучения (ML) для анализа данных и прогнозирования адресов вывода по мере продвижения потоков к месту назначения.