Начало работы с Потоками данных Amazon Kinesis
Начало работы
Потоки данных Amazon Kinesis – это широко масштабируемый сервис по сбору и обработке данных с высокой степенью надежности, оптимизированный для работы с потоковыми данными. В соответствии с настройками в поток данных Amazon Kinesis могут непрерывно поступать данные из сотен тысяч источников. Данные становятся доступными для приложений Amazon Kinesis уже через миллисекунды, а записи данных попадают в эти приложения в порядке создания.
Потоки данных Amazon Kinesis можно интегрировать со многими сервисами AWS, включая: Данные Amazon Kinesis Firehose для преобразования данных в режиме, близком к реальному времени, и доставки потоковых данных в озеро данных AWS, например Amazon S3; Управляемый сервис Amazon для Apache Flink для управляемой обработки потоковых данных; AWS Lambda для обработки событий или записей; AWS PrivateLink для частных подключений; Amazon Cloudwatch для обработки метрик и журналов; а также AWS KMS для шифрования на стороне сервера.
Сервис «Потоки данных Amazon Kinesis» используется в качестве шлюза в системе обработки больших данных. Данные из различных источников помещаются в поток Amazon Kinesis, после чего могут использоваться различными приложениями Amazon Kinesis. В этом примере одно приложение (обозначено желтым) обрабатывает потоковые данные в режиме реального времени. Другое приложение (обозначено красным) выполняет простую агрегацию данных и отправляет обработанные данные в Amazon S3. Данные в S3 подвергаются обработке и сохраняются в Amazon Redshift для комплексного анализа. Третье приложение (обозначено зеленым) передает необработанные данные в Amazon S3, после чего они архивируются и отправляются в Amazon Glacier для экономичного долгосрочного хранения. Обратите внимание: все три конвейера обработки данных работают одновременно и параллельно.
Начать работу с Amazon Kinesis Data Streams
Видео
Использование Kinesis Data Streams
Зарегистрировавшись в Amazon Web Services, можно начать работу с Amazon Kinesis Data Streams. Для этого нужно выполнить следующие действия.
- Создать поток данных Amazon Kinesis с помощью консоли управления Amazon Kinesis или API CreateStream Amazon Kinesis.
- Настроить источники данных для непрерывной передачи данных в поток Amazon Kinesis.
- Создать приложения Amazon Kinesis для считывания и обработки данных из потока данных Amazon Kinesis.
Избранные решения
Решение для потоковой обработки данных AWS для Amazon Kinesis предоставляет шаблоны AWS CloudFormation, в которых данные проходят через источники, потоковое хранилище, потребителей и пункты назначения. Чтобы соответствовать разным примерам использования и потребностям бизнеса, решение предлагает четыре шаблона AWS CloudFormation. Настройки шаблонов позволяют применять лучшие рекомендации по защите данных и по мониторингу функциональности с помощью панелей и тревог.