亚马逊AWS官方博客

AWS Team

Author: AWS Team

使用 Apache Flink 与 Amazon Kinesis Data Analytics 实现流式 ETL

本文讨论了如何使用Apache Flink与Kinesis Data Analytics构建流式ETL管道。其中着重强调了如何构建可扩展解决方案,在解决流式摄取中部分高级用例的同时,保持较低的运营开销。这套解决方案将帮助大家快速实现流式数据的丰富与转换,并将其加载至数据湖、数据存储或者其他分析工具当中,且无需执行额外的ETL操作步骤。本文还探讨了如何通过监控与故障处理对应用程序加以扩展。

使用 Amazon Kendra 强化企业搜索能力

在本文中,我们了解了如何使用Amazon Kendra部署企业搜索服务。您可以使用机器学习支持的Amazon Kendra改善公司内部的搜索体验。您也可以在不具备任何机器学习/AI经验的前提下,使用自然语言快速检索文档。关于Amazon Kendra项目的更多详细信息,请参阅AWS re: Invent 2019大会上Andy Jassy做出的主题演讲、Amazon Kendra常见问题解答以及Amazon Kendra是什么?

在 Amazon Elasticsearch Service 中使用 Random Cut Forests 实现实时异常检测

在本文中,我们理解了异常检测的目标,并探讨了异常检测模型与输出结果方面的详细信息。目前,大家可以轻松从Amazon ES以及Open Distro for Elasticsearch当中获得这些功能。最后,我们还将异常检测工具的结果与两种常用模型进行了比较,并观察到相当可观的性能改进。

关于在 AWS 上运行 Apache Kafka 的最佳实践

在本文中,我们将讨论了在AWS云中运行Kafka的几种常见模式。AWS还提供另一种托管解决方案,即 Amazon Kinesis Data Streams。该方案无需为服务器的管理或扩展而分神,大家可以在几秒钟之内扩展流式管道规模且无任何停机,跨可用区数据复制将自动执行,以开箱即用的方式享受良好的安全保障,Kinesis Data Stream与Lambda、Redshift、Elasticsearch等多种AWS服务以及Storm、Spark、Flink等开源框架紧密集成。

如何管理不活跃 Amazon Aurora PostgreSQL 用户

本文向您解释如何根据当前安全策略识别不活跃的Aurora PostgreSQL用户,并对其执行锁定或删除。在尝试使用此解决方案时,请测试并不断修改代码以满足您的实际需求。您还应考虑添加警报机制以保证当前作业的正常运行,并在用户被锁定或删除时发出通知。