亚马逊AWS官方博客
开发者指南:当 Amazon EFS 遇上 Amazon ECS 与 AWS Fargate——第一部分
本文为系列博文中的第一篇。到这里,我们已经讨论了此次集成功能的诉求、适用范围与用例。现在,大家可以转向第二部分,下一篇文章将深入探讨Amazon EFS的工作方式,以及我们要如何以EFS、ECS以及Fargate为基础构建起具有区域弹性的部署体系。
Drop 如何使用 Amazon EMR for Spark 实现成本减半,并将处理速度提升5.4倍
Amazon EMR帮助Drop公司充分发挥数据资产的力量,据此做出更明智的产品与业务决策。我们使用Amazon EMR功能改善数据处理管道的整体性能与成本效率,借此获得了巨大的商业成功,这又反过来敦促我们持续探索管道改进的新方法。最终,我们意识到只有与最新AWS技术以及Amazon EMR功能保持同步,才能不断将业务系统的运营效率提升至新的高点。
聊聊 AWS Fargate 在容器世界中的角色定位
在本文中,我们从宏观层面介绍了AWS Fargate的技术背景与开发权衡,特别是其与AWS容器产品组合(即ECS与EKS)内其他技术的关系。之前我们曾反复强调,虽然AWS一直以解决客户的实际问题为己任,但也同样重视对技术栈内各个环节与元素的剖析与定位。只有以不同方式重新整合这些环节与元素,技术成果才能真正发挥其全部潜能。如果您身为AWS技术合作伙伴,那么只有明确理解Fargate项目的本质,才能够与其顺利集成。
使用 Amazon SageMaker Model Monitor 与 Debugger 检测并分析不正确的模型预测结果
本文展示了如何使用Amazon SageMaker Model Monitor与Amazon SageMaker Debugger自动检测意外模型行为,并从CNN中获取直观解释。关于更多详细信息,请参阅GitHub repo。
使用 AWS WAF 完整日志、Amazon Athena 以及 Amazon QuickSight 实现无服务器安全分析
您可以在Amazon S3存储桶上启用AWS WAF日志,并通过配置Amazon Kinesis Data Firehose对日志进行分析与流式传输。您可以通过数据流自动化,结合特定要求使用AWS Lambda进行多种数据转换操作,借此进一步增强这套解决方案。配合Amazon Athena与Amazon QuickSight,用户还可以轻松分析日志内容并为领导团队构建良好的可视化结果与仪表板。整套体系完全以无服务器架构运行,AWS将为您分担各类繁重的运营工作。
如何使用 Amazon Elasticsearch Service 分析 AWS WAF 日志
通过AWS WAF Web ACL 的访问日志,我们可以分析Web应用程序接收到的各类请求。在本文中,我们了解了如何使用Amazon Easticsearch Service作为AWS WAF日志的发送目的地,也讲解了如何搜索日志数据并以其为基础构建图形与仪表板。Amazon ES只是原生日志交付的可选目的地之一。
如何助力游戏应用抵御 DDoS 攻击威胁
在新游戏上线时,游戏厂商必须确保玩家顺畅访问并享受游戏体验,不受任何意外因素的干扰。因此,厂商首先需要思考如何保护游戏免受分布式拒绝服务(DDoS)攻击的影响。幸运的是,如果您在AWS上构建游戏,可以直接享受多种针对常见DDoS攻击的保护措施。本文将探讨AWS提供的架构保护选项,帮助大家充分利用各项安全功能。
在 EMR 6.0.0 上利用 Hive LLAP 实现 Apache Hive 性能倍增
本文介绍了与原有Amazon EMR 5.29版本相比,在Amazon EMR 6.0.0上运行Hive所带来的性能改进。性能的显著提升有助于减少查询运行时间与执行成本。此外,我们还了解到如何将Hive LLAP与Amazon EMR 6.0.0配合使用、如何进行具体配置、如何使用LLAP监控器查看状态与指标,以及如何通过启用Hive LLAP实现进一步性能提升。未来我们还将发布关于更多新功能的更新内容与在Amazon EMR上运行Apache Hive的后续改进消息,敬请期待!
Wind Mobility 公司如何构建无服务器数据架构
在Wind Mobility公司,我们一直将数据视为运营体系的最前沿。为此,我们需要保证数据基础设施拥有充分的灵活性,能够切实满足行业中不断变化的实际需求——这也是我们选择无服务器架构的根本原因。过去一年以来,我们构建起一套数据湖、一套数据仓库、一款商务智能套件以及多种生产级数据科学应用程序。所有这一切,都出自一支小型技术团队之手。
使用 Spark 与 Apache Arrow 同时训练多个机器学习模型
Spark是一套分布式计算框架,通过PyArrow实现了Pandas UDF等多项新功能。我们可以使用Spark的分布式与高级机器学习模型生命周期功能构建起具有大批量生产模型的规模化产品。