亚马逊AWS官方博客
Amazon EMR 上 Apache Hudi 0.9.0 提供的新功能
本博文介绍了Amazon EMR 支持新的Apache Hudi 0.9.0
将 Microsoft Azure SQL 数据库迁移到 Amazon Aurora MySQL 兼容版
本博文介绍了如何快速、安全地自动从 Microsoft Azure SQL 数据库迁移到 Amazon Aurora MySQL 兼容版,并最大限度地减少依赖 Microsoft Azure SQL 数据库的应用程序的停机时间。
从 Amazon EMR 和 AWS Glue 访问 Amazon S3 中数据的性能优化最佳实践
这篇文章介绍了使用 Amazon EMR 和 Amazon Glue 分析 Amazon S3 中数据时,实现所需性能扩展的最佳实践。我们重点强调了在 Amazon EMR 和 AWS Glue Spark 作业上针对 Apache Spark 进行优化。
使用 Amazon Glue、Amazon Neptune 和 Spline 为数据湖构建数据沿袭
随着数据环境复杂性的增加,客户在以经济高效且一致的方式捕获沿袭时,面临着巨大的可管理性挑战。在这篇文章中,我们将向您介绍为数据湖构建端到端的自动化数据沿袭解决方案的三个步骤:沿袭捕获、建模和存储,最后是可视化。
Amazon Redshift 继续保持在性价比方面的领先地位
这篇文章详细介绍了我们通过 Amazon Redshift 机群的遥测数据发现的分析工作负载趋势,我们为提高 Amazon Redshift 性价比而推出的新功能,以及通过源自 TPC-DS 和 TPC-H 的最新基准测试获得的结果,这些结果有力地支持了我们的领先地位。
IoT 数据摄入和可视化的 7 种模式 – 如何确定最适合您使用场景的模式
无论您是刚刚开始物联网(IoT)之旅,还是已经拥有数百万台互联的 IoT 设备,您可能都在寻求方法以最大限度地利用从 IoT 数据中提取的价值。IoT 设备数据所报告的遥测数据、元数据、状态以及命令和响应中包含了丰富的信息。但是,要想获得尽可能提升运营效率和交付业务成果所需的洞察,拥有正确的报告和可视化解决方案是关键所在。
Data-centric AI之特征工程(第一讲)
这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。
利用QuickSight和AWS serverless服务创建跨账号的支持案例面板
对于任何一个客户或合作伙伴来说,集中查看所有用户打开的案例并了解其情况是很有价值的,能帮助他们方便的参考当前案例和过往案例的概况,同时也易于与组织内的其他人分享案例中的经验教训以提高生产力,而AWS的合作伙伴可以利用面板的观察,准确掌控案例开启和处理的状况来提高案例的处理质量。
Kylin 4 集成 Amazon Glue Catalog!
Kylin 4 集成 Amazon Glue Catalog
带你SSH到Amazon SageMaker 训练实例一探究竟
带你SSH到Amazon SageMaker 训练实例一探究竟