亚马逊AWS官方博客
基于无服务架构 Glue Data Quality 提升 ETL 流程中的数据质量
随着数据分析业务的发展,用户对在数据分析时,ETL 流程中的数据质量越来越关注。数据质量保障数据分析时保证数据价值的重要前提。越来越多的用户希望能通过自动化的方式,以及适合的工具来解决。本文主要介绍如何在 AWS Glue 中实现数据质量评估。
海纳百川:基于 Redshift Streaming Ingestion 实现日志实时入仓
本文介绍如何使用 Redshift Streaming Ingestion 及 fluent bit 实现日志实时入仓。
新一代云数仓 Databend Cloud 在亚马逊云上的架构实践
Databend Cloud 是一款完全面向云架构设计的新一代云数仓,基于开源的 Databend 发展而来。Databend Cloud 将廉价的云存储作为主要存储,并提供快捷高效的分析性能,已帮助很多客户实现了数仓、行为日志等场景的降本增效,并广受好评。
RDS/Aurora MySQL 的大表操作和管理最佳实践之大表 DDL
大表操作和管理的最佳实践系列博客主要想结合个人经验以及客户支持过程中在大表的 DDL、大表的 Delete、大表的归档这 3 个常见的日常操作给出切合实际的最佳操作实践。本篇博客主要介绍 RDS/Aurora 的 MySQL 引擎相关的大表 DDL 操作。
如何使用 Amazon EMR on Amazon EKS 构建可靠、高效、用户友好的 Spark 平台
介绍如何在 Amazon EKS 上构建安全、高效和易于使用的 Spark 平台,以支持数据科学家和分析师
使用 Transformer 和 Amazon OpenSearch Service 构建基于列的语义搜索引擎
介绍了如何使用 Transformers 和 Amazon OpenSearch Service 构建基于表格列的语义搜索引擎
使用 Amazon Redshift Serverless 和 Toucan 构建数据故事应用程序
介绍如何使用 Amazon Redshift Serverless 和 Toucan 构建数据讲述应用程序
Wiz 如何使用 Amazon Elasticache 提高性能和降低成本
介绍如何使用 Amazon ElastiCache 提高应用程序的性能并降低成本
如何基于 AWS 打造高性能的 SQL 向量数据库 MyScale
MyScale 是一款完全托管于 AWS,支持 SQL 的高效向量数据库。MyScale 的优势在于,它在提供与专用向量数据库相匹敌甚至优于的性能的同时,还支持完整的 SQL 语法。在这篇文章中,我们将阐述 MyScale 是如何借助 AWS 的基础设施,构建出一个稳定且高效的云数据库。
通过 SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用
本文介绍了如何使用 SageMaker JumpStart 部署 Llama 2 模型,结合 Gradio 轻松构建生成式 AI 聊天助手。