亚马逊AWS官方博客

AWS 每周综述 — AWS Glue 中的 Amazon Q、Amazon PartyRock Hackathon、CDK Migrate 等 — 2024 年 2 月 5 日

在 AWS re:Invent 2023 大会上，有关生成式人工智能的所有新闻发布后，我决定深入研究这项技 […]

在 2023 年 Gartner 战略云平台服务魔力象限中，AWS 连续第 13 年被评为领导者

2023 年 12 月 4 日，AWS 被评为 2023 年战略云平台服务（SCPS）魔力象限的领导者。A […]

活用 CloudWatch 创建监控、告警为业务保驾护航

当谈及业务连续性时，监控与告警功能在云计算环境中扮演着不可或缺的角色。随着企业在云端部署的增加，对于系统和应用程序的稳定性、性能以及安全性的需求也变得日益重要。监控的核心在于实时追踪和评估系统的健康状态和运行情况，这对于识别潜在问题、预测性能瓶颈以及防范可能的故障至关重要。而告警则是监控的补充，它通过设定阈值或规则，一旦系统状态异常或超出预期范围，即时通知相关人员或团队，使其能够及时采取行动以避免或最小化潜在的影响。

使用 AWS Trainium 加速芯片进行 Llama 2 继续预训练

本文介绍了如何使用亚马逊云科技的 Trainium 芯片对 Llama 2 大型语言模型进行继续预训练。通过与亚马逊云科技合作，通联数据在自有数据上对 Llama2 进行了预训练，取得了良好效果。本文详细描述了使用 AWS ParallelCluster 集群进行训练的步骤，包括集群准备、模型转换、数据处理、训练脚本修改和任务提交等。同时，提供了训练过程中可能遇到问题的定位方法。

使用自然语言的 AWS Glue 全新聊天体验 — AWS Glue 中的 Amazon Q 数据集成（预览版）

今天，我们将抢先感受 AWS Glue 的全新聊天体验，它支持您使用自然语言来编写数据集成作业并对其进行故 […]

AWS 一周综述 — Amazon API Gateway、AWS Step Functions、Amazon ECS、Amazon EKS、Amazon LightSail、Amazon VPC 等 — 2024 年 1 月 29 日

本周，我们的服务团队继续为您开拓创新，并且 Amazon Web Services（AWS）领域惊喜不断。 […]

利用 S3 Connector for Pytorch 在训练代码中实现 S3 的流式读取

在最近的亚马逊云科技 re:Invent 大会上发布的新功能——Amazon S3 Connector for PyTorch 为我们提供了一种利用在 PyTorch 代码中直接流式读取 S3 文件的能力。本文将深入探讨 S3 Connector for PyTorch 的使用方法，旨在帮助用户快速理解并运用这一工具，以优化他们的模型训练流程。

基于大语言模型知识问答应用落地实践 – 使用 TruLens 做自动化 RAG 项目评估测试

我们【基于大语言模型知识问答应用落地实践】系列博客前 4 篇已经介绍了知识库构建和召回调优方面的实践经验，随着 RAG 项目的逐渐丰富和成熟，越来越多的工作会深入到各种细节的打磨，例如 Prompt 模板调优，更换更新的模型，各类阈值或者参数的调整等。本篇将介绍如何用 TruLens 框架，一种简单的，系统化的方法来评估 LLM 应用的衡量性能和质量指标，做自动化 RAG 项目评估测试，以及跟踪每次迭代后指标的改善情况。

莉莉丝《远光 84》项目组在 GenAI 的技术实践

远光 84 项目组以开放的胸怀拥抱 GenAI，采用小步快跑的方式，在多个业务场景中，通过 Amazon Bedrock + Claude2 的方案，快速验证并落地多个 GenAI 应用，积累丰富经验。

合纵连横 – 以 Amazon Flink 和 Amazon MSK 构建 Amazon DocumentDB 之间的实时数据同步

以 Amazon Flink 和 Amazon MSK 构建 Amazon DocumentDB 之间的实时数据同步，介绍 Zero-ETL，DMS 和 Flink 三种数据同步方案，演示如何基于 Flink 和 Kafka 实现跨区域 DocumentDB 的数据同步，并测试了高可用和性能。