亚马逊AWS官方博客

Tag: 使用指南

使用 Deep Graph Library 训练知识图谱嵌入

知识图谱嵌入KGE则为大家提供一种强大的方法,可以对特定节点上的语义与局部结构信息进行编码,您也可以将它们作为机器学习与深度学习模型的输入。DGL-KE支持多种流行嵌入模型,并能够让您通过CPU或GPU的大规模训练得到嵌入结果,训练速度是其他同类技术的2到5倍。

Read More

使用 TensorBoard 实现 TensorFlow 训练作业可视化

在本文中,展示了使用TensorBoard可视化TensorFlow训练作业,以Amazon S3作为日志存储。您可以使用这套解决方案以及对应的示例notebook,通过Amazon SageMaker构建和训练模型,并运行超参数调优作业。此外,您可以使用TensorBoard对不同训练作业中的超参数进行比较,生成并显示分类器混淆矩阵,剖析并可视化训练作业的性能。

Read More

使用 A/B 测试衡量 Amazon Personalize 推荐结果的有效性

A/B测试还能够提供客户与Amazon Personalize推荐结果间实际交互方式的宝贵信息。这些结果将根据明确定义的业务指标进行衡量,使您了解推荐结果的有效性,以及该如何进一步调整训练数据集建立起明确认知。在对此过程进行多轮迭代之后,您会发现各项重要指标都将得到改善,客户参与度也将随之提高。

Read More

在 AWS Control Tower 账户中启用 AWS IAM Access Analyzer

在本文中,我们演示了如何在整个AWS Control Tower组织中启用IAM访问分析器。我们展示了如何将IAM访问分析器的管理权限委派至AWS Control Tower审计账户,以及如何在所有区域中启用分析器。在组织层面实施IAM访问分析器,能够帮助大家快速确定哪些资源允许来自AWS Organization之外的访问,进而提高组织的整体安全性。

Read More

在 Amazon SageMaker Autopilot 推理管道中部署您的自有数据处理代码

在本文中,我们演示了如何使用您自己的数据处理代码构建起自定义Autopilot推理管道。我们首先训练出特征选择模型,而后使用经过训练的特征选择模型对原始数据进行转换。接下来,我们启动Amazon SageMaker Autopilot作业,针对我们的回归问题自动训练并优化出最佳机器学习模型。我们还构建起一套将特征选择与Autopilot模型加以结合的推理管道。

Read More

使用自定义词汇表与 Amazon Augmented AI,提升 Amazon Transcribe 的语音到文本转录效能

在本文中,我们介绍了如何使用Amazon A2I人工审核工作流与Amazon Transcribe自定义词汇表改善自动视频的转录效果。通过本轮演练,您可以快速识别出特定领域的术语,并使用这些术语构建自定义词汇表,以便后续更准确地对其他视频中的相同术语实现转录。对于SEO、针对性文本查询以及按技术术语对批量视频或音频文件进行分组等应用场景,这种对关键技术术语的正确转录都是一项至关重要的能力与前提性保证

Read More

在Amazon SageMaker中正确设计资源规划、避免非必要成本

本文向大家介绍了Amazon SageMaker的计费标准,根据机器学习项目内各个阶段正确调整Amazon SageMaker计算资源大小的最佳实践,以及如何通过自动停止闲置的按需notebook实例以避免产生非必要运营成本的具体方法。最后,我们还分享了如何自动检测Amazon SageMaker端点以保证不致发生误删情况。

Read More

在 Amazon SageMaker 管道模式下使用 Horovod 实现多 GPU 分布式训练

在Amazon SageMaker上以管道模式使用Horovod的多GPU或分布式训练方法,能够为数据集的各个分片创建独立的训练通道并在数据通道内访问对应分片,借此实现大规模模型训练。这种方式能够缩短在实际训练开始之前将数据集传输至训练实例所占用的时间,因此特别适用于具有大规模训练数据集的Amazon SageMaker训练场景。

Read More