sagemaker | 亚马逊AWS官方博客

利用 AWS SageMaker BlazingText 对不均衡文本进行多分类

本文使用了 SageMaker BlazingText 实现了文本多分类。在样本不均衡问题上，使用了回译和 EDA 两个方法对少类别样本进行了过采样处理，其中回译方法调用了 AWS Translate 服务进行了翻译再翻译，而 EDA 方法主要使用同义词替换、随机插入、随机交换、随机删除对文本数据进行处理。本文也使用了AWS SageMaker 的自动超参数优化来为 BlazingText 的文本分类算法找到最优超参数。

在 Amazon SageMaker Service 中使用 R 绘制统计过程控制图（SPC）实现流程稳定性预警

在实际的运营场景中，我们可以通过统计过程控制图（SPC：Statistical Process Control Chart）监控运营过程的稳定性，对过程存在的异常因素进行预警，以实现故障减少，用户体验提升和运营成本降低的目的。本文将介绍如何在Amazon SageMaker Service中，通过R语言来绘制统计过程控制图，从而可视化监控运营过程数据。

机器学习为数字化转型插上翅膀

优秀的企业正在快速创建数字化服务体系，通过向云迁移，敏捷地实现创新转型，以加速业务发展和提高客户满意度。机器学习无疑是其中一项关键技术，它开始被广泛应用于各行业各类型的企业系统应用中，帮助企业增强客户体验，改善运营决策，提供创新的产品和服务。

使用 Amazon EMR、Amazon SageMaker 和 AWS Service Catalog 设置 Intuit 数据湖

我们将讨论在较高层面构建 Intuit 数据湖所包含的技术和过程，包括设置账户和资源所使用的整体结构与自动化等。请关注我们这个空间的未来动态，阅读由其他合作构建 Intuit 数据湖的团队和工程师发布的关于该系统特定方面的更详细博文。

Amazon Sagemaker 与 NVIDIA Jetson 平台结合打造智能边缘

随着物联网和 AI 芯片的发展，未来将会有越来越多的数据在边缘侧处理。很多业务场景已经对边缘智能提出了明确的需求，本篇将介绍使用 Amazon SageMaker 和 Nvidia Jetson 使用云 +端结合的方式打造一个边缘推理的方案

轻松构建 PyTorch 生成对抗网络(GAN)

本文将引领读者，从工程实践角度出发，借助 AWS 机器学习相关云计算服务，基于 PyTorch 机器学习框架，构建第一个生成对抗网络，开启全新的、有趣的机器学习和人工智能体验。

使用 Amazon SageMaker 通过自定义数据集训练模型

对于刚上手机器学习的从业人员而言，业务需求所需要呈现的结果，往往不仅是用公开数据集就能够训练出合适的模型。我们往往只有少量的业务相关数据，甚至这些数据也需要从零开始收集整合，而这之后还需要进行数据清洗、数据打标签、特定数据格式转化等复杂的制作特定数据集的步骤，这些工作会阻塞住我们前进的脚步。除了容易在数据集上举步不前外，对于所需要数据量的误解也是另外一大阻碍因素。我们总认为进行机器学习需要“大量”的数据，究竟需要多少数据？在仅有少量数据时就不能训练出准确率较高的模型？本文试图从零开始，从制作自己的数据集开始，来探讨上面提出的问题。

亚马逊AWS官方博客

Tag: sagemaker