亚马逊AWS官方博客
Tag: 机器学习
推荐系统系列之推荐系统概览(上)
在当今信息化高速发展的时代,推荐系统是一个热门的话题和技术领域,一些云厂商也提供了推荐系统的SaaS服务比如亚马逊云科技的Amazon Personalize来解决客户从无到有迅速构建推荐系统的痛点和难点。在我们的日常生活中,推荐系统随处可见,我根据这几年参与的推荐系统和计算广告项目总结了一些实践经验并以推荐系统系列文章的形式分享给大家,希望大家看后对推荐系统有更全新更深刻的理解。
Data-centric AI之数据集质量
数据集的质量再如何强调都不过分,我认为在数据这个领域,数据集的质量就是第一要务。对于机器学习来说,没有高质量的数据集作为前提,模型就学习不到有用的知识,也就是所谓的“垃圾进,垃圾出”。数据集的质量是个很大的话题,本文根据我在多个计算广告和推荐系统的项目中的实战经验尝试总结一下,其实对于结构化数据建模来说,基本上下面谈到的内容都是通用的。
在Amazon SageMaker上进行XGBoost分布式训练
本文介绍了如何使用SageMaker内置的XGBoost算法进行分布式训练的最佳实践以及需要关注的一些问题。
Data-centric AI之样本工程
样本工程会涉及到建模思路的梳理,它不像特征工程那样还有一些典型的方法论,它更加艺术,更像是一种思维旅行,是一个需要反复进行脑中走查的过程。
Data-centric AI之特征工程(第三讲)
这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。
Data-centric AI之特征工程(第二讲)
这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。
Data-centric AI之特征工程(第一讲)
这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。
LightGBM 算法框架运行在Amazon Sagemaker
本文将介绍如何使用lightgbm以及如何借助Amazon Sagemaker来提高使用lightgbm的机器学习效率
手把手教程|构建无服务器通用文本识别功能
在这篇文章中,我们将结合实际操作,手把手带您部署并使用基于无服务器架构的通用文本识别解决方案,利用基于海量数据预先训练的机器学习模型与完整的开发测试实例,让您的应用在云上轻松享有通用场景下的图像文本识别功能。
在中国区使用 Amazon IoT 和 Amazon SageMaker 进行设备实时预测性维护
物联网(IoT)的一个典型应用场景是能够从传感器数据中获取上下文洞察力,例如分析设备异常或者进行预测性维护,及时给予用户通知。在本文中,我们将专注于通过设备多项指标对设备进行预测性维护,利用机器学习算法,对设备运行状态进行预测,提前发现可能出现的异常,及时进行维护,避免出现严重的生产事故。