亚马逊AWS官方博客

Tag: 以数据为中心的AI

Data-centric AI之数据集质量

数据集的质量再如何强调都不过分,我认为在数据这个领域,数据集的质量就是第一要务。对于机器学习来说,没有高质量的数据集作为前提,模型就学习不到有用的知识,也就是所谓的“垃圾进,垃圾出”。数据集的质量是个很大的话题,本文根据我在多个计算广告和推荐系统的项目中的实战经验尝试总结一下,其实对于结构化数据建模来说,基本上下面谈到的内容都是通用的。

Data-centric AI之特征工程(第三讲)

这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。

Data-centric AI之特征工程(第二讲)

这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。

Data-centric AI之特征工程(第一讲)

这两年我们观察到越来越多的算法工程师重视数据的特征工程,AI业界大佬吴恩达教授在2021年提出了从model-centric AI切换到data-centric AI的论调,我个人认为data-centric AI的三个核心就是特征工程,样本工程和数据集质量(本系列文章将围绕这三个核心来介绍)。