发布于: Apr 3, 2023

SageMaker Canvas 现在支持超过 45 个可用于无代码机器学习的数据来源,包括 Amazon Athena 和第三方 SaaS 应用程序,例如 Snowflake、Salesforce 和 SAP OData。Canvas 是一个点击式界面,使分析师无需具备任何机器学习经验或编写任何代码即可生成机器学习预测。

数据摄取是机器学习中的核心步骤,通过向算法提供高质量数据来对问题进行准确建模。SaaS 应用程序的激增导致数据在系统间扩散,使数据采集变得复杂而耗时。以前,客户必须从所需的 SaaS 应用程序检索数据并将其传输到支持 Canvas 的来源(Amazon S3、Amazon Redshift、Snowflake 或本地磁盘),才能用于无代码机器学习。此过程的手动性质通常会导致宝贵的数据被遗漏在机器学习旅程之外。

现在,Canvas 通过支持从超过 45 个来源摄取数据,使客户能够利用存储在不同来源中的数据。我们使用了 Amazon AppFlow,该服务让客户能够安全地将数据传输到 S3 等 AWS 服务。传输后,您可以在 Canvas 中访问您的数据,即浏览表、跨不同来源联接数据表、预览数据以及编写 Athena 查询来导入正确的数据。导入数据后,您可以利用所有现有的 Canvas 功能,例如构建机器学习模型、查看可解释性数据或生成预测。

我们现已在推出 Canvas 的所有 AWS 区域提供对此功能的支持。要开始从超过 45 个来源导入数据,请参阅 Canvas 文档