发布于: Mar 23, 2021
今天,我们宣布推出 Hugging Face 与 Amazon SageMaker 的新集成,以帮助数据科学家们更快、更轻松地开发、训练和调优先进的自然语言 (NLP) 模型。
自然语言处理领域可推动一些使用案例,例如聊天机器人、情绪分析、问题解答以及搜索,在过去的几年间,这一领域经历了一场复兴。特别值得一提的是,转换器深度学习架构负责处理一些迄今最大的先进模型,例如 T5 和 GPT-3。不过,考虑到它们的规模,需要投入时间、资源和技能才能训练和优化 NLP 模型。自 2016 年以来,Hugging Face 已成为 NLP 社区的领导者,这要归功于它们的转换器库,这些库具有 7000 多种预先训练并使用 164 种语言的模型,使开发人员能够更轻松地开始他们的工作。转换器库已获得 41000 多个 GitHub 星星,被下载超过 2500 万次,这里实际上已成为开发人员和数据科学家们查找 NLP 模型的重地。
Hugging Face、AWS Deep Learning 容器 (DLC) 以及 Amazon SageMaker Python 软件开发工具包中的 Hugging Face 估算器进一步提高了易用性,这样,开发人员和数据科学家们就可以开始在 AWS 上使用 NLP。Hugging Face DLC 包含 Hugging Face 转换器、数据集以及针对 SageMaker 进行了优化的分词器库,以充分利用 SageMaker 分布式训练库,Hugging Face 估算器使开发人员和数据科学家们能够将 NLP 脚本作为 SageMaker 训练作业运行,并最大限度减少了额外的代码。Hugging Face 开发人员现在可以更轻松地在 Amazon SageMaker 上进行开发,并继承它的优势,包括成本效率、看看这些、生产准备和更高的安全性要求。