亚马逊AWS官方博客

Tag: Amazon Translate

利用 AWS SageMaker BlazingText 对不均衡文本进行多分类

本文使用了 SageMaker BlazingText 实现了文本多分类。在样本不均衡问题上,使用了回译和 EDA 两个方法对少类别样本进行了过采样处理,其中回译方法调用了 AWS Translate 服务进行了翻译再翻译,而 EDA 方法主要使用同义词替换、随机插入、随机交换、随机删除对文本数据进行处理。 本文也使用了AWS SageMaker 的自动超参数优化来为 BlazingText 的文本分类算法找到最优超参数。

使用 Amazon Translate 以 Office Open XML 格式翻译文档、电子表格与演示文稿

在本文中,我们探讨了如何通过异步批量翻译对DOCX格式的文档进行翻译。关于翻译电子表格与演示文稿,其过程与翻译DOCX文件相同。AWS提供的翻译服务Amazon Translate使用简单,且您只需要根据翻译的每种格式的文档中的字符数(包含空格)进行付费。您现在可以在支持批量翻译的所有区域内翻译Office文档。如果您还不熟悉Amazon Translate,不妨先从Free Tier免费套餐起步。此套餐将从您提交的第一项翻译请求开始,在随后的12个月内每月提供2百万个字符的免费翻译配额。

Amazon Translate 现在支持 Office 文档

无论您的组织是一家在许多国家开展业务的跨国企业,还是一家渴望在全球获得成功的小型初创企业,将您的内容翻译成当地语言可能都是一个持久的挑战。实际上,文本数据通常有很多种格式,而处理它们可能需要多种不同的工具。而且,由于所有这些工具可能不支持相同的语言对,您可能必须将特定文档转换为中间格式,甚至是求助于人工翻译。所有这些问题都增加了额外的成本,并为构建一致、自动化的翻译工作流造成了不必要的复杂性。