亚马逊AWS官方博客

Amazon Polly 增加 9 个 AWS 区域、Korean 语音支持和新的印度英语语音

Amazon Polly 是一种可将文本转换为逼真语音的 AWS 服务。今天,我们非常激动地宣布 Amazon Polly 的可用区域又增加了九个,现在 Polly 可用区域的总数已增加到 14 个。我们还非常激动地宣布推出韩语支持,并且我们向文本转语音产品组合中新增了印度英语语音。我们很高兴地推出了新的韩语女声 Seoyeon 和新的印度英语女声 Aditi。 Amazon Polly 现已在以下 14 个 AWS 区域推出,致力于为全球所有客户带来最高稳定性和最低延迟:亚太地区 (孟买)、亚太地区 (首尔)、亚太地区 (新加坡)、亚太地区 (悉尼)、亚太地区 (东京)、加拿大 (中部)、欧洲 (法兰克福)、欧洲 (爱尔兰)、欧洲 (伦敦)、南美洲 (圣保罗)、美国东部 (弗吉尼亚北部)、美国东部 (俄亥俄)、美国西部 (加利福尼亚北部) 和美国西部 (俄勒冈)。 自从 Amazon Polly 在 2016 年 re:Invent 大会上推出后,我们收到的其中一个最常见的要求是提供更多语言支持。在客户请求的众多语言中,韩语是请求频率最高的语言之一。为了响应客户的需求,我们非常高兴地宣布推出第一套韩语语音 Seoyeon。

Read More

AWS Glue 全托管 ETL 服务使用指南

作者:蒋华, AWS合作伙伴解决方案架构师 目  录 第1章 Glue概述 1.1 Glue介绍 1.2 Glue主要特征 1.3 Glue定价与计费 第2章 Glue入门 2.1 数据准备 2.2 在线演示 2.2.1 增加IAM Role 2.2.2 配置Data Catalog 第1章  Glue概述 1.1  Glue介绍 AWS Glue 是一项完全托管的提取、转换和加载 (ETL) 服务,让客户能够轻松准备和加载数据进行分析。您只需在 AWS 管理控制台中单击几次,即可创建并运行 ETL 作业。您只需将 AWS Glue 指向存储在 AWS 上的数据,AWS Glue 便会发现您的数据,并将关联的元数据 (例如表定义和架构) 存储在 AWS Glue 数据目录中。存入目录后,您的数据可立即供 ETL 搜索、查询和使用。AWS Glue 可生成代码执行数据转换和数据加载流程。 AWS Glue […]

Read More

《制作无人驾驶车辆》第 3 部分:连接您的无人驾驶车辆

在我们无人驾驶车辆系列的第一篇博客文章中,您制作了一辆 Donkey 车并将导航服务器部署到 Amazon EC2 实例上。在第二篇博客文章中,您学习了如何驾驶 Donkey 车辆,Donkey 车辆也学习了如何自行驾驶。在这篇博客文章中,我们将介绍将 Donkey 车辆的遥测数据流式传输到 AWS 的过程。all我们将使用 AWS IoT 服务,因为该服务提供了一组可扩展、可靠并且功能丰富的服务,这些服务可用于所有种类的互连设备,包括我们的互联车辆。 1) 在 AWS 上制造一辆无人驾驶车辆,并参加 re:Invent 机器人车拉力赛 2) 《制作无人驾驶车辆》第 2 部分:驾驶您的车辆 3) 《制作无人驾驶车辆》第 3 部分:连接您的无人驾驶车辆 4) 即将推出 AWS IoT 设置 无人驾驶车辆在驾驶过程中会生成持续的遥测数据流。车辆不在驾驶状态时,没有遥测数据可收集,所以我们不希望耗用任何资源,避免浪费。为适应工作负载的变化,我们计划依靠无服务器技术为整个架构提供支持。首先,我们将使用 AWS IoT 设计一项车队监控服务。它可以使用同一基础架构为任意数量的车辆提供服务。下图显示了该车队监控服务的架构。 此解决方案的组件按逻辑功能 (和 AWS 服务) 进行颜色编码,以展示解决方案每个组件的安全性、可扩展性和完全基于使用量的特点。这种运营模型适合很多业务模式,对任何规模的客户都有用。无论是要跟踪和比较圈速的无人驾驶车辆业余爱好者,还是希望开发其自己的互联车辆平台的无人驾驶汽车制造商,都可以使用 AWS IoT 提供的安全、可扩展且基于使用量的成本结构。 此解决方案以 Donkey 车辆 (绿色阴影所示) 开始。接下来数据通过 IoT 服务传递到粉色部分,在 DynamoDB 中进行短期存储,然后传递到蓝色部分,在 S3 中长期存储。此外,AWS […]

Read More

使用新的声道 SSML 功能修改 Amazon Polly 语音的音品

今天,Amazon Polly 团队很高兴地宣布推出一项新的语音合成标记语言 (SSML) 功能,该功能使得开发人员可以修改任意文本到语音转换 (TTS) 声音的音品。这是一项极具吸引力的功能,适合希望在 Amazon Polly 产品组合中自定义现有语音的客户,使得声音更加贴近在其使用案例中所塑造的特定角色。客户在场景中需要使用多个不同的声音时,该功能尤为有用,因为音品功能使得客户可以轻松地从可用的各个 Amazon Polly 语音自定义多个声音形象。 什么是音品? 音品 描述了人们所感受到的音色或音质,这与音高或音量无关。它经常用于音乐中,例如用于区分铜管乐器和弦乐器,或者用于描述中提琴与小提琴的细微差别。音品是一种可用于区分各种乐器的感知属性,即使这些乐器都在以相同的音量演奏相同的调子。与此类似,在具体的语音场景中,音品是一个声音与另一个声音的区别,即使这些声音具有相同的音高 (即其基本频率) 和音量 (振幅)。 每个人的声音都是独一无二的,这是由于多种因素造成的,包括人的生理机能以及发出声音的方式。每个人的声带、声道的大小和形状甚至整个身体的大小和形状,在决定其正常的语音品质方面都起到了重要的作用。有一些方法,例如个人控制舌头的位置、收紧或松弛肌肉或者施加气压,都可以改变语音的音高、音量和音品。经过专业训练的演员可以学习控制这些动作,甚至能够改变自己的声音来模仿他人的声音。 声道与音高 影响到语音音品的一项重要生理特征是声道,这是从声带顶部直到嘴唇边缘的一个空气腔体。有多块肌肉可以用于改变声道腔体的形状,可以让它变长、变短、变宽或变窄。这些改变的效果是导致放大或过滤掉语音。 音高 是一项听觉属性,影响感受到的声音是高还是低。在发出语音的具体过程中,音高由声带振动的频率决定。相比男性,女性通常具有较短的声带,振动频率较高 (每秒约 180 到 200 个周期)。平均而言,男性具有较长的声带,振动更慢 (每秒约 110 个周期)。与此类似,女性的平均声道长度比男性要短 (分别为约 14 厘米与约 17 厘米)。 声带长度和声道长度具有内在的关联,也就是说,其中一个更长,另一个也倾向于随之更长。利用音品功能,开发人员可以在保留控制音高能力的同时更改声道的大小。 声道和语音合成 使用 vocal-tract-length SSML 标记,您可以通过更改发言者的声道来控制输入语音的音品。这听上去像是更改了发言者的身体大小。当您增加 vocal-tract-length 时,发言者的声音听上去像是他们的个子更大。减小时,听上去像是个子更小。此标记可用于 Amazon Polly 文本到语音转换产品组合中的任何语音。 下面说明了如何修改发言者声道的长度: +n% 或 -n%:按当前语音的相对百分比进行更改,来调整声道长度。例如,+4% 或 -2%。 n%:按当前语音的绝对百分比值来调整声道长度。例如,104% 或 […]

Read More

Amazon ElastiCache 更新 – 在线调整 Redis 集群大小

使用 Amazon ElastiCache,您可以轻松设置快速的内存数据存储和缓存。由于支持两款最流行的开源产品 (Redis 和 Memcached),ElastiCache 能够满足游戏排行榜、内存分析和大规模消息收发的严格要求。 今天,我准备为大家介绍 Amazon ElastiCache for Redis 的一项重要补充。您已经可以创建拥有多达 15 个分片的集群,每个分片负责为一组特定的槽存储键和值 (每个集群拥有整整 16,384 个槽)。一个集群可扩展至存储 3.55 TB 的内存数据,同时每秒支持多达 2,000 万次读取和 450 万次写入。 现在可以在线调整大小 您现在可以调整正在运行的 ElastiCache for Redis 集群中的分片数量,而该集群仍可保持在线状态并响应请求。这样一来,您便可对流量和数据量的变更作出反应,而无需使集群脱机或从空缓存开始。您也可以重新平衡正在运行的集群,以便均匀地重新分配槽空间,而不更改分片数量。 启动重新分片或重新平衡操作时,ElastiCache for Redis 首先会准备一个计划,确保槽在集群的分片中均匀分配。然后,它在分片之间转移槽,并行移动许多槽以提高效率。这都是在集群继续响应请求期间发生,对写入移动中的槽时的写入吞吐量的影响较小。迁移率取决于实例类型、网络速度、槽的读/写流量,通常约为 1 GB/分钟。 重新分片和重新平衡操作适用于在启用集群模式的情况下创建的 Redis 集群: 对集群重新分片 通常,当开始面临巨大的内存压力或各个节点日益成为瓶颈时,您就知道是时候通过重新分片来扩展集群了。您可以观察集群的 CloudWatch 指标以识别每种情况: Memory Pressure – 可用内存、交换分区使用情况、用于缓存项目的字节数。 CPU Bottleneck – CPU 利用率、当前连接、新连接。 Network Bottleneck […]

Read More

Matrix Analytics 在 AWS 上使用深度学习来改善早期癌症检测

Matrix Analytics 致力于帮助拯救生命。这家位于科罗拉多州的创业公司使用 Amazon Web Services (AWS) 上的深度学习,跟踪诊断患有肺结节的患者的疾病发展情况。虽然肺结节通常为良性,但是密切监视并采取后续治疗,对于确诊结节是否会转变以及何时转变为恶性肿瘤非常关键。 公司创始人 Aki Alzubaidi 博士最初就职于 Glenwood Springs 医院,他发现有些患者由于未进行检查而情况恶化。用于跟踪患者的系统非常繁琐且杂乱,使得许多患者未能接受推荐的后续治疗,造成了本可避免的不良后果。 预测癌症风险和管理医疗 该公司的旗舰软件应用程序 LungDirect 使用双管齐下的方法进行早期癌症介入治疗:预测恶性肿瘤风险和自动化后续治疗。 首先,采用深度学习算法构建的先进计算机成像功能根据下列因素评估肺结节的恶性肿瘤风险:结节大小、形状、密度、体积以及患者个人情况,例如烟龄、年龄、性别和种族。“我们希望能够获取所有的临床信息,例如放射科测试、实验室测试或个人临床病理因素,然后获得病情发展的可能性,在实用工具上提供结果并管理接下来的步骤,这就是我们采用深度学习的目标,”Alzubaidi 博士说到。 为了发现可能隐藏在数据之下的不同非线性关系类别,采用了五种不同的机器学习模型类别。使用一组计算机成像算法,直接从图像中自动提取四种不同的特征类别。 开发一种工具,来“不可思议地自动”读取患者扫描图像来预测和诊断癌症,这不是一件易事。不过,Matrix Analytics 非常快地开发出了验证概念的原型。然后,该公司实施深度学习模型并与现有文献中的基准进行比较。

Read More

Apache MXNet 版本 0.12 扩展了 Gluon 功能以支持前沿的研究

上周,Apache MXNet 社区发布了 MXNet 版本 0.12。主要功能是支持 NVIDIA Volta GPU 和 sparse tensor。该版本还包括一些新的 Gluon 编程接口功能。特别是,可以通过这些功能在您的深度学习模型中轻松开展前沿的研究: 变分丢弃;可用于有效地应用丢弃技术以减轻递归神经网络 (RNN) 中的过拟合问题 卷积 RNN、长短期记忆 (LSTM) 和门控循环单元 (GRU) 单元;可用于对具有基于时间的序列和空间维度的数据集进行建模 七个新的损失函数、导出功能和训练器函数增强功能 变分丢弃 (VariationalDropoutCell) 根据最新的研究提供一种新的工具以减轻 RNN 中的过拟合问题。本文参考了“A Theoretically Grounded Application of Recurrent Neural Networks”和“RNNDrop: A Novel Approach for RNNs in ASR”。过拟合是一种建模错误,其中拟合的模型与训练数据集非常接近,以至于在查看新数据或测试数据集时,将会降低其预测精度。丢弃是一种建模技术,它随机地将模型参数归零,以便模型在训练过程中不会过度依赖于任何单个输入或参数。不过,这种技术尚未成功应用于 RNN。迄今为止的研究侧重于仅将丢弃完全随机地应用于输入和输出,即,在 RNN 的所有时间步长中将其归零。变分丢弃消除了这种涵盖所有时间步长的随机性,并在每个时间步长将相同的随机丢弃数组 (或掩码) 应用于 RNN 的输入、输出和隐藏状态。

Read More

新增 – 适用于 AWS 服务的 AWS PrivateLink:在您的 VPC 中的 Kinesis、Service Catalog、EC2 Systems Manager、Amazon EC2 API 和 ELB API

这篇客座文章是由 Amazon Virtual Private Cloud 高级工程师 Colm MacCárthaigh 撰写的。 自 2015 年推出 VPC 终端节点以来,创建终端节点已成为从 Amazon Virtual Private Cloud (VPC) 中安全地访问 S3 和 DynamoDB 的一种常见方法,而无需使用 Internet 网关、NAT 网关或防火墙代理。在使用 VPC 终端节点时,VPC 和 AWS 服务之间的路由是由 AWS 网络处理的,并且可以使用 IAM 策略控制对服务资源的访问。 今天,我们宣布推出 AWS PrivateLink,这是最新一代的 VPC 终端节点,旨在使客户以高度可用且可扩展的方式访问 AWS 服务,同时将所有流量保持在 AWS 网络内。现在,可以在您的 VPC 中使用 Kinesis、Service Catalog、Amazon EC2、EC2 Systems Manager (SSM) 和 Elastic […]

Read More

新增 Amazon S3 加密和安全功能

早在 2006 年,当我宣布 S3 时,我写道:“此外,每个块都受 ACL (访问控制列表) 的保护,从而允许开发人员根据需要保持数据私有、共享以供读取或共享以供读写。” 起点是那个具有私有存储桶和用于授予访问权限的 ACL 的初始模型,此后我们添加了对存储桶策略、服务器访问日志记录、版本控制、API 日志记录、跨区域复制以及多个客户端和服务器端加密选项的支持,所有这些都是为了给您提供所需的工具,保护您的数据,同时允许您根据需要与客户和合作伙伴共享数据。我们还加入了人工智能和机器学习作为演绎元素,并推出了 Amazon Macie,这一工具可帮助您发现、分类和保护海量的内容。 今天,我们将要向 S3 中添加五个新的加密和安全功能: 默认加密 – 现在,您可以强制存储桶中的所有对象都必须以加密形式保存,而不必构造一个拒绝未加密对象的存储桶策略。 权限检查 – S3 控制台现在在每个可公开访问的 S3 存储桶旁边显示一个显眼的指示器。 跨区域复制 ACL 覆盖 – 当您跨 AWS 账户复制对象时,您现在可以指定对象获取一个新的 ACL,以便对目标账户进行完全访问。 涉及 KMS 的跨区域复制 – 您现在可以复制使用由 AWS Key Management Service (KMS) 管理的密钥进行加密的对象。 详细清单报告 – S3 清单报告现在包括每个对象的加密状态。该报告本身也可以加密。 让我们了解一下每个功能… 默认加密 您的 S3 对象有三个服务器端加密选项:SSE-S3 (使用由 […]

Read More

现已推出 – Amazon EC2 的计算密集型 C5 实例

我很高兴地宣布,新的计算密集型 C5 实例今天在三个 AWS 区域推出,有六种大小规格! 这些实例专用于计算密集型应用程序,例如批处理、分布式分析、高性能计算 (HPC)、广告服务、高度可扩展的多人游戏和视频编码。新实例提供了比 C4 实例高 25% 的价格/性能改进,对于某些工作负载可超过 50%。它们还有额外的每 vCPU 内存,而且 (对于可以利用新 AVX-512 指令的代码) 对于向量和浮点工作负载有两倍的性能。 多年来,我们一直在不停地工作,为客户提供可能的最佳网络、存储和计算性能,长期专注于将许多类型的工作分流到由 AWS 设计和建造的专用硬件上。C5 实例类型包含了我们的最新一代硬件分流,另外还在添加一个与我们的硬件密不可分地一起运行的新管理程序方面又迈出了一大步。新的管理程序允许我们让您访问主机硬件提供的所有处理能力,同时也使性能更加一致,并进一步提高了安全性的门槛。我们将在 AWS re:Invent 分享很多关于它的技术细节。 新实例 C5 实例有六种大小: 实例名称 vCPU RAM EBS 带宽 网络带宽 c5.large 2 4 GiB 最高 2.25 Gbps 最高 10 Gbps c5.xlarge 4 8 GiB 最高 2.25 Gbps 最高 10 Gbps c5.2xlarge […]

Read More