亚马逊AWS官方博客

Amazon Translate 简介 – 实时语言翻译

随着互联网的出现,世界变得越来越小。大量的信息可储存并在一眨眼的时间内在不同的文化和国家/地区之间传播,使我们能够相互学习和发展。为了使我们能够利用所有这些强大的知识和数据传输工具,我们必须先突破一些可能阻碍信息共享和交流的语言障碍。 除了使用多种语言之外,我们能够突破这些障碍的方法之一就是利用机器翻译和相关技术进行语言翻译。机器翻译技术起源于计算语言学研究领域,该领域重点在于使用软件将一种语言的文本或语音翻译为另一种语言的文本或语音。机器翻译的概念可以追溯到 1949 年,当时美国科学家和数学家 Warren Weaver 在洛克菲勒基金会的自然科学部的同事的要求下,创建了一份翻译备忘录来分享他的语言翻译理念。自那时起,我们通过使用神经网络来提高翻译方法的效率和质量,在机器语言翻译领域取得了很大的进展。因此,这个领域的技术进步给我们带来令人兴奋的新服务 (我今天要为您介绍),就一点也不奇怪了。 让我们欢迎:Amazon Translate 与我一起欢迎 Amazon Translate 服务加入 Amazon Web Service 系列。Amazon Translate 是一项高质量的神经机器翻译服务,该服务使用高级机器学习技术提供基于文本的内容的快速语言翻译,并支持开发提供多语言用户体验的应用程序。该服务当前为预览版,可在英语和受支持的语言之间翻译文本。 有了 Translate 服务,组织和企业现在能够通过让使用器使用自动化语言翻译以其首选语言访问网站、信息和资源,来更轻松地在其他区域扩展产品和服务。此外,客户可参与多玩家聊天、从使用器论坛收集信息、深入研究教育文件甚至可以获取有关酒店的评论,即使这些资源是用他们无法轻松理解的语言提供的也是如此。 如果您像我一样,您可能好奇 Amazon Translate 如何工作以提供高质量的机器语言翻译。Translate 在深度学习技术的基础上,使用神经网络来表示训练在语言对之间转换的模型。该模型包含一个编码器组件,此组件从源语言中读取句子并创建一个捕获所提供文本的含义的表示。该模型还包含一个解码器组件,此组件将用于将源语言的文本翻译为目标语言的语义表示公式化。此外,该服务使用注意机制从提供的源文本的每个单词构建上下文,以确定哪些单词适用于生成下一目标单词。深度学习中的注意机制的概念意味着,神经网络通过考虑源句子的完整上下文以及它之前生成的一切内容来关注源输入的相关上下文。此过程可帮助创建更准确且通顺的翻译。 Amazon Translate 可与其他 AWS 服务结合使用,来构建稳健的多语言体验或支持语言独立处理。例如,Translate 服务可与下面的一些服务结合使用: Amazon Polly:采用翻译后的文本,提供逼真的语音并允许创建发音的应用程序 Amazon S3:提供创建已翻译文档存储库的功能 AWS Elasticsearch:使用托管的 Elasticsearch 引擎创建多语言搜索 Amazon Lex:使用文本和语音构建翻译聊天机器人 AWS Lambda:支持动态网站内容的本地化 这些只是一些例子,有很多可通过将 Translate 与其他 AWS 服务配对来实现的解决方案。下面我们快速浏览控制台并试用该服务的预览版。 在登录控制台后,我看到许多有用的信息。我可以阅读详述 Amazon Translate 服务如何运行的信息 (包括有关该服务及其 API 的示例、指南和资源)。 […]

Read More

Amazon Transcribe – 大规模实现准确的语音转文本

今天,我们将发布 Amazon Transcribe 的非公开预览版,这是一种自动语音识别 (ASR) 服务,使开发人员可以轻松地为应用程序添加语音转文本功能。随着带宽和连接情况的不断改进,世界上越来越多的数据以视频和音频格式进行存储。人们创建和使用所有这类数据的速度比以往任何时候都快。对于企业来说,拥有从所有这些丰富的多媒体内容中获取价值的一些手段是非常重要的。利用 Amazon Transcribe,您可以通过高效且可扩展的 API 节省成本昂贵的手动转录过程。 您可以通过使用 API 启动一个任务来分析以许多常见格式 (WAV、MP3、Flac 等) 存储在 Amazon Simple Storage Service (S3) 上的音频文件。您将收到每个单词的带时间戳的详细准确的录音文本以及推断的标点符号。在预览过程中,您可以使用异步转录 API 来以英语或西班牙语转录语音。 很多公司正在寻求从其现有的目录及其传入数据中获取价值。通过转录这些存储的媒体,公司可以: 分析客户电话数据 自动创建副标题 基于内容确定广告目标 针对音频和视频内容存档启用丰富的搜索功能 您可以使用 AWS 命令行界面 (CLI)、AWS 软件开发工具包 或 Amazon Transcribe 控制台轻松启动转录任务。 Amazon Transcribe 目前提供 3 个 API 操作 (用途不言自明): StartTranscriptionJob GetTranscriptionJob ListTranscriptionJobs 以下是一个简单的 Python 脚本,用于启动一个任务并轮询,直到完成该任务: from __future__ import […]

Read More

Amazon Kinesis Video Streams – 适用于可视应用程序的无服务器视频提取和存储

手机、监控摄像机、婴儿监视器、无人机、网络摄像头、行车记录仪甚至卫星都可以产生高强度、高质量的视频流。家、办公室、工厂、城市、街道和高速公路现在都安装了大量的摄像机。它们将在洪水和其他自然灾害之后调查财产、提高公共安全,让您知道您的孩子安然无恙、通过连续的“失败”视频捕获一次性时刻 (个人爱好)、收集有助于识别和解决交通问题的数据等。 至少可以说,处理大量的视频数据是具有挑战性的。单个或几百万个传入流会突然到达。流包含宝贵的实时数据,无法延迟、暂停或搁置该数据以在更合适的时间处理。在您获得原始数据后,其他的挑战就会出现。可以想到的是存储和加密视频数据并为其编制索引。提取价值 – 深入探究内容、了解内容的含义并加快行动 – 是下一个重要步骤。 新的 Amazon Kinesis Video Streams 今天,我要向您介绍 Amazon Kinesis Video Streams,它是实时流式传输服务的 Amazon Kinesis 系列的最新成员。现在,您可以从数百万台摄像机设备中提取流视频 (或其他时间编码的数据),而不必设置或运行您自己的基础设施。Kinesis Video Streams 接受您的传入流、以加密形式持久存储这些流、创建基于时间的索引并支持创建可视应用程序。您可使用 Amazon Rekognition Video、MXNet、TensorFlow OpenCV 或您自己的自定义代码来处理传入流,这样做是为了支持我知道您将创造的出色的新机器人学、分析和使用器应用程序。 我们将为您管理所有基础设施。首先,您使用我们的创建器开发工具包 (设备端) 创建应用程序,然后通过选择的设备向我们发送视频。传入视频将通过安全的 TLS 连接到达,并在使用 AWS Key Management Service (KMS) 密钥加密后以时间索引形式存储。接下来,您通过视频流解析器库 (云端) 使用视频流并从中提取价值。 无论您从一台设备还是数百万台设备发送多少低分辨率或高分辨率的视频,Kinesis Video Streams 都将进行扩展以满足您的需求。我总是不厌其烦地说,您可以专注于您的应用程序和业务。Amazon Kinesis Video Streams 基于您熟悉的 AWS 部件而构建。它将视频存储在 S3 中以实现持久性和节省成本,使用 AWS […]

Read More

Amazon Comprehend – 不断受训的自然语言处理

多年前,我在美国马里兰大学的计算机科学图书馆里闲逛时找到一本名为《计算机不能做什么》(What Computers Can’t Do)的又脏又旧的书,旁边是其续本《计算机仍不能做什么》(What Computers Still Can’t Do)。第二本书更加厚,这让我意识到计算机科学是值得研究的领域。在准备撰写本文时,我找到了第一本书的归档副本并发现了一条有趣的言论: 由于人类对用自然语言编写的句子的使用和理解需要句子的上下文相关使用的隐性知识,因此,Turing 认为,使计算机了解和转换自然语言的唯一方式可能是对计算机进行编程以了解这个世界。 这个言论非常有先见之明,并且我想告诉您的是 Amazon Comprehend 这项新服务实际上知道 (并且非常乐意分享) 有关世界的许多知识! Amazon Comprehend 简介 Amazon Comprehend 将分析文本并告知您它找到的结果,从语言 (从南非荷兰语到约鲁巴语,这之间有 98 种以上的语言) 开始。它可识别不同类型的实体 (人、位置、品牌、产品等)、关键短语、情绪 (积极、消极、复杂或中性) 并从采用英语或西班牙语的所有文本中提取关键短语。最后,Comprehend 的主题建模服务可从大型文档集中提取主题以进行分析或基于主题的分组。 前 4 项函数 (语言检测、实体分类、情绪分析和关键短语提取) 专为交互使用而设计,可在几百毫秒内进行响应。主题提取适用于基于作业的模型,其响应与集合的大小成比例。 Comprehend 是一项不断受训的自然语言处理 (NLP) 服务。我们的工程师和数据科学家组成的团队将继续扩展和完善培训数据,旨在使服务的准确度更高且应用更广泛。 探究 Amazon Comprehend 您可使用控制台探究 Amazon Comprehend,然后构建利用 Comprehend API 的应用程序。我将使用我的有关 Direct Connect 的最新文章中的开头段落来练习 Amazon Comprehend API 资源管理器。我将文本粘贴到框中并单击 […]

Read More

新的 AWS IoT 设备管理

AWS IoT 和 AWS Greengrass 为您提供适用于您的 IoT 设备和应用程序的坚实基础和编程环境。 IoT 的性质意味着大规模设备部署通常包含在数百或数千个位置部署的数百万或甚至数千万台设备。在这样的规模下,不可能单独处理每台设备。您需要能够以批量、统一的方式设置、监控、更新以及最终停用设备,同时还保留适应不同的部署配置、设备型号等的灵活性。 新的 AWS IoT 设备管理 今天,我们将发布 AWS IoT 设备管理以帮助解决这一难题。它将帮助您完成设备生命周期中从生产到停用的每个阶段。以下是您将获得的内容: 装载 – 从原始生产状态的设备开始,您可以控制预置工作流程。您可以使用 IoT 设备管理模板,通过单击几下鼠标来快速装载整个设备组。这些模板可能包含有关设备证书和访问策略的信息。 组织 – 为了处理大量设备,AWS IoT 设备管理扩展了现有 IoT 设备注册表,并允许您创建设备组的层次模型以及基于层次设置策略。您可以深入到层次结构中查找各个设备。您还可以根据属性 (如设备类型或固件版本) 查询设备组。 监控 – 来自设备的遥测用于收集实时连接、身份验证和状态指标,这些指标将发布到 Amazon CloudWatch。您可以检查这些指标并找到异常值以便进一步调查。利用 IoT 设备管理,您可以为每个设备组配置日志级别,还可以发布注册表和任务的更改事件以用于监控目的。 远程管理 – AWS IoT 设备管理让您可以远程管理设备。您可以为这些设备推送新的软件和固件、重置工厂默认值、重启以及按照所需的速度设置批量更新。 探索 AWS IoT 设备管理 AWS IoT 设备管理控制台演示并指出如何访问该服务的每项功能: 我已经有大量设备 (压力计): 这些仪表是使用新的模板驱动的批量注册功能创建的。以下是我创建模板的方式: 这些仪表将分为不同的组 […]

Read More

推出 Amazon FreeRTOS – 使几十亿台设备能够安全地从云中受益

最近,我在 ReadWrite.com 上读到一篇标题为“IoT 设备的数量在成倍增长,2021 年将增长 200%”,虽然这篇文章提到了此增长给消费者和行业带来的好处,但文中的两个观点让我难以释怀。第一个是关于“研究人员警告说,IoT 技术的扩散将会带来大量新的挑战。对于最终用户和提供商来说,大规模的 IoT 部署特别麻烦。”的特定陈述。这句话不仅说得中肯,而且真正提出了在构建解决方案和部署这个令人兴奋的新技术领域时可能面临的一些挑战。文中让我感到担忧的第二个观点是安全问题数目可能会增加。 这篇文章让我开始思考,我们如何通过将低成本的、高效的微控制器与可轻松连接到云的安全操作系统结合使用来创建这些出色的 IoT 解决方案。幸运的是,我在一款由 AWS 提供的令人兴奋的、基于开放源的新产品中找到了答案,我很高兴今天能够向大家宣布这个消息。让我们欢迎 Amazon FreeRTOS 进入技术阶段。 Amazon FreeRTOS 是一个 IoT 微控制器操作系统,此操作系统简化了基于微控制器的边缘设备的开发、安全性、部署和维护。Amazon FreeRTOS 使用库扩展了 FreeRTOS 内核 (一种常用的实时操作系统),这些库支持本地和云连接、安全和无线更新 (即将推出)。 您会询问这款令人兴奋的新产品将带来哪些好处。好处如下: 轻松创建适用于低功率互联设备的解决方案:提供常见的操作系统 (OS) 和库,以便轻松地为设备开发常见 IoT 功能。例如,无线 (OTA) 更新 (即将推出) 和设备配置。 保护数据和设备连接:设备仅使用代码签名服务运行可信软件,Amazon FreeRTOS 使用 TLS 提供与 AWS 的安全连接以及在设备上安全存储密钥和敏感数据的功能。 广泛的生态系统:包含广泛的硬件和技术生态系统,使您能够选择各种合格的芯片集 (包括 Texas Instruments、Microchip、NXP Semiconductors 和 STMicroelectronics)。 云或本地连接:设备可直接连接到 AWS 云,也可以通过 AWS […]

Read More

正在准备阶段 – AWS IoT Device Defender – 保护您的 IoT 队列

在 IoT (物联网) 方面,规模有了一个全新的含义。去年,我有幸参观了一家大型工厂,厂内每平方米有一台环境传感器。这些环境传感器每秒将测量几次温度、湿度和空气纯度,并充当污染物的预警系统。我听说客户有兴趣部署数百万或数千万台支持 IoT 的消费设备。 按地理分布的方式部署强大耐用的设备后,管理安全挑战是至关重要的。不过,有限的本地计算能力和内存有时会限制使用加密和其他形式的数据保护的能力。 为了应对这些挑战并让我们的客户自信地大规模部署 IoT 设备,我们正在开发 IoT Device Defender。虽然细节可能在发布前有所改变,但 AWS IoT Device Defender 旨在提供以下好处: 持续审核 – AWS IoT Device Defender 监控与您的设备相关的策略以确保所需安全设置就绪。它将查找与最佳实践的偏离并支持自定义审核规则,以便您可检查特定于您的部署的条件。例如,您可检查受一台受损设备是否订阅了来自另一台设备的传感器数据。您可按计划运行审核或按需运行审核。 实时检测和提醒 – AWS IoT Device Defender 将查找可能来自受损设备的异常行为并快速告知您此情况。它通过监控类似设备的行为、寻找未经授权的访问尝试、连接模式的更改以及流量模式 (入站或出站) 的变化来做到这一点。 快速调查和缓解 – 如果您收到发生异常情况的提醒,AWS IoT Device Defender 将为您提供工具 (包括上下文信息) 来帮助您调查和缓解问题。设备信息、设备统计数据、诊断日志和以前的提醒都触手可及。您可选择重启设备、撤销其权限、将其重置为出厂默认值或推动安全修复。 保持关注 很快我将提供更多信息 (和实践文章),敬请保持关注! — Jeff;

Read More

介绍 AWS IoT Analytics:比以往任何时候都快地大规模交付 IoT Analytics

我非常喜欢的一个技术领域是物联网 (IoT)。甚至还是在我很小的时候,我就常常惹怒我的父母,因为我会将他们买的玩具拆开,想看看工具的工作原理以及我是否能够设法将玩具重新组装在一起。似乎我注定最终要从事充满艰难而且不断变化的技术领域的工作。因此,毫不奇怪,我现在真的非常喜欢学习和摆弄 IoT 设备和技术。这融合了我对开发和软件工程的喜爱以及我对电路、控制器以及电气工程学科的其他方面的好奇心;即使我算不上是一个电气工程师。 尽管有通过部署 IoT 设备和解决方案收集的各种信息,但老实说,我从未真正考虑过需要分析、搜索和处理这些数据,直到我遇到了一种异常情况,对于发生的异常,通过大量传感器数据进行搜索和查询的能力变得至关重要。当然,我清楚分析对于企业的重要性,它们有助于做出准确的决策和预测以推动组织的发展。但是我一开始并没有想到,使分析成为我的 IoT 解决方案的不可或缺的一部分是如此重要。是的,我及时吸取了教训,因为此 re:Invent 服务的发布使任何人均可以更轻松地处理和分析 IoT 信息和设备数据。 你好,AWS IoT Analytics!AWS IoT Analytics 是 AWS IoT 的一项完全托管服务,可提供对从您的 IoT 设备中收集的数据的高级数据分析。利用 AWS IoT Analytics 服务,您可以处理消息、收集和存储大量设备数据以及查询数据。此外,新的 AWS IoT Analytics 服务功能集成了用于可视化数据的 Amazon Quicksight,并通过与 Jupyter Notebooks 的集成引入了机器学习的功能。 AWS IoT Analytics 的优势 通过提供对预构建的分析功能的访问,帮助预测分析数据。 提供将来自服务的分析输出可视化的功能 提供清理数据的工具 可帮助识别收集的数据的模式 了解情况:IoT Analytics 概念 通道:存档未经处理的原始消息并收集来自 MQTT 主题的数据。 管道:使用来自通道的消息并允许消息处理。 活动:针对您的消息执行转换,包括筛选属性和调用 Lambda 函数高级处理。 […]

Read More

宣布推出 ONNX 1.0

今天,Amazon Web Services (AWS)、Facebook 和 Microsoft 很高兴宣布:开放神经网络交换 (ONNX) 格式已可用于生产环境。 ONNX 是深度学习模型的开放标准格式,实现深度学习框架 (如 Apache MXNet、Caffe2、Microsoft Cognitive 工具包和 PyTorch) 之间的互操作性。ONNX 1.0 使用户能够在框架之间移动深度学习模型,从而使其更容易投入生产。例如,开发人员可以使用 PyTorch 等框架构建复杂的计算机视觉模型,并使用 Microsoft Cognitive 工具包或 Apache MXNet 运行它们以进行推理。 自 9 月份 ONNX 首次发布以来,社区支持和参与的增长和发展势头都十分喜人。包括高通、华为和英特尔在内的众多硬件合作伙伴宣布,他们的硬件平台支持 ONNX 格式,使用户更容易在不同的硬件平台上运行模型。我们非常感谢那些为新功能提供代码和支持的贡献者社区。 我们将继续与 ONNX 合作伙伴和社区合作,共同发展 ONNX,确保开发人员获得最新的研究成果,以便将先进的模型集成到生产应用程序中。 相关公告 Facebook – 发布了 ONNX V1 Microsoft – 宣布推出 ONNX 1.0 – 适用于 AI 的开放生态系统 作者简介 […]

Read More

AWS 中国 (宁夏) 区域现已开放

今天,我们推出全球第 17 个、中国第二个区域。由宁夏西云数据科技有限公司 (NWCD) 运营的 AWS 中国 (宁夏) 区域现已正式推出,为客户提供了在中国 AWS 上运行应用程序和存储数据的另一种选择。 详细信息 由 NWCD 运营的全新中国 (宁夏) 区域在推出之际支持以下服务:Auto Scaling、AWS Config、AWS CloudFormation、AWS CloudTrail、Amazon CloudWatch、CloudWatch Events、Amazon CloudWatch Logs、AWS CodeDeploy、AWS Direct Connect、Amazon DynamoDB、Amazon Elastic Compute Cloud (EC2)、Amazon Elastic Block Store (EBS)、Amazon EC2 Systems Manager、AWS Elastic Beanstalk、Amazon ElastiCache、Amazon Elasticsearch Service、Elastic Load Balancing、Amazon EMR、Amazon Glacier、AWS Identity and Access Management (IAM)、Amazon Kinesis […]

Read More