什么是生成式人工智能？— 生成式人工智能详解

什么是生成式人工智能？

生成式人工智能是一种可用于创建新的内容和想法（包括对话、故事、图像、视频和音乐）的人工智能。人工智能技术试图在图像识别、自然语言处理（NLP）和翻译等非传统计算任务中模仿人类智能。生成式人工智能是人工智能的发展方向。您可以训练其学习人类语言、编程语言、艺术、化学、生物学或任何复杂的主题。生成式人工智能可以重复使用训练数据来解决新问题。例如，学习英语词汇并根据其处理的字词创作一首诗。您的组织可以将生成式人工智能用于各种用途，例如聊天机器人、媒体创作以及产品开发和设计。

为什么生成式人工智能很重要？

像 ChatGPT 这样的生成式人工智能应用程序吸引了广泛的关注，并且可让用户充分发挥想象力。它们可以帮助重塑大多数客户体验和应用程序，创建前所未有的新应用程序，以及协助客户达到新的工作效率水平。

根据 Goldman Sachs 的观点，生成式人工智能可以推动全球国内生产总值（GDP）增长 7%（或近 7 万亿美元）。他们还预计，生成式人工智能可能会在 10 年内将生产率增长提高 1.5%。

接下来，我们将介绍生成式人工智能的更多优点。

加速研究

生成式人工智能算法可以用新的方式探索和分析复杂的数据。因此，研究人员可以发现原本可能不明显的新趋势和模式。这些算法可以汇总内容，概述多种解决方案路径，集思广益，并根据研究笔记创建详细的文档。这就是生成式人工智能可极大地增强研究和创新的原因所在。

例如，制药行业正在使用生成式人工智能系统来生成和优化蛋白质序列，并显著加快推进药物发现。

改善客户体验

生成式人工智能可以自然地响应人类对话，并可用作客户服务和客户工作流程个性化的工具。

例如，可以使用人工智能驱动的聊天机器人、语音机器人和虚拟助手，它们可以更准确地响应客户，从而可在首次联系时解决问题。它们可以通过以个性化的方式展示精心策划的服务和沟通内容来提高客户参与度。

优化业务流程

借助生成式人工智能，企业可以在所有业务领域利用机器学习（ML）和 AI 应用程序来优化业务流程。可以将此技术应用于所有业务领域，包括工程、营销、客户服务、财务和销售。

例如，以下是生成式人工智能可以执行的优化：

从任何来源提取和汇总数据，将其用于知识搜索功能
评估和优化营销、广告、财务和物流等领域的不同成本降低方案
生成合成数据，为有监督学习和其他机器学习过程创建带标签的数据

提高员工的工作效率

生成式人工智能模型可以增强员工的工作流程，并且充当组织中每个人的高效助手。它们可以采用类似人类的方式完成从搜索到创建的所有任务。

生成式人工智能可以提高不同类型员工的工作效率：

根据特定的输入和约束条件生成多个原型，从而支持创意任务。该技术还可以根据人工反馈和指定约束条件优化现有设计。
针对应用程序开发任务生成新的软件代码建议。
通过生成报告、摘要和预测来支持管理。
为营销团队生成新的销售脚本、电子邮件内容和博客

可以节省时间、降低成本并提高整个组织的效率。

生成式人工智能如何运作？

像所有人工智能一样，生成式人工智能的运作方式是使用机器学习模型，机器学习模型是根据大量数据进行预训练的超大型模型。

基础模型

基础模型（FM）是在广泛的广义和未标记数据上训练的机器学习模型。这些模型能够执行各种各样的一般任务。

FM 是这项已经发展了数十年的技术的最新进展结果。通常，FM 使用学习的模式和关系来预测序列中的下一个项目。

例如，在生成图像时，模型会分析图像并创建更清晰、更明确定义的图像版本。同样，对于文本，模型会根据之前的单词及其上下文预测文本字符串中的下一个单词。然后，模型使用概率分布技术选择下一个单词。

大型语言模型

大型语言模型（LLM）就是一类基础模型。例如，OpenAI 的生成式预训练转换器（GPT）模型是 LLM。LLM 专门处理基于语言的任务，例如摘要、文本生成、分类、开放式对话和信息提取。

了解 GPT »

LLM 的与众不同在于它们能够执行多项任务。实现此功能的原因是 LLM 包含许多参数，使其能够学习高级概念。

像 GPT-3 这样的 LLM 可以考虑数十亿个参数，并且能够根据很少量的输入生成内容。通过在预训练中接触各种形式和多种模式的互联网规模数据，LLM 学会了在各种环境中应用它们的知识。

生成式人工智能会对不同行业产生什么影响？

虽然生成式人工智能可能会逐渐影响所有行业，但某些行业有望迅速从这项技术中受益。

金融服务

金融服务公司可以利用生成式人工智能的强大功能，在降低成本的同时更好地为客户提供服务：

金融机构可以使用聊天机器人生成产品推荐并回复客户查询，从而改善整体客户服务
贷款机构可以加快金融服务不足的市场（特别是在发展中国家）的贷款审批
银行可以快速检测到索赔、信用卡和贷款中的欺诈行为
投资公司可以利用生成式人工智能的强大功能，以低成本为其客户提供个性化的金融建议

医护及生命科学

生成式人工智能最有前景的使用案例之一是加速药物发现和研究。生成式人工智能使用模型创建具有特定特性的新型蛋白质序列，以此设计抗体、酶、疫苗和基因疗法。

医疗保健和生命科学公司可以使用生成式模型设计合成基因序列，以应用于合成生物学和代谢工程。例如，这些公司可以创建新的生物合成途径或优化用于生物制造的基因表达。

最后，生成式人工智能可用于创建合成患者和医疗保健数据。这对于在不访问大型现实世界数据集的情况下训练人工智能模型、模拟临床试验或研究罕见疾病非常有用。

汽车和制造业

汽车公司可以将生成式人工智能技术用于从工程到车内体验和客户服务的多种用途。例如，这些公司可以优化机械零件的设计以减少车辆设计中的阻力或调整辅助系统的设计。

汽车公司正在使用生成式人工智能，通过快速回答最常见的客户问题来优化客户服务。可以使用生成式人工智能创建新的材料、芯片和零件设计，以优化制造流程并降低成本。

生成式人工智能还可用于生成合成数据以测试应用程序。这对于通常未包含在测试数据集中的数据（例如缺陷或边缘情况）特别有用。

媒体和娱乐

从动画和脚本到完整的电影，生成式人工智能模型只需花费相当于传统生产一小部分的成本和时间，即可制作出新颖的内容。

以下是在行业中使用生成式人工智能的其他方式：

艺术家可以通过人工智能生成的音乐来补充和增强他们的专辑，从而创作出全新的体验
媒体组织可以使用生成式人工智能，通过提供个性化内容和广告来改善受众体验，从而增加收入
游戏公司可以使用生成式人工智能来创建新游戏并允许玩家构建头像

远程通信

电信领域中生成式人工智能的早期应用场景侧重于重塑客户体验。客户体验由订阅用户在客户旅程各个接触点上的累积互动来定义。

例如，电信组织可以应用生成式人工智能，通过类似人类的实时对话代理来改善客户服务。他们还可以通过分析网络数据来推荐修复方法，从而优化网络性能。此外，这些组织还可以通过个性化的一对一销售助手重塑客户关系。

能源

生成式人工智能适用于涉及复杂原始数据分析、模式识别、预测和优化的能源行业任务。能源组织可以通过分析企业数据来确定使用模式，从而改善客户服务。利用这些信息，组织可以开发有针对性的产品、能源效率计划或需求响应计划。

生成式人工智能可以帮助进行电网管理、提高运营现场安全性以及通过油藏模拟优化能源生产。

生成式人工智能模型如何运作？

传统的机器学习模型具有辨别性，或者侧重于对数据点进行分类。它们尝试确定已知因素和未知因素之间的关系。例如，这些模型查看图像，即像素排列、线条、颜色和形状等已知数据，然后将它们映射到字词，即未知因素。从数学上讲，这些模型的工作原理是识别可以用数值方式将未知和已知因素映射为 x 和 y 变量的方程。

生成式模型在此基础上更进一步。这些模型不是在给定某些特征的情况下预测标签，而是在给定具体标签的情况下尝试预测特征。从数学上讲，生成式建模计算 x 和 y 同时出现的概率。该模型学习不同数据特征的分布及其关系。

例如，生成式模型分析动物图像以记录变量，例如不同的耳朵形状、眼睛形状、尾巴特征和皮肤图案。这些模型学习特征及其关系，以了解不同动物的总体外观。然后，它们可以重新创建训练集中没有的新动物图像。

接下来，我们给出几大类生成式人工智能模型。

扩散模型

扩散模型通过对初始数据样本进行迭代性的受控随机更改来创建新数据。这些模型以原始数据为起点，然后加入细微的变化（噪点），逐渐使其与原始数据不那么相似。这种噪点经过仔细控制，以确保生成的数据保持一致性和真实性。

在多次迭代中添加噪点之后，扩散模型反转该过程。反向去噪会逐渐消除噪点，从而产生与原始数据样本相似的新数据样本。

生成对抗网络

生成对抗网络（GAN）是另一种基于扩散模型概念的生成式人工智能模型。

GAN 的工作原理是以竞争方式训练两个神经网络。第一个网络称为生成者，通过添加随机噪点来生成虚假的数据样本。第二个网络称为辨别者，其尝试区分真实数据和生成者产生的虚假数据。

在训练过程中，生成者不断提高其创建逼真数据的能力，而辨别者日益加强区分真假数据的能力。这种对抗过程一直持续到生成者产生的数据令人信服，以至于辨别者无法将其与真实数据区分。

GAN 广泛用于生成逼真的图像、风格转换和数据增强任务。

变分自动编码器

变分自动编码器（VAE）学习一种称为潜在空间的紧凑数据表示形式。潜在空间是数据的数学表示形式。可以将潜在空间视为唯一的代码，根据数据的所有属性来表示数据。例如，如果研究面部，则潜在空间包含代表眼睛形状、鼻子形状、颧骨和耳朵的数字。

VAE 使用两个神经网络 — 编码器和解码器。编码器神经网络将输入数据映射为潜在空间每个维度的均值和方差。该神经网络从高斯（正态）分布中生成随机样本。此样本是潜在空间中的一个点，表示输入数据的压缩简化版本。

解码器神经网络从潜在空间中获取此取样点，然后将其重新构造回与原始输入相似的数据。使用数学函数衡量重新构造的数据与原始数据的匹配程度。

基于转换器的模型

基于转换器的生成式人工智能模型建立在 VAE 的编码器和解码器概念之上。基于转换器的模型为编码器添加更多层，以提高理解、翻译和创意写作等文本式任务的处理性能。

基于转换器的模型使用自注意力机制。在处理序列中的每个元素时，这些模型权衡输入序列中不同部分的重要性。

另一个关键功能是这些人工智能模型实现上下文嵌入。序列元素的编码不仅取决于元素本身，还取决于其在序列中的上下文。

基于转换器的模型的运作方式

要理解基于转换器的模型如何运作，可以将语句想象成单词序列。

自注意力可以帮助模型在处理每个单词时将注意力集中在相关的单词上。为获取单词之间不同类型的关系，基于转换器的生成式模型采用称为注意力头的多个编码器层。每个头都学习关注输入序列的不同部分。这样，模型就可以同时考虑数据的各个方面。

每个层还会对上下文嵌入进行优化。这些层使嵌入的信息更丰富，同时可获取从语法句法到复杂语义的所有内容。

生成式人工智能技术如何演变？

过去几十年来，统计学中一直使用基本生成模型来帮助进行数值数据分析。神经网络和深度学习是现代生成式人工智能的最新先驱技术。2013 年开发而成的变分自动编码器是第一个可以生成逼真图像和语音的深度生成模型。

VAE 引入创建多种数据类型创新变体的功能。该功能推动其他生成式人工智能模型的迅速出现，例如生成式对抗网络和扩散模型。这些创新侧重于让生成的数据日益类似于真实数据，尽管这些数据是人为创建的。

2017 年，随着转换器的推出，人工智能研究发生进一步的转变。转换器将编码器和解码器架构与注意力机制无缝集成。转换器以卓越的效率和多功能性简化语言模型的训练过程。像 GPT 这样的著名模型已成为基础模型，它们能够在广泛的原始文本语料库上进行预训练，并针对不同的任务进行微调。

转换器变革自然语言处理可能实现的功能。它们为从翻译、摘要到回答问题等任务提供了生成式功能。

许多生成式人工智能模型持续取得长足进步，并且已经形成跨行业应用。最近的创新侧重于完善模型以使用专有数据。研究人员还希望创建越来越类似人类行为的文本、图像、视频和语音。

生成式人工智能的采用有哪些最佳实践？

如果组织想要实施生成式人工智能解决方案，请考虑采用以下最佳实践来强化工作。

从内部应用程序开始采用

最好从内部应用程序开发开始采用生成式人工智能，重点关注流程优化和员工生产效率提升。可以获得更加可控的环境来测试结果，同时培养技能和理解相关技术。可以广泛测试模型，甚至可以在内部知识源上自定义模型。

这样，在最终将这些模型用于外部应用程序时，客户将获得更理想的体验。

提高透明度

就所有生成式人工智能应用程序和输出进行清晰的沟通，这样用户就可知道他们正在与 AI 而非人类进行交互。例如，AI 可以自我介绍为人工智能，或者可以标记和突出显示基于人工智能的搜索结果。

这样，用户就可以在与内容互动时自行做出判断。他们还可以更主动地处理底层模型可能存在的任何不准确或隐藏的偏差（由于训练数据的局限性）。

实施安全性

实施防护机制，从而生成式人工智能应用程序不会允许无意中未经授权访问敏感数据。让安全团队从一开始参与进来，这样就可在启动时考虑所有方面。例如，在根据内部数据训练任何模型之前，您可能必须掩蔽数据并移除个人身份信息（PII）。

广泛测试

开发自动和手动测试流程来验证结果，以及测试生成式人工智能系统可能遇到的所有类型场景。让不同的测试版测试人员组以不同的方式试用应用程序并记录结果。该模型还将通过测试不断改进，并且您可以更全面地控制预期结果和响应。

生成式人工智能的常见应用有哪些？

借助生成式人工智能，您可以更快地在业务中利用机器学习，并将其应用于更广泛的应用场景。您可以将生成式人工智能应用于所有业务领域，包括工程、营销、客户服务、财务和销售。代码生成是生成式人工智能最有前景的应用场景之一，借助基于生成式人工智能的软件开发助手 Amazon Q Developer，我们在开发人员生产力方面取得了不错的成绩。

除了代码生成外，您还可以在在许多应用场景中应用生成式人工智能，从而在客户体验、员工工作效率、业务效率和创造力方面获得阶梯式的提升。您可以使用生成式人工智能，通过聊天机器人、虚拟助理、智能联系中心、个性化和内容审核等功能改善客户体验。您可以通过生成式人工智能支持的对话式搜索、内容创建和文本摘要等功能来提高员工的工作效率。您可以通过智能文档处理、维护助理、质量控制和视觉检查以及合成训练数据生成来改善业务运营。最后，您可以使用生成式人工智能，通过生成文本、动画、视频和图像来加快艺术和音乐等各类创意内容的制作。

AWS 如何协助生成式人工智能？

借助 Amazon Web Services（AWS），您可以针对自己的数据、使用案例和客户轻松构建和扩展生成式人工智能应用程序。借助 AWS 上的生成式人工智能，您可以获得企业级的安全和隐私，并且可以接触行业领先的 FM、生成式人工智能驱动的应用程序，以及数据优先的方法。

从一系列生成式人工智能服务中进行选择，这些技术支持处于生成式人工智能采用和成熟化的每个阶段的所有类型组织：

代码生成是生成式人工智能最具前景的应用领域之一。借助 Amazon Q Developer（一款基于生成式人工智能的软件开发助手），您可以在提高开发人员的工作效率方面取得出色成果。
Amazon Bedrock 是另一项完全托管的服务，它提供多种高性能 FM 和一系列广泛功能。可以轻松地试用各种顶级 FM，使用自己的数据对其进行私有自定义，以及创建执行复杂业务任务的托管代理。
还可以使用 Amazon SageMaker JumpStart 发现、探索和部署开源 FM，甚至可以创建自己的 FM。SageMaker JumpStart 提供托管基础设施和工具，可加快构建、训练和部署可扩展、可靠且安全的模型。
AWS HealthScribe 是一项符合 HIPAA 要求的服务，有助于医疗保健软件供应商构建临床应用程序，从而通过分析患者与临床医生的对话自动生成临床记录。AWS HealthScribe 将语音识别和生成式人工智能（AI）相结合，通过转录患者与临床医生的对话和生成更易于查看的临床笔记来减轻临床文档方面的负担。
Amazon Q in QuickSight 使用自然语言命令帮助业务分析师轻松创建和自定义视觉效果。全新的生成式 BI 编写功能扩展 QuickSight Q 的自然语言查询，使其不仅是回答结构合理的问题（例如“加州销量排名前十的产品有哪些？”）以帮助分析师根据问题片段（例如“排名前十的产品”）快速创建可自定义的视觉效果，更可以通过询问后续问题来明确查询的意图，完善视觉效果并完成复杂的计算。

立即创建账户，以开始在 AWS 上使用生成式人工智能。

什么是生成式人工智能？

什么是生成式人工智能？

为什么生成式人工智能很重要？

加速研究

改善客户体验

优化业务流程

提高员工的工作效率

生成式人工智能如何运作？

基础模型

大型语言模型

生成式人工智能会对不同行业产生什么影响？

金融服务

医护及生命科学

汽车和制造业

媒体和娱乐

远程通信

能源

生成式人工智能模型如何运作？

扩散模型

生成对抗网络

变分自动编码器

基于转换器的模型

基于转换器的模型的运作方式

生成式人工智能技术如何演变？

生成式人工智能的采用有哪些最佳实践？

从内部应用程序开始采用

提高透明度

实施安全性

广泛测试

生成式人工智能的常见应用有哪些？

AWS 如何协助生成式人工智能？

AWS 上的后续步骤

终止对 Internet Explorer 的支持