亚马逊AWS官方博客
AWS Systems Manager 推出新版本,带来更好的跨账户和跨区域体验
我很高兴为大家介绍 AWS Systems Manager 的全新改进版本,新版本为大规模管理节点带来了更好的跨账户和跨区域体验。
全新的 System Manager 体验可集中查看您的所有托管节点,其中包括各种基础设施类型,例如 Amazon Elastic Compute Cloud(EC2)实例、容器、其他云提供商的虚拟机、本地服务器和边缘物联网(IoT)设备。当这些基础设施安装了 Systems Manager Agent(SSM Agent)并连接到 Systems Manager 时,它们被称为“托管节点”。
如果 SSM Agent 出于任何原因停止在某个节点上运行,则 Systems Manager 会断开与该节点的连接,该节点随后被称为“非托管节点”。 通过新的更新,您还可以使用 Systems Manager 轻松发现非托管节点并对其进行故障排除。您可以运行甚至安排自动诊断,向您提供推荐的运行手册,您可以执行这些运行手册来修复任何问题并重新建立连接,使非托管节点再次成为托管节点。
Systems Manager 现在还集成了 Amazon Q 开发者版,这是最强大的生成式人工智能驱动的软件开发助手。您可以使用自然语言向 Amazon Q 开发者版询问有关托管节点的问题,该工具将为您提供快速洞察以及直接指向 Systems Manager 的链接,您可以在其中执行操作或继续进一步探索。
在此版本中,您还可以使用 AWS Organizations,通过与 Systems Manager 的新集成,允许委托管理员集中管理整个组织的节点。
我们看一个有助于演示其中一些新功能的简短示例。
想象一下,您是一名云平台工程师,领导一项迁移计划,旨在替换组织中运行 Windows Server 2016 Datacenter 的所有节点。我们使用新的 Systems Manager 体验来快速收集有关计划中需要包含的所有节点的信息。
第 1 步 – 询问 Amazon Q 开发者版
开始时,最简单的方法是用自然语言向 Amazon Q 开发者版询问您想查找的内容。我使用 AWS 管理控制台打开 Amazon Q 聊天机器人,然后键入查找我的组织中运行 Microsoft Windows Server 2016 Datacenter 的所有托管节点
。
Amazon Q 很快给出了答案:它告诉我们有十个节点符合标准,并提供了每个节点概述的列表。
还有一个链接可以重定向到 System Manager 中新的探索节点页面,我们可以在其中了解更多信息。我们继续。
第 2 步 – 审核我们的基础设施
探索节点页面全面概述了组织内的所有托管节点,并提供了对结果进行分组和筛选的选项,便于快速访问。在这种情况下,我们可以看到已经按操作系统名称筛选了结果,这为我们提供了运行 Microsoft Windows Server 2016 Datacenter 的所有节点的列表。
这是一个很好的开始! 我们可以通过下载报告并将这些节点添加到我们的迁移计划来完成此操作,但是,此页面仅向您显示有关您的托管节点的信息。难道我们的计划中需要包括非托管节点吗? 我们来了解一下。
第 3 步 – 处理非托管节点
打开菜单,然后导航到审核节点洞察页面。在这里,您可以看到带有小部件的控制面板,这些小部件提供富有洞察力的交互式图表,您可以使用这些小部件深入了解并发现有关节点的更多信息,甚至可以采取措施。例如,托管节点类型饼图显示了我们拥有的托管节点的类型,而 SSM Agent 版本图则为我们提供了在其上运行的所有不同版本的 SSM Agent 的概述。您还可以通过添加和替换小部件来自定义此视图。
我们想调查所有非托管节点,目的是确保不会错过任何可能需要添加到迁移计划中的节点。节点摘要小部件清楚地显示有两个非托管节点。这可能意味着这些节点没有安装 SSM Agent,在这种情况下,我们需要手动对其进行调查。但是,这也可能意味着 SSM Agent 权限或网络连接存在问题,使 Systems Manager 无法管理这些节点,也无法像处理任何其他托管节点一样处理这些节点。借助新的 Systems Manager 体验,您可以轻松地对 SSM Agent 问题进行故障排除和修复,因此,现在我们尝试这样做。
首先,选择图表中显示我们的非托管节点的那一部分。这会弹出一个选项,只需单击一下即可启动对所有非托管节点的全面诊断。我们运行这个。
该诊断审核关键配置,例如缺少虚拟私有云(VPC)端点、错误配置的 VPC DNS 设置以及可能阻止 SSM Agent 连接到 Systems Manager 的错误配置的实例安全组。扫描完成后,我们可以看到其中显示了两个 VPC 端点配置错误的调查发现。还为您提供了一个链接,您可以使用该链接打开包含推荐运行手册的侧面板,您可以执行该运行手册来解决问题,还有指向相关文档的链接。
选择执行推荐的运行手册将为您提供变更的详细预览,其中包括对所用输入参数之外将要采取的操作的全面概述、查看所涉步骤细分的链接以及此执行的目标节点。
我们继续并选择“执行”。请记住,这可能会产生费用,因此请务必在执行之前对其进行审核。您可以在此页面上关注进度,尝试修复每个节点上的问题。
啊哈! 修复完成后,我们可以看到 Systems Manager 已发现并更正了带有两个节点的 SSM Agent 的问题。这意味着,Systems Manager 能够成功连接在这些节点上运行的 SSM Agent,使其成为“托管节点”。 我们可以通过返回探索节点页面来验证这一点,注意到“非托管节点”的数量现在已减少到零。
现在我们所有的节点都已成为托管节点,我们准备好获取所有需要添加到迁移计划中的节点的完整列表。
第 4 步 – 下载报告
回到探索节点页面,我们可以看到运行 Microsoft Windows Server 2016 Datacenter 的节点数量已从十个增加到十二个! 这意味着我们以前通过自动诊断修复的那些非托管节点确实在运行我们的目标操作系统。
这正是我们所需要的,因此我们选择下载报告。您可以为其指定文件名,然后从几个选项中进行选择,例如要包含哪些列。在这种情况下,我们选择下载 CSV 文件,其中一行包含列名。
就这么简单! 我们的 CSV 包含有关整个基础设施中需要升级的节点的详细信息。最棒的部分是什么? 准备好进行迁移后,您还可以使用 Systems Manager 自动升级。
结论
Systems Manager 是获得对计算基础设施的可见性和控制以及大规模执行运营操作的关键工具。这种新体验通过集中式控制面板提供您的 AWS 账户、本地和多云环境中所有节点的集中式跨账户、跨区域视图,提供与 Amazon Q 开发者版的集成进行自然语言查询,以及一键式 SSM Agent 故障排除。通过导航到 Systems Manager 控制台并按照简单的说明进行操作,您可以免费启用新体验。
要了解更多信息,请参阅文档,了解有关新 Systems Manager 体验的更多详细信息。
观看此交互式演示,全面了解这种体验。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。