亚马逊AWS官方博客
AWS IoT 物联网系列 | 第四篇:如何使用 AWS IoT 做 OTA 升级
AWS IoT 物联网系列博客
当前物联网环境中,设备类型多种多样,连接方式不一而足。为了帮助读者更好的理解并运用 AWS IoT 相关服务,我们提供了一个完整的 IoT 起步指南,包含设备的注册及上线、设备管理、用户身份及权限管理以及成本控制,通过这一系列的起步指南,也可以快速了解到 AWS IoT 服务如何与 Amazon Alexa 语音助手进行集成。AWS IoT 物联网系列共4篇,本篇是该系列的第一篇,其他篇链接请在本文结尾处查看。
背景介绍
在实际的物联网设备生产中,一般会量产部署上百万设备。这些设备到达客户手上,或者部署到生产系统后,如何安全管理设备,例如远程升级设备这些常见操作,会成为一个难题。物联网设备往往没有屏幕,也没有工作人员在设备前进行手动管理。升级操作如何触发?升级失败后如何回滚,并上报升级状态?这种场景需要提前设计一套系统,自动化进行设备管理。
借助 AWS IoT 设备管理功能,可以很方便的为设备接入到物联网,远程监控和远程管理物联网设备。AWS IoT 设备管理中的任务管理允许用户对设备进行分组和跟踪,同时允许快速查找设备,排查设备功能故障,远程更新设备固件,以及远程重新启动、修复以及将设备恢复到出厂设置,并降低管理大型物联网设备部署的成本和工作量。本博客将介绍如何使用 AWS IoT 设备管理功能帮助您完成设备生命周期管理,简化开发和运维部署,进行远程任务下发。
AWS IoT 任务执行时序图
使用 AWS IoT 创建 OTA 任务时,根据终端设备设置的处理流程,AWS 会把任务分别发布到以下两个预留的 MQTT 主题:
- $ aws / things / {thingName} / jobs / notify
- $ aws / things / {thingName} / jobs / notify-next
这两个主题对应两种不同的设备处理流程:第一种是由设备判断任务优先度,选择一个需要执行的任务。第二种是完成一个任务之后,自动按顺序获取下一个任务。针对不同的设备处理流程,设备需要主动订阅这两个MQTT 主题之一。下述会对两种方法的流程逐步进行介绍。
方法一:获取需要执行的任务:
- 设备连接到 AWS IoT 平台后,订阅 $aws/things/ThingName/jobs/notify 以获取任务通知信息。(订阅该 topic 不会实时收到job的推送通知。Job 的获取需要在下述第二步通过定时轮询的方法定期获取消息通知。但需要注意的是,一定要在 $aws/things/ThingName/jobs/get 请求之前订阅 $aws/things/ThingName/jobs/notify 主题,否则在后续的第三步无法收到任务列表。)
- 当终端设备订阅 $aws/things/ThingName/jobs/notify 后,硬件设备主动发布消息到 $aws/things/ThingName/jobs/get 获取待执行的 job 列表。(可以根据需要自定义轮询时间,例如10分钟取一次,具体可以根据场景来设定。)
- 此时设备会收到 $aws/things/ThingName/jobs/notify 消息,内容包含有任务列表。如果列表中包含了一个或多个任务,设备可自行选择需优先执行的任务。
- 获取到任务列表后,我们可以根据 job 的优先级自行选择优先需要运行的 job,然后把消息发送到 $aws/things/thingName/jobs/jobId/get 获取该 jobid 详细的任务信息。通过订阅 $aws/things/thingName/jobs/jobId/get/accepted,终端设备能够获取到指定任务文档和任务状态。
- 在任务执行过程中,设备向 $aws/things/thingName/jobs/jobId/update 持续发布消息以更新任务状态,使得 AWS IoT 平台获悉设备当前任务的执行状况。同时控制端设备,例如手机端,也可以获取设备当前的更新状态。(在执行 job 的时候,可以定期地把 job 运行的状况发布到 update 主题,以便 IoT 服务的提供者知悉 job 的运行状况。向 update 主题发布消息对终端设备的 Job 运行没有任何影响,它只是状态的上报。但如果需要及时知道设备任务状态,应该及时通过此主题进行更新。)最后,任务执行过程可以反复调用第[5]步,上报任务状态,直到任务完成后,更新状态为“SUCCEEDED”。
- 设备完成了一个任务之后,可以重复执行[2],获取待执行任务列表,并从任务列表中执行下一个任务。
方法二:自动获取下一个任务:
方法二的实现原理和方法一极其相似,但有微小的区别:
- 当设备在线时,订阅 $aws/things/ThingName/jobs/notify-next 主题以获取设备任务信息。
- 发布消息到 $aws/things/thingName/jobs/jobId/get 主题获取待执行列表,注意这里 jobId 应该为 $next。(注意:这里的 $next 并非一个变量名,而是一个真实的参数值。因此在 get 的时候,应该发送的 topic 为 $aws/things/thingName/jobs/$next/get。同样地,设备也要定期轮询以获取下一个任务。订阅 $aws/things/thingName/jobs/jobId/get/accepted 获得任务的返回值。)
- Job被创建后通过notify-next主题下发Job 文档。
- 在执行过程中设备通过发布消息到 $aws/things/thingName/jobs/jobId/update 持续更新任务状态。
- 任务执行过程可以反复调用第[4]步,上报任务状态,直到任务完成后,更新状态为 “SUCCEEDED”。
- 设备完成了一个任务后,通过重复执行[2],自动获取下一个任务并相应执行。
相比于方法一,方法二能够自动执行下一个Job,操作更加简单。但方法二无法在终端设备自定义Job的执行顺序,它只能按照Job提交的顺序往下执行。因此如果Job需要按照优先级(而不是提交顺序)执行,方法一会更加灵活。方法一能够允许终端设备根据自身设定的代码逻辑,例如任务文档中设置的优先级字段,让设备执行优先度高的任务。
AWS IoT 任务执行时序图
在说完整体流程之后,我们通过实际操作,从创建升级任务到执行任务,一步步的完成整个流程。
1. 使用AWS IoT 找出需要控制的设备
首先需要在 AWS IoT 从海量设备中找出需要执行 Job 的设备。AWS IoT 提供了设备状态索引服务,此服务可以帮助我们在 IoT 平台索引和搜索注册表和设备影子数据。打开 AWS IoT 控制台,点击左边设置,选择队列索引设置,打开索引:
同样地,也可以使用 AWSCLI 所示开启设备索引。命令如下
开启索引之后,我们就可以使用索引查询我们的目标设备,假设设备当前已经注册到 AWS IoT 平台,并且通过 MQTT 把设备状态更新到设备影子上。下述展示如何在AWS控制台查询系统版本号为“bc78fd46f845”的设备。后续我们将向这些设备推送升级任务,升级到新的固件系统:
同样的,我们也可以使用 AWS Cli 去查询设备影子,以获得系统版本号为 bc78fd46f845 的设备:
查询完毕之后我们把这些设备加入一个设备组里面,这里我们把这些设备都加入名为 “jobdemo” 组里面,稍后我们将向这个组里面的设备发送升级任务。
2. 在控制台创建任务
创建任务前我们需要定义一个任务文档,这个任务文档将使用 json 形式描述了设备需要执行的远程操作,任务文档可能还包括了需要下载的固件升级包地址,以下是一个示例任务文档,我把这个任务文档保存到 S3 存储桶上。
把任务文档上传到 S3 之后,就可以使用 AWS IoT 控制台点开左侧管理,选择任务,到下一屏之后选择创建新任务,在此我选择的是“创建自定义作业”:
您会看到需要输入任务 ID、描述等,这些自定义即可:
然后在“选择要更新的设备”在之前步骤创建的 jobdemo:
“添加任务文件”选择您存放上述 job 文件的 S3 存储桶位置:
创建完任务作业后,就可以向指定的设备下发任务指令。我们使用上述创建的任务文档,向 jobdemo 推送这个任务,其他配置默认即可。
同样地,也可以使用AWSCLI完成整个Job创建流程:
3. 设备订阅任务并执行
如概述所述,设备为了接收新的任务,需要主动订阅这两个MQTT 主题,两个主题分别对应不同的执行方法。以下展示两个主题订阅和执行任务信息的差异。
在方法一中,订阅$ aws / things / {thingName} / jobs / notify 将得到待执行的任务列表。注意:返回的任务列表中没有具体Job的任务文档。
在方法二中,设备只有在空闲时才会收到 $ aws / things / {thingName} / jobs / notify-next 通知。(也就是说,如果设备正在处理 Job,那么设备是不会同时收到其他 Job 的通知,直到设备完成当前 Job 任务)这个消息的内容中包含了任务文档:
注意:再次强调,在方法二中,任务总是以队列的形式存在设备执行队列里面,如果设备存在之前的任务还没有处理完, 则不会发出 notify-next。
设备可以在接受任务之后,可以向 AWS IoT 特定 MQTT 主题:$ aws / things / thingName / jobs / jobId /update,报告设备当前任务状态:
设备更新状态需要指定四种状态(”IN_PROGRESS”、”FAILED”、”SUCCEEDED”、”REJECTED”)的一种。如上所述,在方法二中,如果任务下发通知时存在 “IN_PROGRESS” 状态的目标设备,则不会发出 notify-next。直到任务变成 “SUCCEEDED” 状态,目标设备才会接收到 notify-next 主题的消息。这样设备在执行完一个任务之后就可以有序地执行下一个任务。
读者可以自由地描述 statusDetails 内容,这里以处理进度为例进行描述。当设备通知 AWS IoT 完成任务“jobdemo”后,AWS IoT 会通过 $ aws / things / {thingName} / jobs / notify-next 主题发布下一个任务通知。
至此,就完成一个任务的执行。
结束语
在实际生产中,我们会从方法一和方法二中选择一种设备处理任务方法,把其编码在硬件设备上。管理员通过 AWS IoT 平台就能够下发任务并自动化进行处理。
需要注意的是,当前仅有 AWS 的 JavaScript Device SDK 包含了对 job 处理的封装。python 等其他语言 SDK 包还没有实现,需要客户按照本文内容的逻辑实现对 job topic 的订阅。