亚马逊AWS官方博客
Amazon HealthLake 在云中存储、转换和分析健康数据
医疗保健组织每天收集大量患者信息,从家族史和临床观察,到诊断和药物治疗。他们使用所有这些数据来尝试编译患者健康信息的完整图像,以提供更好的医疗保健服务。目前,这些数据分布在各种系统(电子病历、实验室系统、医疗图像存储库等)之间,并以数十种不兼容的格式存在。
快速医疗互操作性资源 (FHIR) 等新兴标准旨在通过提供一致的格式来描述和交换这些系统之间的结构化数据,从而应对这一挑战。但是,这些数据大多是医疗记录(例如临床记录)、文档(例如 PDF 实验室报告)、表格(例如保险索赔)、图像(例如 X 光、MRI)、音频(例如,录制的对话)和时序数据(例如心电图)中包含的非结构化信息,因此提取这些信息具有挑战性。
医疗保健组织可能需要数周或数月的时间才能收集所有这些数据,并为转型(标记和索引)、结构化和分析做好准备。此外,对于大多数医疗保健组织来说,完成所有这些工作的成本和运营复杂性令人望而却步。
今天,我们很高兴地推出 Amazon HealthLake,一项完全托管且符合 HIPAA 条件的服务,该服务现已推出预览版,可使医疗保健和生命科学客户将来自不同孤岛和格式的健康信息汇总为集中式 AWS 数据湖。HealthLake 使用机器学习 (ML) 模型对健康数据进行规范化,并自动理解和从数据中提取有意义的医疗信息,以便轻松搜索所有此类信息。然后,客户可以查询和分析数据,以了解关系、识别趋势并做出预测。
工作原理
Amazon HealthLake 支持将数据从本地复制到 AWS 云,您可以在其中存储结构化数据(如实验室结果)以及非结构化数据(如临床注释),HealthLake 将在 FHIR 中标记和结构化这些数据。所有数据都使用标准医疗术语完全索引,因此您可以快速轻松地查询、搜索、分析和更新所有客户的健康信息。
借助 HealthLake,医疗保健组织可以在几分钟内收集和转换患者健康信息,并全面了解患者病史,该工具采用 FHIR 行业标准格式,具有强大的搜索和查询功能。
在 AWS 管理控制台中,医疗保健组织只需点击几下,就可以使用 HealthLake API 将其本地医疗保健数据复制到 AWS 中的安全数据湖。如果源系统未配置为以 FHIR 格式发送数据,则可以使用 AWS 合作伙伴列表轻松连接您的传统医疗保健数据格式并将其转换为 FHIR。
HealthLake 由机器学习驱动
HealthLake 使用自然语言处理 (NLP) 等专业机器学习模型来自动转换原始数据。这些模型经过培训,能够理解并从非结构化健康数据中提取有意义的信息。
例如,HealthLake 可以从病史、医生笔记和医学影像报告中准确识别患者信息。然后,它能够对转换后数据进行标记、索引和构建索引,使其可以通过标准术语(如医疗状况、诊断、药物治疗和治疗)进行搜索。
查询成千上万患者记录非常简单。例如,医疗保健组织可以根据药物的相似性创建糖尿病患者名单,方法是从标准医疗状况列表中选择“糖尿病”,从治疗菜单中选择“口服药物”,然后完善性别和搜索。
医疗保健组织可以使用 Amazon SageMaker 中的 Juypter Notebook 模板,快速轻松地对标准化数据运行分析,以执行诊断预测、医院重新入院概率和手术室利用率预测等常见任务。例如,这些模型可以帮助医疗保健组织预测疾病的发作。只需在预建笔记本中点击几下,医疗保健组织就可以将机器学习应用于其历史数据,并预测糖尿病患者在未来五年内何时会患上高血压。运营商还可以直接从 AWS 管理控制台使用 Amazon SageMaker 在数据上构建、培训和部署自己的机器学习模型。
让我们创建自己的数据存储并开始测试
HealthLake 上手很简单。您可以访问 AWS Management Console(AWS 管理控制台),然后单击选择 Create a datastore(创建数据存储)。
如果您单击Preload data(预加载数据),HealthLake 将加载测试数据,然后您可以开始测试其功能。如果您已经拥有符合 FHIR 4 的数据,也可以上传自己的数据。您将其上传到 S3 存储桶,然后将其导入以设置存储桶名称。
创建数据存储后,您可以执行搜索、创建、读取、更新或删除 FHIR 查询操作。例如,如果您需要一份位于纽约的每位患者的名单,则您的查询设置与下面的屏幕截图类似。根据 FHIR 规范,删除的数据仅在分析和结果中隐藏;不会从服务中删除,只会版本化。
您可以选择添加搜索参数以获取更多嵌套查询条件,如下所示。
Amazon HealthLake 现已提供预览版
Amazon HealthLake 从今天开始在美国东部(弗吉尼亚北部)提供预览版。请查看我们的网站了解更多信息。
– Kame