亚马逊AWS官方博客
Zocdoc 在 AWS 上使用 TensorFlow 帮助患者安心看病
医疗保健行业的情况非常复杂。最近的调查表明,超过一半的美国人不清楚所持保险涵盖的范围,四分之三的人希望通过更简单的方法来确认医生是否在保险公司网络内。
Zocdoc 帮助患者理清了这一混乱局面,让需要医疗保健的个人能够做出更明智的选择,同时找到满足其需求的医疗服务。Zocdoc 致力于优化医疗保健数据来帮助患者,支持其完成该使命的核心就是 AWS 上的深度学习。有了使用 TensorFlow 深度学习框架构建的算法,Zocdoc 可更高效地为患者分配医生。患者可预约 24 小时内看诊,过去全国新患者等待看诊的平均等待时间为 24 天。
“作为一家面向消费者的医疗保健技术公司,我们渴望引入以数据为基础的创新技术,改善患者体验。我们的搜索流程使用多种算法来分析患者意图,并根据其需求寻找适合的专科医生”,Zocdoc 的首席技术官 Serkan Kutan 说。
由深度学习提供支持的搜索体验
借助 Zocdoc 的 Insurance Checker,患者只需拍摄一张医保卡的照片,系统便会使用基于深度学习的计算机视觉技术来扫描身份证,并提取正确的保单身份信息。Zocdoc 的工程和数据科学团队曾面临各种难以辨认的身份证,但他们使用 AWS 提供的基于云的 GPU 服务器,只用了一天便创建了神经网络概念验证。
提取人员身份信息后,Insurance Checker 将实时验证患者的医疗保险,查看网络内福利,以及估计的自付率。
即使患者了解其医保计划涵盖的范围,也经常会遇到安排错位的情况:患者要等待数周才能看诊,而其他医生却有较近日期的预约缺口。Zocdoc 提供基于机器学习的数字医疗平台,可以帮助患者找到适合且有空档的网络内医生。
“我们使用深度学习将医保卡图像按承保单位和计划进行分类,同时还提取并读取关键文本字段来帮助患者了解保险涵盖范围,并找到最适合的医生”,Zocdoc 数据科学总监 Brian D’Alessandro 解释道。
幕后原理
Zocdoc 将 TensorFlow 应用于其辨认和匹配系统。该系统使用计算机视觉技术和深度神经网络来同时进行图像分类、图像裁剪和光学字符辨识 (OCR)。由于 OCR 业已成熟,因此 Zocdoc 团队之前曾尝试使用现有的服务。但是,他们发现,任何现有服务都无法足够灵活地处理客户所提交照片在图像质量方面的差异,例如模糊程度、大小、背景和方向等因素。
现在,Zocdoc 系统使用三个深度学习模型,包括基本卷积神经网络 (CNN) 分类模型、对齐模型和 OCR 模型。每个模型在训练算法时所使用的特定参数都可以帮助 Insurance Checker 获得相应结果。例如,神经网络的基本模型将用户图像视作输入并生成相应输出,输出包括承保单位、计划 ID、成员身份证边界框的坐标位置,以及文本方向。
通过数百万标记过的患者医保卡对这些模型进行训练并将其结合使用后,Zocdoc 几乎可以达到 90% 的准确度。此准确度比患者自己输入数据更高。目前,Zocdoc 已将 Insurance Checker 解决方案投入生产。随着客户数据不断增加以及持续对模型进行训练,准确度会继续提高。
结论
现在,Zocdoc 完全在 AWS 上运行。该公司使用 AWS Deep Learning AMI 运行深度学习框架。每个模型均使用 Python 中的 Keras 库以及 TensorFlow 后端在 8 个 GPU 服务器 (Amazon EC2 p2.8xlarge 实例) 上训练几天。该团队发现,使用深度学习可以快速以迭代方式为客户构建功能原型,为他们提供生产就绪型解决方案。
作者简介
Cynthya Peranandam 是 AWS 人工智能解决方案的首席营销经理,帮助客户使用深度学习来实现业务价值。在闲暇时间,她喜欢跑步和音乐。