案例研究: 柯基数据

“基于Amazon Web Services(AWS),柯基数据在五天内上线了新冠AI问答机器人,系统准确率达95%以上。柯基数据的各类医学信息知识图谱和智能问答平台服务均构建在AWS上,其强大的AWS合作伙伴网络为柯基数据创新发展带来无尽的想象空间。”
吴刚 CEO 柯基数据
关于柯基数据
南京柯基数据科技有限公司(以下简称“柯基数据”)成立于2015年,曾荣获江苏省“创聚工程”和“创业南京”两项称号。柯基数据致力于运用知识图谱技术打造世界领先的知识工作自动化智能引擎,公司拥有核心自主知识产权30余项,技术覆盖从数据采集到数据清洗、知识提取、知识表示、知识推理、动态本体建模、图存储、可视化关联分析、智能问答、语义检索等知识图谱全技术链。
柯基数据的解决方案主要基于以下领域:医学信息智能问答,医药研发智能情报平台及医学知识图谱智能检索,慢病智能护理与营养健康知识图谱智能推荐,中医知识图谱辅助诊断系统,慢病危险因素防控。
业务需求与挑战
柯基数据解决方案聚焦医疗与医学领域,在业界处于领先地位,通过接入不同平台,服务医学医药代表、医生、公共卫生专家等从业人员,结合人工智能尤其是知识图谱技术,着力解决医学知识与慢病防控等方向涉及的数据处理及自动化难题。
随着业务高速发展,柯基数据IT系统的可扩展性与高并发的稳定性都遭遇了严峻挑战。同时,柯基数据知识图谱的模型训练与构建需要通过大规模集群实现,原有架构无法提供稳定支撑。基于IT基础架构和业务发展目标的全面考虑,柯基数据将目光转向了云,一方面,充分保障系统的稳定性、可靠性,实现更强的弹性和可扩展性,另一方面,为支持技术创新和业务发展保驾护航。
成功激活大量沉睡的医学数据信息,云平台是承载柯基数据创新应用的不二之选,技术工具的先进性、行业客户及合作伙伴网络的广泛程度等都是柯基数据考量云服务商的关键要素。总体看,柯基数据需要从传统架构下繁重的运维日常中解脱出来,专注于产品服务创新和业务发展,通过优化的云架构开发和部署云原生应用,更快速地响应客户市场需求。
为什么选择Amazon Web Services(AWS)
目前,柯基数据包含知识图谱相关机器学习模型的开发、医学信息智能问答系统、新冠AI问答机器人系统、面向医疗医学子行业应用等在内的全套解决方案均运行在AWS上。其基础设施部署分别部署在由西云数据运营的AWS中国(宁夏)区域和由光环新网运营的AWS中国(北京)区域。前者承载研发,即知识图谱的机器学习模型训练,后者承载生产,对外提供SaaS化服务。
柯基数据CEO吴刚表示,选用AWS,主要是看重以下几方面因素:
第一,AWS作为云服务商,产品功能齐全,从计算、数据库、存储、网络到包括后续可能和应用场景深度结合的各类人工智能方案等,包罗万象。
第二,柯基数据面向客户市场提供的SaaS化服务是云原生应用,非常强调弹性、可扩展性及安全能力。AWS云平台提供包括多租户设置、简化架构部署、高可用等在内的全方位能力,方便柯基数据对外提供高质量服务。
第三,AWS具有来自全球市场及合作伙伴网络的、丰富的行业实践。柯基数据可以参考AWS云平台上医药类相关的行业实践,扩展潜在的海外资源和项目机会。通过以Amazon Simple Storage Service (Amazon S3)为核心的数据湖,方便开展后续的模型训练和应用开发工作。
第四,由西云数据运营的AWS中国(宁夏)区域提供性价比高、资源充分性佳的实例类型,适合进行知识图谱的机器模型训练任务。AWS云平台提供弹性伸缩、稳定、丰富的资源,柯基数据可针对模型训练的不同阶段,有针对性地按需部署实例,提升系统整体效率。
柯基数据的基础设施部署在AWS中国(宁夏)区域和AWS中国(北京)区域,采用高冗余的基础设施,全球先进的技术服务为基石。柯基数据部署多可用区容灾架构,大大增强其医学信息问答机器人平台的可靠性,实现安全稳定和高可用。
通过将Amazon Elastic Compute Cloud (Amazon EC2)和Amazon Relational Database Service (Amazon RDS)等核心基础设施多可用区部署,有效保证管理平台的服务性能。业务前端小程序采用主流的“HTML5+CSS3+JavaScript”开发技术,有效提升高访问量承载力,确保应用程序的执行效率和响应速度;业务后端与前端分离,有效解耦。通过“Elastic Load Balancing负载均衡+AutoScaling”的方式优化调用访问,加快系统整体响应速度,减少后端并发/负载压力。

柯基数据基于AWS云平台的架构还具备以下特点:基于Amazon EC2自建容器化应用程序,承载注册用户的医学信息交互式查询访问;使用AWS Key Management Service (AWS KMS),满足药企客户信息安全相关要求。
获得的成效
柯基数据的典型客户场景主要涵盖药企及公共卫生机构等。基于行业知识图谱认知智能引擎技术,通过沉淀的FAQ咨询数据、药品说明书、病历、医学指南、专业网站、专家录入数据、可穿戴设备等数据源,构建基于图谱的医药大健康智能专家虚拟助力,服务药企销售扩展、慢病健康咨询管理、辅助诊断等应用场景。
使用AWS,柯基数据团队首先得以从繁重的基础架构运维工作中解脱,专注于产品服务研发与业务扩展,云平台带来事半功倍的效率提升,这在以往采用线下租用机房或自建的模式下是无法想象的。
同时,AWS云平台支持云原生应用高效落地,柯基数据可以开箱即用的方式快速“搭积木”,迅速上线和更新产品服务,第一时间响应客户市场需求。“好钢用在刀刃上”,使用AWS,柯基数据可将更多宝贵的资金用在产品研发和业务扩展上,最大程度减少运维基础工作的成本投入。比如,通过后端购买预留实例,柯基数据可节省60%的基础设施成本。
第三,AWS合作伙伴网络为柯基数据带来大量潜在商机。比如,将大量药企客户的相关应用需求与柯基数据高效对接,减少架构运维等成本,加快服务响应和上线速度,提升客户满意度。第三方通过调用柯基数据API,可以更好地服务医药代表和医学研究人员,推动研究工作进展,促进销售扩展。
精确到秒级的计费成本控制与完整的通用合规是柯基数据使用AWS获得的另一大显著收益。 AWS不仅能让受HIPAA(美国《1996 年健康保险流通与责任法案》)约束的医疗保健与生命科学客户可以利用安全的 AWS 环境来处理、维护和存储受保护的健康信息, 还兼容GxP体系规范,例如药品非临床研究质量管理规范 (GLP)、药品临床研究质量管理规范 (GCP) 和药品生产质量管理规范 (GMP) 等。除此之外,AWS 还拥有其他安全与质量认证,如 ISO 9001质量管理体系认证、ISO 27001、ISO 27017 和 ISO 27018 信息安全管理体系认证,国际PCI DSS(Payment Card Industry Data Security Standard,第三方支付行业数据安全标准) Level 1最高安全级别认证。在中国,AWS北京区域和宁夏区域的运营商光环新网及西云数据均通过了ISO 9001质量管理体系认证,ISO 27001信息安全管理体系认证,网络安全等级保护三级测评以及可信云服务评估认证。AWS在国内外拥有的符合医疗生命科学合规要求的各类资质认证,匹配柯基数据各类型客户的合规需求。
展望未来
未来,包括微服务架构、应用程序改造等在内的大量应用云原生和互联网化工作,以及自动化运维与安全监控、增强的数据分析等都将是柯基数据重点规划的方向。比如,推荐领域的机器学习服务,架构角度的Serverless等,柯基数据都能在AWS云平台上找到答案。