Amazon Web Services 한국 블로그
Amazon HealthLake 정식 출시 – 의료 클라우드 AI 서비스
AWS re:Invent 2020에서는 의료 및 생명 과학 고객이 다양한 사일로 및 형식의 의료 정보를 구조화되고 중앙화된 AWS 데이터 레이크로 집계하고, 분석 및 기계 학습(ML)을 사용하여 해당 데이터에서 인사이트를 추출할 수 있는 완전관리형 HIPAA 지원 서비스인 Amazon HealthLake를 미리보기로 출시하였습니다.
오늘 Amazon HealthLake를 정식 출시 합니다.
어떤 규모에서든 신속하게 건강 데이터를 저장, 변환 및 분석할 수 있는 능력은 고품질 건강 결정을 내리는 데 매우 중요합니다. 일상생활에서 의사는 최상의 행동 과정을 파악하기 위해 환자 병력에 대해 연도순으로 완전하게 이해해야 합니다. 응급 상황에서 의료팀에 적절한 정보를 적시에 제공하면 환자 결과가 크게 개선될 수 있습니다. 마찬가지로 의료 및 생명 과학 연구자들은 인구 건강 동향 또는 약물 시험 수신자를 식별하기 위해 모델을 분석하고 구축할 수 있는 고품질의 표준화된 데이터가 필요합니다.
기본적으로 대부분의 의료 데이터는 임상 노트와 같은 비정형 텍스트로 잠겨 IT 사일로에 저장되었습니다. 이기종 애플리케이션, 인프라 및 데이터 포맷으로 인해 실무자가 환자 데이터에 액세스하고 이를 통해 인사이트를 추출하기가 어려워졌습니다. 당사는 이 문제를 해결하기 위해 Amazon HealthLake를 구축했습니다.
시작할 때까지 기다릴 수 없다면 지금 Amazon HealthLake용 AWS 관리 콘솔로 이동할 수 있습니다. 더 자세히 알아보려면 이 문서의 내용을 계속 읽어보세요.
Amazon HealthLake 소개
Amazon HealthLake는 완전관리형 AWS 인프라의 지원을 받습니다. 단일 IT 장비를 조달, 프로비저닝 또는 관리할 필요가 없습니다. 단 몇 분밖에 걸리지 않는 새 데이터 스토어를 생성하기만 하면 됩니다. 데이터 스토어가 준비되면 즉시 데이터를 생성, 읽기, 업데이트, 삭제 및 쿼리할 수 있습니다. HealthLake는 고객과 파트너가 비즈니스 애플리케이션에 쉽게 통합할 수 있는 가장 인기 있는 언어로 사용할 수 있는 간단한 REST 애플리케이션 프로그래밍 인터페이스(API)를 제공합니다.
AWS에서는 보안에 번거로움이 전혀 없습니다. 기본적으로 HealthLake는 AWS Key Management Service(KMS)를 사용하여 유효 데이터를 암호화합니다. AWS 관리형 키 또는 사용자 고유의 키를 사용할 수 있습니다. KMS는 AWS 직원을 포함하여 누구도 서비스에서 일반 텍스트 키를 검색할 수 없도록 설계되었습니다. 전송 중인 데이터의 경우 HealthLake는 업계 표준 TLS 1.2 암호화를 엔드 투 엔드 방식으로 사용합니다.
HealthLake는 출시 시점에 임상 노트, 실험실 보고서, 보험 청구 등에 일반적으로 발견되는 정형 및 비정형 텍스트 데이터를 모두 지원합니다. 이 서비스는 이 데이터를 Fast Healthcare Interoperability Resource(FHIR, ‘fire’로 발음) 형식으로 저장하며, 이는 상태 데이터를 교환할 수 있도록 설계된 표준입니다. HealthLake는 최신 버전(R4)과 호환되며, 따라야 할 추가 리소스와 함께 현재 71개의 FHIR 리소스 유형을 지원합니다.
데이터가 이미 FHIR 형식이라면 좋습니다! 그렇지 않은 경우 직접 변환하거나 AWS Marketplace에서 사용할 수 있는 파트너 솔루션에 의존할 수 있습니다. 출시 시 HealthLake에는 Redox, HealthLX, Diameter Health 및 InterSystems 애플리케이션을 위한 검증된 커넥터가 포함됩니다. HL7v2, CCDA 및 플랫 파일 데이터를 FHIR로 쉽게 변환하고 HealthLake에 업로드할 수 있습니다.
데이터가 업로드되면 HealthLake는 통합된 자연어 처리를 사용하여 문서에 있는 엔터티를 추출하고 해당 메타데이터를 저장합니다. 이러한 엔터티에는 해부학, 의료 상태, 약물 치료, 보호 건강 정보, 검사, 치료 및 절차가 포함됩니다. 또한 업계 표준 ICD-10-CM 및 RxNorm 엔터티와도 일치합니다.
데이터를 업로드한 후 FHIR 리소스 및 추출된 엔터티에 파라미터 값을 할당하여 쿼리를 시작할 수 있습니다. 단일 환자에 대한 정보에 액세스해야 하거나 연구 데이터 집합을 구축하기 위해 많은 문서를 내보내야 하는 경우 단일 API 호출만 하면 됩니다.
간단한 데모를 보여드리겠습니다.
Amazon HealthLake에서 FHIR 데이터 쿼리
HealthLake용 AWS 콘솔을 열고 ‘데이터 스토어 만들기’를 클릭합니다. 그런 다음 데이터 스토어의 이름을 선택하고 AWS 관리형 키로 암호화하기만 하면 됩니다. 또한 합성된 데이터 샘플을 사전 로드하는 상자를 선택합니다. 이는 자신의 데이터를 업로드하지 않고도 서비스를 빠르게 시작할 수 있는 좋은 방법입니다.
몇 분 후에 데이터 스토어가 활성화되고 HTTPS 엔드포인트로 쿼리를 전송할 수 있습니다. 아래 예에서는 신뢰도 점수가 99% 이상인 ‘고혈압’에 대한 ICD-CM-10 엔터티가 포함된 임상 노트(및 임상 노트만 해당)를 찾습니다. 내부적으로 AWS 콘솔은 엔드포인트에 HTTP GET 요청을 전송합니다. 해당 쿼리 문자열을 강조 표시했습니다.
쿼리가 몇 초 안에 실행됩니다. 브라우저에서 JSON 응답을 검사하면 두 개의 문서가 포함되어 있음을 알 수 있습니다. 각각에 대해 생성된 시기, 소유 조직, 작성자 등 많은 정보를 볼 수 있습니다. 또한 가 이름, 설명 및 신뢰 점수와 함께 긴 엔터티 목록을 자동으로 추출하여 문서에 추가했음을 알 수 있습니다.
문서는 base64 형식의 응답으로 첨부됩니다.
문자열을 텍스트 파일에 저장하고 명령줄 도구로 디코딩하면 다음과 같은 내용이 표시됩니다.
Nesser는 관상 동맥 질환, 심방세동, 고혈압, 고지혈증을 포함한 광범위한 과거 병력이 있는 52세 백인 남성으로 오한, 메스꺼움, 급성 왼쪽 측면 통증 및 왼쪽 다리 일부 마비 등의 질환으로 North ED에 소개되었습니다.
이 문서는 정확합니다. 보시다시피 Amazon HealthLake에 저장된 데이터를 쿼리하고 검색하는 것은 정말 쉽습니다.
Amazon HealthLake에 저장된 데이터 분석
HealthLake에서 데이터를 내보내 Amazon Simple Storage Service(Amazon S3) 버킷에 저장한 다음, 분석 및 기계 학습 작업에 사용할 수 있습니다. 예를 들어 AWS Glue를 사용하여 데이터를 변환하고, Amazon Athena로 쿼리하고, Amazon QuickSight를 사용하여 시각화할 수 있습니다. 이 데이터를 사용하여 Amazon SageMaker에 기계 학습 모델을 구축, 교육 및 배포할 수도 있습니다.
다음 블로그 게시물에서는 HealthLake에 저장된 데이터를 기반으로 하는 엔드 투 엔드 분석 및 기계 학습 워크플로를 제시합니다.
- Amazon HealthLake의 인구 건강 애플리케이션: Amazon QuickSight를 사용한 분석 및 모니터링
- Amazon HealthLake의 정규화된 데이터가 포함된 Amazon SageMaker를 사용하여 예측 질병 모델 구축
- Amazon HealthLake와 Amazon SageMaker를 사용하여 환자 결과 예측 애플리케이션 구축
- AWS AI 서비스를 사용하여 인지 검색 및 건강 지식 그래프 작성
마지막으로, 이 자습형 워크숍에서는 HealthLake를 사용하여 데이터를 가져오고 내보내고, AWS Glue 및 Amazon Athena를 사용하여 처리하고, Amazon QuickSight 대시보드를 구축하는 방법을 제시합니다.
이제 HealthLake를 사용하여 고객이 무엇을 구축하고 있는지 살펴보겠습니다.
이미 Amazon HealthLake를 사용 중인 고객
시카고에 본사를 둔 러시 대학교 메디컬 센터는 HealthLake의 얼리어답터입니다. 센터는 이 플랫폼을 사용하여 시카고 보건부를 대신해 공중 보건 분석 플랫폼을 구축했습니다. 이 플랫폼은 시카고 병원에서 진료를 받는 COVID-19 환자를 위한 환자 입학, 퇴원 및 이동, 전자 실험실 보고, 병원 역량 및 임상 진료 문서와 관련된 다중 병원 데이터를 집계, 결합 및 분석합니다. 시카고에 있는 32개 병원 중 17개가 현재 데이터를 제출하고 있으며 러시 대학교는 이번 여름까지 32개의 병원을 모두 통합할 계획입니다. 자세한 내용은 이 블로그 게시물을 참조하십시오.
최근 러시는 고혈압 위험에 가장 많이 노출된 지역사회를 파악하고, 건강의 사회적 결정 요인을 이해하고, 의료 접근성을 개선하기 위한 또 다른 프로젝트를 시작했습니다. 이를 위해 임상 노트, 지역 사회의 외래 혈압 측정 및 메디케어 청구 데이터와 같은 모든 종류의 데이터를 수집합니다. 그런 다음 이 데이터가 HealthLake에 수집되어 추가 분석을 위해 FHIR 형식으로 저장됩니다.
러시 대학교 메디컬 센터의 부원장이자 최고 분석 책임자인 Dr. Bala Hota 씨는 다음과 같이 전합니다. “우리는 불필요한 물건을 만들거나 이미 존재하는 것을 재발명하는 데 시간을 할애할 필요가 없습니다. 그러므로 분석 단계로 훨씬 빠르게 이동할 수 있습니다. Amazon HealthLake는 인구를 위해 결과를 제공하는 데 필요한 인사이트를 가속화합니다. 우리는 인프라 구축에 모든 시간을 소비하고 싶지 않습니다. 우리는 통찰력을 전달하고자 합니다.”
Cortica는 자폐증 및 기타 발달 장애가 있는 어린이의 건강 관리에 혁명을 일으키고 있습니다. 오늘날 Cortica는 HealthLake를 사용하여 모든 환자 데이터를 표준화되고 안전하며 규정을 준수하는 방식으로 저장합니다. 이러한 데이터로 기계 학습 모델을 구축하면 감정 분석을 통해 환자의 진행 상황을 추적할 수 있으며 자녀가 언어 발달 및 운동 기술에 대한 진행 상황을 부모와 공유할 수 있습니다. 또한 치료 모델의 효과를 검증하고 약물 요법을 최적화할 수 있습니다.
Cortica의 엔터프라이즈 애플리케이션 및 데이터 책임자인 Ernesto DiMarino는 다음과 같이 말했습니다. “몇 달이 아니라 몇 주 만에 Amazon HealthLake는 환자의 병력, 약물 이력, 행동 평가 및 실험실 보고서를 안전하게 저장하는 중앙 집중식 플랫폼을 만들 수 있도록 권한을 부여했습니다. 이 플랫폼은 임상 팀에 환자의 진료 진행에 대한 심층적인 통찰력을 제공합니다. Amazon HealthLake의 데이터와 함께 Amazon SageMaker의 사전 정의된 노트북을 사용하여 기계 학습 모델을 적용하여 다른 방법으로는 불가능한 방식으로 각 환자의 목표 진행 상황을 추적하고 예측할 수 있습니다. 또한 이 기술을 통해 HIPAA 준수 데이터를 환자, 연구원 및 의료 파트너와 상호 운용 가능한 방식으로 공유하여 자폐증 치료에 관한 중요한 연구를 진행할 수 있습니다.”
MEDHOST는 모든 유형과 규모의 1,000개 이상의 의료 시설에 제품과 서비스를 제공합니다. 이러한 고객은 환자 데이터를 FHIR 형식으로 표준화하고 대시보드와 고급 분석을 구축하여 환자 치료를 개선할 수 있는 솔루션을 개발하기를 원하지만 현재는 어렵고 시간이 많이 소요됩니다.
MEDHOST 엔지니어링 담당 이사인 Pandian Velayutham은 다음과 같이 말했습니다. “우리는 Amazon HealthLake를 사용함으로써 통합된 자연어 처리 및 분석 기능을 통해 몇 주가 아닌 며칠 만에 규정 준수 FHIR 데이터 스토어를 생성하여 병원 운영 효율성을 개선하고 더 나은 환자 치료를 제공함으로써 고객의 요구를 충족시킬 수 있습니다.”
시작하기
Amazon HealthLake는 현재 미국 동부(버지니아 북부), 미국 동부(오하이오) 및 미국 서부(오레곤) 리전에서 사용할 수 있습니다.
자습형 워크숍을 시도해 보고 의견을 알려주세요. 항상 그렇듯이, 여러분의 피드백을 기다리고 있습니다. 일반 AWS Support 담당자를 통해 보내거나, AWS 포럼에 게시하실 수 있습니다.