서버리스 데이터 통합 - AWS Glue

AWS Glue

모든 데이터를 대규모로 검색, 준비 및 통합

AWS Glue 시작하기

AWS Glue를 사용해야 하는 이유는 무엇인가요?

분석 또는 AI 프로젝트의 첫 번째 단계는 품질 좋은 결과가 나오도록 데이터를 준비하는 것입니다. AWS Glue는 더 저렴한 비용으로 더 간편하고 빠르게 데이터를 통합할 수 있는 서버리스 서비스입니다. 100여 개의 다양한 데이터 소스를 찾아서 연결하고, 중앙 집중식 데이터 카탈로그에서 데이터를 관리하며, 데이터를 데이터 레이크, 데이터 웨어하우스 및 레이크하우스에 로드하는 데이터 파이프라인을 시각적으로 생성, 실행, 모니터링할 수 있습니다. 기본 제공 생성형 AI 기능을 사용하면 ETL 작성 및 Spark 문제 해결을 위한 지능형 지원을 통해 Apache Spark 작업을 현대화하고 개발 속도를 높일 수 있습니다.

Amazon SageMaker의 차세대 AWS Glue를 사용하여 데이터 통합

차세대 Amazon SageMaker의 AWS Glue를 사용하면 비용 효율적이고 확장 가능한 서버리스 데이터 통합을 통해 한 곳에서 워크로드를 관리하고 구축할 수 있습니다.

자세히 알아보기

장점

AWS Glue에서는 데이터 통합에 필요한 모든 기능을 제공하므로, 인사이트를 얻고 데이터를 신속하게 활용할 수 있습니다. AWS Glue는 내장 ETL, 스키마 검색 및 서비스 간 통합을 통해 최신 데이터 파이프라인을 설계하고 자동화할 수 있는 완전관리형 서버리스 도구 키트를 제공합니다.

AWS Glue를 사용하면 인프라를 관리할 필요 없이 가장 까다롭고 리소스 집약적인 데이터 처리 작업이라도 기가바이트에서 페타바이트로 자동으로 규모를 조정할 수 있으며, 사용한 리소스에 대해서만 비용을 지불하면 됩니다.

AWS Glue는 예약 및 모니터링 기능이 내장된 서버리스 데이터 파이프라인을 제공하여 인프라 관리가 필요 없으므로 팀은 서버 유지 관리 대신 데이터 워크플로 구축에 집중할 수 있습니다.

ETL 코드 자동 생성부터 Spark 작업 현대화까지 데이터 통합 여정 전반에서 AI 기반 지원을 받으세요. AWS Glue는 지능형 코드 생성, AI 지원 Spark 업그레이드, 기본 제공 Spark 문제 해결을 제공합니다.

차세대 Amazon SageMaker에서 데이터 소스에 빠르고 쉽게 연결하여 데이터가 어디에 있든 데이터를 통합할 수 있습니다. Amazon SageMaker 내에서 AWS Glue, Amazon Athena, Amazon EMR 및 MWAA를 조합하여 데이터 처리 프로젝트를 생성하고 공유 관리 및 모니터링 환경을 활용할 수 있습니다. AWS Glue 데이터 처리 기능은 Amazon SageMaker 노트북과 Amazon SageMaker Visual ETL에서 사용할 수 있습니다.