게시된 날짜: Apr 16, 2021
데이터에 사용자 지정 작업을 적용하는 데 사용할 수 있는 사용자 정의 함수(UDF)가 Amazon Athena용으로 정식 출시되었습니다. Athena는 다양한 기본 제공 함수를 제공합니다. 여기에 더해 사용자는 자체 함수로 이러한 기능을 확장하고 쿼리 안에서 직접 사용할 수 있습니다. 이렇게 하면 민감한 데이터의 교정 또는 암호화와 같은 특정 사용 사례를 복잡한 데이터 처리 단계 없이 데이터 파이프라인의 모든 위치에서 해결할 수 있습니다.
Athena Query Federation SDK를 사용하여 Java로 UDF를 작성할 수 있습니다. Athena 쿼리에 UDF를 사용하는 경우 UDF는 AWS Lambda를 통해 실행됩니다. SQL 쿼리의 SELECT 및 FILTER 절에 UDF를 사용할 수 있으며 동일한 쿼리에 여러 UDF를 사용할 수 있습니다. Amazon Athena 사용자는 Athena 콘솔, API 및 JDBC/ODBC 드라이버에서 UDF를 활용할 수 있습니다.
Amazon Athena용 UDF를 통해 사용자는 AWS 서비스 및 독점 애플리케이션으로 지원되는 기능 또는 API를 활용할 수도 있습니다. 예를 들어 분석가는 제품 후기 데이터로 작업할 때 한 언어의 제품 후기를 다른 언어로 번역해야 할 수 있습니다. UDF가 없다면 데이터를 번역 서비스로 내보낸 후 나중에 다시 가져오는 작업을 수행해야 할 수 있습니다. Amazon Athena UDF를 통해 이러한 작업과 다른 사용 사례를 간소화하는 방법을 알아보려면 Translate and analyze text using SQL functions with Amazon Athena, Amazon Translate, and Amazon Comprehend를 참조하세요. AWS YouTube 채널에서 동영상 자습서를 시청할 수도 있습니다.
Amazon Athena에서 UDF를 시작하려면 다음 리소스를 참조하세요.
- Athena 설명서 사용자 정의 함수를 사용한 쿼리
- Athena Query Federation SDK를 사용하여 자체 함수를 작성하는 방법을 알아보려면 Lambda를 사용하여 UDF 생성 및 배포 참조
- UDF 구현 예제는 GitHub에서 Amazon Athena UDF Connector 참조