Amazon Redshift 클러스터를 생성하고 관리하는 방법을 보여줍니다.  HTML | PDF | Kindle

데이터 웨어하우스를 구성하는 데이터베이스를 설계, 구축, 쿼리 및 유지 관리하는 방법을 설명합니다. Amazon Redshift SQL 명령 및 함수에 대한 구문도 포함되어 있습니다.  HTML | PDF

Amazon Redshift에 대한 모든 API 작업을 자세히 설명합니다. 또한, 지원되는 웹 서비스 프로토콜에 대한 샘플 요청, 응답 및 오류도 제공합니다.  HTML | PDF

Amazon Redshift에 대한 명령줄 인터페이스를 자세히 설명합니다. 각 명령에 대한 기본 구문, 옵션, 사용 예를 제공합니다.  HTML


Amazon Redshift의 데이터 로딩과 쿼리 성능 최적화에 대한 모범 사례를 다루는 AWS 웹캐스트.  동영상 파트 1 보기 | 동영상 파트 2 보기

COPY 명령, 대량 삽입 및 준비 테이블을 사용하여 효율적으로 데이터를 로드합니다.  자세히 알아보기 »

쿼리 성능을 높이고, 스토리지 및 메모리 요구 사항을 낮추고, I/O 작업을 최소화하도록 데이터베이스를 설계합니다.  자세히 알아보기 »

이러한 팁과 전술을 사용하여 최대 성능을 내도록 쿼리를 튜닝합니다.  자세히 알아보기 »


시스템 테이블을 사용하여 Amazon Redshift 클러스터에 대한 진단을 실행하기 위한 SQL 스크립트.  여기에서 다운로드 »

스크립트 목록:

  • top_queries.sql – 지난 7일간 가장 많은 시간이 소요된 상위 50개의 문을 반환
  • perf_alerts.sql – 가장 많이 발생한 알림을 반환, 테이블 스캔과 조인
  • filter_used.sql – 스캔 시 테이블에 적용된 필터를 반환. sortkey 선택에 도움이 됨
  • commit_stats.sql – COMMIT 문을 통한 클러스터 리소스 사용 정보를 표시
  • current_session_info.sql – 현재 쿼리를 실행 중인 세션에 대한 정보 표시
  • missing_table_stats.sql – 기본 테이블에 "통계 누락"으로 플래그 지정된 EXPLAIN 플랜 표시
  • queuing_queries.sql – WLM 쿼리 슬롯에 대기 중인 쿼리 나열
  • table_info.sql – 테이블 스토리지 정보 반환(크기, 스큐 등)

Amazon Redshift 클러스터 관리와 스키마 DDL 생성을 위한 SQL 보기. 모든 보기에서는 사용자가 관리자라는 스키마를 가지고 있는 것으로 가정합니다.  여기에서 다운로드 »

보기 목록:

  • v_check_data_distribution.sql – 슬라이스 전체의 데이터 배포 가져오기
  • v_constraint_dependency.sql – 테이블 간의 외래 키 제약 조건 가져오기
  • v_generate_group_ddl.sql – 그룹용 DDL 가져오기
  • v_generate_schema_ddl.sql – 스키마용 DDL 가져오기
  • v_generate_tbl_ddl.sql – distkey, sortkey 및 제약 조건이 포함된, 테이블용 DDL 가져오기
  • v_generate_unload_copy_cmd.sql – 객체에 대한 unload 및 copy 명령 생성
  • v_generate_user_object_permissions.sql – 사용자의 테이블 및 보기에 대한 권한용 DDL 가져오기
  • v_generate_view_ddl.sql – 보기용 DDL 가져오기
  • v_get_obj_priv_by_user.sql – 사용자가 액세스 권한이 있는 테이블/보기 가져오기
  • v_get_schema_priv_by_user.sql – 사용자가 액세스 권한이 있는 스키마 가져오기
  • v_get_tbl_priv_by_user.sql – 사용자가 액세스 권한이 있는 테이블 가져오기
  • v_get_users_in_group.sql – 그룹의 모든 사용자 가져오기
  • v_get_view_priv_by_user.sql – 사용자가 액세스 권한이 있는 보기 가져오기
  • v_object_dependency.sql – 다양한 종속성 보기를 함께 병합
  • v_space_used_per_tbl.sql – 테이블당 사용된 공간 가져오기
  • v_view_dependency.sql – 다른 테이블/보기에 종속된 보기의 이름 가져오기
  • v_check_transaction_locks.sql – 열려 있는 트랜잭션에서 유지하고 있는 잠금에 대한 정보 가져오기
  • v_check_wlm_query_time.sql – 지난 7일간 WLM 대기 시간과 실행 시간 가져오기
  • v_check_wlm_query_trend_daily.sql – 일별 WLM 쿼리 수, 대기 시간, 실행 시간 가져오기
  • v_check_wlm_query_trend_hourly.sql – 시간별 WLM 쿼리 수, 대기 시간, 실행 시간 가져오기
  • v_generate_cancel_query.sql – 취소 쿼리 가져오기
  • v_get_cluster_restart_ts.sql – 클러스터가 최근에 다시 시작된 날짜/시간 가져오기
  • v_get_vacuum_details.sql – vacuum 세부 정보 가져오기

이 유틸리티로 Amazon Redshift 데이터에 최적인 압축을 결정합니다.  여기에서 다운로드 »

다른 데이터베이스, 클러스터 또는 리전에 있을 수 있는 2개의 Amazon Redshift 테이블 간에 데이터를 손쉽게 마이그레이션합니다. 모든 내보낸 데이터는 AWS Key Management Service(KMS)로 암호화됩니다. 이 유틸리티로 AWS Data Pipeline을 보완하여, 시스템 간(예: 프로덕션과 테스트 시스템 간)에 데이터를 정기적으로 이동하는데 또는 다른 클러스터에 읽기 전용 복사본을 유지 관리하는 데 사용할 수 있습니다.  여기에서 다운로드 »


일반 사용자 정의 함수(UDF). 누구나 사용할 수 있는 유용한 UDF 모음. Periscope에서 제공.  자세히 알아보기 » | 여기에서 다운로드 »

UDF 개발을 위한 프레임워크. 개발의 편의를 위해 Periscope에서 UDF 관리 및 테스트를 위한 프레임워크를 구축했습니다. Periscope에서 제공.  여기에서 다운로드 »

re:Dash. 수십억 개의 레코드에 빠르고 쉽게 액세스할 수 있도록 구축된 무료 오픈 소스 데이터 협업 및 시각화 플랫폼. 스키마 브라우저, 향상된 일정 관리, 자동 완성 및 Python 쿼리 작성 기능을 제공합니다. Everthing.me에서 제공.  여기에서 다운로드 »

EverythingMe의 Amazon Redshift 관리자 대시보드. 이 사용자 친화적인 도구로 실행 중인 쿼리, WLM 대기열 및 테이블/스키마를 모니터링하십시오. EverythingMe에서 제공.  여기에서 다운로드 »

Yelp의 Amazon Redshift용 ETL 도구. Yelp의 Mycroft를 사용하여 데이터를 자동으로 Amazon Redshift로 로드할 수 있습니다. 자세한 내용은 이 블로그 게시물을 참조하십시오.  여기에서 다운로드 »

Spark-Redshift 라이브러리. 이 라이브러리를 사용하면 Amazon Redshift에서 Apache Spark SQL DataFrames로 데이터를 로드하고 Apache Spark에서 다시 Amazon Redshift로 데이터를 쓸 수 있습니다. Amazon Redshift와 함께 AVRO 수집을 사용한 좋은 예입니다. Swiftkey에서 제공.  여기에서 다운로드 »


Amazon Redshift를 최대한 활용하는 데 도움이 되는 사용 사례 및 모범 사례 지침을 제공하는 많은 블로그 기사들이 있습니다. 여기서 전체 블로그 기사 목록에 액세스하십시오.