Новые возможности

Ознакомьтесь с нашими публикациями о новых возможностях, чтобы узнать о последних анонсах для Amazon Redshift и Redshift Spectrum.

Требуется помощь в создании опытного образца?

Если вы используете Amazon Redshift для создания опытного образца решения, рекомендуем ознакомиться с документом Building a Proof of Concept for Amazon Redshift. Запросить поддержку при создании опытного образца можно по ссылке.

Документация

Руководство по началу работы. Знакомство с Amazon Redshift, помощь в настройке аккаунта, простой пример первого использования Amazon Redshift. Советы и ссылки на расширенные возможности и полезные ресурсы. HTML | PDF | Kindle

Руководство по управлению кластером Amazon Redshift. Создание кластеров Amazon Redshift и управление ими. HTML | PDF | Kindle

Руководство разработчика БД Amazon Redshift. Проектирование, создание и обслуживание баз данных в собственном хранилище данных, а также выполнение запросов к ним. В руководство включен синтаксис команд и функций SQL для Amazon Redshift. HTML | PDF

Справочное руководство по API Amazon Redshift. Подробное описание всех операций API для Amazon Redshift. Образцы запросов, ответов и ошибок для поддерживаемых протоколов веб-сервисов. HTML | PDF

Руководство по интерфейсу командной строки Amazon Redshift. Подробное описание интерфейса командной строки для Amazon Redshift. Базовый синтаксис каждой команды, ее параметры и примеры использования. HTML

Рекомендации

Загрузка данных. Эффективная загрузка данных с помощью команд COPY, пакетной вставки и промежуточных таблиц. Подробнее »

Проектирование схемы хранилища данных. Проектирование базы данных с низкими требованиями к оперативной памяти и объему хранилища, высокой производительностью запросов и минимальным количеством операций ввода-вывода. Подробнее »

Настройка производительности запросов. Советы по настройке запросов для достижения максимальной производительности. Подробнее »

Скрипты и инструменты для настройки и управления

Административные скрипты Amazon Redshift

SQL-скрипты для выполнения диагностики кластера Amazon Redshift с использованием системных таблиц. Загрузить здесь »

Список скриптов:

  • top_queries.sql – возвращает 50 команд, выполнение которых заняло наиболее продолжительное время, за последние 7 дней;
  • perf_alerts.sql – возвращает основные предупреждения вместе с результатами сканирования таблиц;
  • filter_used.sql – возвращает фильтр, применяемый к таблицам при сканировании, для помощи при выборе ключа сортировки;
  • commit_stats.sql – показывает сведения о потреблении ресурсов кластера при выполнении операций подтверждения записи;
  • current_session_info.sql – показывает сведения о сеансах, в которых в данный момент выполняются запросы;
  • missing_table_stats.sql – показывает планы EXPLAIN, в которых используемые таблицы помечены флагом «статистика отсутствует»;
  • queuing_queries.sql – выводит список запросов в очереди к слоту запросов WLM;
    table_info.sql – возвращает сведения о хранении таблицы на диске (размер, асимметрия и т. д.).

Административные представления SQL

Представления SQL для управления кластером Amazon Redshift и создания языка описания схем (DDL). Во всех представлениях предполагается наличие схемы с именем Admin. Загрузить здесь »

Список представлений:

  • v_check_data_distribution.sql – получить распределение данных по уровням;
  • v_constraint_dependency.sql – получить ограничения внешнего ключа при работе с несколькими таблицами;
  • v_generate_group_ddl.sql – создать DDL для группы;
  • v_generate_schema_ddl.sql – создать DDL для схем;
  • v_generate_tbl_ddl.sql – создать DDL для таблицы, включая ключ распределения, ключ сортировки и ограничения;
  • v_generate_unload_copy_cmd.sql – сгенерировать команды экспорта и копирования объекта;
  • v_generate_user_object_permissions.sql – создать DDL для определения прав доступа пользователей к таблицам и представлениям;
  • v_generate_view_ddl.sql – создать DDL для представления;
  • v_get_obj_priv_by_user.sql – получить таблицы и представления, к которым пользователь имеет доступ;
  • v_get_schema_priv_by_user.sql – получить схему, к которой пользователь имеет доступ;
  • v_get_tbl_priv_by_user.sql – получить таблицы, к которым пользователь имеет доступ;
  • v_get_users_in_group.sql – получить всех пользователей, входящих в группу;
  • v_get_view_priv_by_user.sql – получить представления, к которым пользователь имеет доступ;
  • v_object_dependency.sql – объединить различные представления зависимостей;
  • v_space_used_per_tbl.sql – получить сведения о занимаемом месте для каждой таблицы;
  • v_view_dependency.sql – получить имена представлений, зависящих от других таблиц или представлений;
  • v_check_transaction_locks.sql – получить сведения о блокировках, существующих для открытых транзакций;
  • v_check_wlm_query_time.sql – получить время ожидания и выполнения WLM за последние 7 дней;
  • v_check_wlm_query_trend_daily.sql – получить количество запросов WLM, а также время ожидания и выполнения по дням;
  • v_check_wlm_query_trend_hourly.sql – получить количество запросов WLM, а также время ожидания и выполнения по часам;
  • v_generate_cancel_query.sql – создать запрос отмены;
  • v_get_cluster_restart_ts.sql – получить дату и время последнего перезапуска кластера;
  • v_get_vacuum_details.sql – получить сведения об очистке.

Утилита кодирования столбцов

Позволяет определить оптимальное сжатие для данных Amazon Redshift. Загрузить здесь »

Сервисная программа экспорта и копирования

Позволяет без труда переносить данные между таблицами Amazon Redshift, которые могут находиться в разных базах данных, кластерах или регионах. Все данные при экспорте шифруются с помощью сервиса AWS Key Management Service (KMS). Эту программу можно использовать в качестве дополнения к конвейеру данных AWS Data Pipeline для регулярного перемещения данных между системами, например тестовой и рабочей, или обслуживания копий только для чтения в других кластерах. Загрузить здесь »

Возможности и инструменты, созданные сообществом

Аналитические и административные инструменты

Простота

Распространенные пользовательские функции (UDF). Набор UDF, полезных для каждого. Предоставлено компанией Periscope. Подробнее » | Загрузить здесь »

Инструмент ETL для Amazon Redshift от Yelp. Mycroft от компании Yelp предназначен для автоматизации загрузки данных в Amazon Redshift. Подробнее см. в этой публикации в блоге. Загрузить здесь »

Платформа для разработки пользовательских функций. В целях упрощения разработки компания Periscope Data разработала систему для управления пользовательскими функциями (UDF) и их тестирования. Предоставлено компанией Periscope Data. Загрузить здесь »

re:Dash. Бесплатная платформа для совместной работы и визуализации данных с открытым исходным кодом, созданная для быстрого и удобного доступа к миллиардам записей. Возможности платформы включают браузер схем, улучшенное планирование, автозаполнение, а также возможность составления запросов на языке Python. Предоставлено компанией Everything.me. Загрузить здесь »

Административная панель управления Amazon Redshift от EverythingMe. Удобный и понятный инструмент для мониторинга выполняемых запросов, очередей WLM, а также таблиц и схем. Предоставлено компанией EverythingMe. Загрузить здесь »

Библиотека Spark-Redshift. Эта библиотека предназначена для загрузки данных из Amazon Redshift в Apache Spark SQL DataFrames и записи данных из Apache Spark обратно в Amazon Redshift. Удачный пример загрузки данных в формате AVRO в Amazon Redshift. Предоставлено компанией Swiftkey. Загрузить здесь »

Статьи из блогов

В наших блогах опубликован широкий перечень статей, в которых содержатся примеры использования и рекомендации, призванные помочь в использовании сервиса Amazon Redshift с максимальной эффективностью. Полный перечень статей в блогах см. в перечисленных ниже ресурсах.

Статьи, посвященные Amazon Redshift, в блоге AWS News.

Рекомендации, описания функциональных возможностей и примеры использования клиентами в блоге AWS Big Data.

Сведения о миграции из локального хранилища данных в Amazon Redshift и другая информация в блоге AWS Databases.

Вебинары

Intro to Amazon Redshift Spectrum: Now Query Exabytes of Data in S3

Redshift Spectrum расширяет возможности Amazon Redshift, позволяя использовать сервис для выполнения запросов не только к хранилищу данных, но и к данным, хранящимся в Amazon S3. Можно выполнять запросы к данным S3 и объединять данные из S3 и Redshift для получения уникальной аналитической информации, которую невозможно получить из отдельных хранилищ данных.

Serverless Analytics – Amazon Redshift Spectrum, AWS Glue, and Amazon QuickSight

Узнайте, как создать бессерверное решение для анализа больших данных с помощью Amazon Redshift Spectrum, AWS Glue и Amazon QuickSight без необходимости инвестировать в базы данных, хранилища данных, сложные решения ETL и приложения бизнес-аналитики.

Analyze your Data Lake, Fast @ Any Scale

Узнайте, как выполнять SQL-запросы к данным открытых форматов в Amazon S3, а также к данным в хранилище данных Amazon Redshift. Кроме того, мы покажем, как анализировать данные в озере данных и хранилище данных любого масштаба, от гигабайтов до эксабайтов, для быстрого получения результатов.

Оставайтесь в курсе дел с вебинарами AWS.

Избранные семинары с мероприятий

Migrating Your Traditional Data Warehouse to a Modern Data Lake (ABD327)

Узнайте о последних улучшениях в области доступности, производительности и управления, а затем посмотрите презентацию компании 21st Century Fox о миграции из локального хранилища данных в озеро данных на базе Amazon Redshift.

Developing an Insights Platform – Sysco’s Journey from Disparate (ABD303)

Узнайте, как отдел бизнес-аналитики компании Sysco создал озеро данных с масштабируемыми аналитическими и поисковыми ядрами на основе сервисов AWS, включая Amazon Redshift Spectrum, Amazon S3, Amazon EMR, AWS Glue, Amazon Elasticsearch Service и другие.

Best Practices for Data Warehousing with Amazon Redshift & Redsh (ABD304)

Ознакомьтесь с подробным разбором возможностей современных хранилищ данных для анализа всех данных как внутри, так и за пределами хранилища данных без необходимости их перемещения. Изучите рекомендации по проектированию оптимальных схем, эффективной загрузке данных и оптимизации запросов для обеспечения высокой пропускной способности и производительности.

Self-Service Analytics with AWS Big Data and Tableau (ARC217)

Узнайте, как отдел бизнес-аналитики по международным платежам компании Expedia с нуля спроектировал и создал комплексное облачное решение для витрины данных, используя AWS и Tableau Online. Ознакомьтесь с рекомендациями, методами оптимизации и полезными выводами, которые можно извлечь из этого проекта.

Migrating Databases and Data Warehouses to the Cloud (DAT317)

Узнайте, как легко и безопасно перенести данные и код на языке процедурного программирования из существующих баз данных и хранилищ данных в Amazon Redshift и другие сервисы AWS с помощью AWS Database Migration Service (AWS DMS) и AWS Schema Conversion Tool (AWS SCT).

GPS: Optimizing Tips: Amazon Redshift for Cloud Data Warehousing (GPSTEC315)

Ознакомьтесь с советами и методиками по оптимизации развертывания Amazon Redshift, эффективному масштабированию и экономичному удовлетворению растущих потребностей хранилища данных.

Подробнее о ценах на Amazon Redshift

Перейти на страницу цен
Готовы приступить?
Начало работы с Amazon Redshift
Есть вопросы?
Свяжитесь с нами