Amazon Aurora – это сервис реляционных баз данных, совмещающий в себе скорость и доступность лучших коммерческих баз данных с простотой и экономичностью баз данных с открытым исходным кодом. Ядро Amazon Aurora полностью совместимо с MySQL и PostgreSQL, поэтому для работы с существующими приложениями и инструментами не потребуется вносить изменения.

Высокая производительность и масштабируемость

В пять раз быстрее БД MySQL и в три раза быстрее БД PostgreSQL

Тестирование с использованием стандартных тестов, таких как SysBench, показало результаты производительности, превышающие результаты MySQL в пять раз, а PostgreSQL – в три раза на аналогичном оборудовании. В Aurora используются различные программные и аппаратные методики, чтобы гарантировать, что ядро базы данных будет в полной мере использовать все доступные вычислительные ресурсы, память и сеть. Операции ввода‑вывода используют методы распределенных систем, например кворумы, для стабилизации производительности.

Бессерверная конфигурация

Бессерверная конфигурация Amazon Aurora – это доступная по требованию конфигурация сервиса Amazon Aurora с автоматическим масштабированием, при использовании которой база данных автоматически запускается, отключается и масштабирует свои ресурсы в зависимости от текущих потребностей приложения. Бессерверная конфигурация Aurora позволяет запускать базы данных в облаке без самостоятельного управления инстансами. Также вы можете использовать бессерверные инстансы Aurora v2 вместе с предоставленными инстансами в существующих или новых кластерах баз данных.

Простота масштабирования вычислительных ресурсов

С помощью API Службы реляционных баз данных Amazon (Amazon RDS) или Консоли управления AWS можно масштабировать выделенные инстансы, сокращая или расширяя развертывание. Масштабирование вычислительных ресурсов, как правило, занимает лишь несколько минут.

Автомасштабирование хранилища

Aurora автоматически масштабирует операции ввода-вывода в соответствии с потребностями самых требовательных приложений, а также увеличивает размер тома базы данных по мере роста потребностей в объеме хранилища. Объем тома увеличивается до 128 ТиБ с шагом 10 ГБ. Выделять избыточный объем хранилища на случай увеличения базы данных в будущем не требуется. Если вы используете оптимизированную для ввода-вывода конфигурацию Amazon Aurora для кластеров баз данных, Aurora также обеспечивает экономию затрат до 40 %, если затраты на ввод-вывод превышают 25 % расходов на базу данных Aurora. Чтобы узнать больше, посетите эту страницу.

Реплики чтения с небольшой задержкой

Для обработки большого количества запросов со стороны приложений вы можете увеличить пропускную способность чтения путем создания до 15 реплик базы данных Amazon Aurora. Реплики Aurora используют то же самое базовое хранилище, что и исходный инстанс, что позволяет уменьшить затраты и избавляет от необходимости производить операции записи на узлах реплики. В результате высвобождается дополнительная вычислительная мощность для обслуживания запросов чтения, а интервал задержки реплики в миллисекундах снижается, часто до однозначных чисел. Aurora предоставляет адрес для чтения, к которому приложения могут подключаться без отслеживания добавления и удаления конкретных реплик. Сервис также поддерживает автоматическое масштабирование, добавление и удаление реплик в ответ на указанные вами изменения метрик производительности. Дополнительные сведения см. в разделе Использование автомасштабирования Amazon Aurora с репликами Aurora.

Aurora поддерживает межрегиональные реплики чтения. Межрегиональные реплики обеспечивают пользователям быструю скорость локального чтения. Для каждого региона можно создать 15 дополнительных реплик Aurora для дальнейшего масштабирования локального чтения. Подробности см. в Глобальной базе данных Amazon Aurora.

Пользовательские адреса базы данных

Пользовательские адреса позволяют распределять и осуществлять балансировку рабочих нагрузок в разных наборах инстансов базы данных. Например, набору реплик Aurora можно назначить использование типа инстанса с высоким объемом памяти, что позволит запустить аналитическую рабочую нагрузку. Пользовательский адрес поможет направить рабочую нагрузку к настроенным соответствующим образом инстансам и при этом изолировать от нее остальные инстансы.

Оптимизированное чтение Aurora для Aurora PostgreSQL

Оптимизированное чтение Amazon Aurora – это новая функция по соотношению цены и производительности, которая позволяет сократить время ожидания запросов до 8 раз и снизить затраты до 30 % по сравнению с инстансами без нее. Она идеально подходит для приложений с большими наборами данных, объем которых превышает объем памяти инстанса базы данных.

В инстансах оптимизированного чтения используется локальное блочное хранилище SSD на базе NVMe, доступное в инстансах r6gd на базе Graviton и r6id на базе Intel. Это позволяет сократить время ожидания запросов приложений с наборами данных, объем которых превышает объем памяти инстанса базы данных. Оптимизированное чтение включает такие улучшения производительности, как многоуровневое кэширование и временные объекты, позволяющие максимально эффективно использовать инстансы базы данных.

Благодаря уменьшению задержки запросов до 8 раз вы можете эффективно выполнять рабочие нагрузки, требующие большого количества операций чтения и ввода-вывода, такие как операционные панели управления, обнаружение аномалий и поиск сходств, с помощью pgvector. Оптимизированное чтение Amazon Aurora PostgreSQL с помощью pgvector до 9 раз увеличивает количество запросов в секунду для векторного поиска при рабочих нагрузках, превышающих доступную память инстанса. Оптимизированное чтение доступно в версии Aurora, совместимой с PostgreSQL.

Параллельный запрос Aurora для Aurora MySQL

Параллельный запрос Amazon Aurora обеспечивает более быстрое выполнение аналитических запросов по тем же данным. Данная возможность может ускорить выполнение запросов до двух порядков, одновременно поддерживая высокую производительность при выполнении основных транзакционных рабочих нагрузок. Перенаправляя обработку запроса на уровень хранилища Aurora, Parallel Query значительно повышает вычислительную мощность, сокращая при этом объем сетевого трафика. Используйте возможность Parallel Query для одновременного выполнения транзакционных и аналитических рабочих нагрузок на одной базе данных Aurora. Возможность параллельного запроса доступна для версии Aurora, совместимой с MySQL.

Диагностика и устранение узких мест производительности с помощью Amazon DevOps Guru для RDS

Amazon DevOps Guru – это сервис облачных операций на основе машинного обучения, которая помогает повысить доступность приложения. Amazon DevOps Guru для RDS позволяет использовать аналитические данные, полученные с помощью машинного обучения, для быстрого обнаружения и диагностики проблем, связанных с производительностью реляционной базы данных. Благодаря этому сервису время устранения таких проблем сокращается с нескольких дней до нескольких минут. Разработчики и специалисты DevOps могут с помощью DevOps Guru для RDS автоматически диагностировать основную причину проблем с производительностью и получать обоснованные рекомендации для устранения этих проблем, не обращаясь за помощью к экспертам по базам данных.

Чтобы начать работу, просто перейдите в консоль управления Amazon RDS и включите Аналитику производительности Amazon RDS. После включения Аналитики производительности перейдите в консоль Amazon DevOps Guru и включите применение сервиса для ресурсов Aurora, других поддерживаемых ресурсов или для всего аккаунта сразу.

Высокая доступность и надежность

Мониторинг и восстановление инстансов

Amazon RDS постоянно следит за состоянием базы данных Amazon Aurora и базового инстанса Эластичного вычислительного облака Amazon (Amazon EC2). В случае сбоя базы данных Amazon RDS автоматически перезапустит базу данных и связанные с ней процессы. Aurora при восстановлении после сбоев не требует воспроизведения журналов повтора базы данных, значительно сокращая время перезапуска. Кроме того, в Amazon Aurora буферный кэш изолирован от собственных процессов базы данных, благодаря чему он сохраняется при перезагрузке.

Развертывания в нескольких зонах доступности с использованием реплик Aurora

В Aurora применяется технология Развертывание Amazon RDS в нескольких зонах доступности для автоматического аварийного переброса сервиса при отказе инстанса на одну из реплик Aurora (которых может быть до 15), созданных в любых трех зонах доступности. При отсутствии реплик Aurora в случае сбоя RDS автоматически попытается создать новый инстанс базы данных. Сократите время простоя до минимума, заменив драйверы сообщества для MySQL и PostgreSQL драйверами AWS JDBC Driver для MySQL и AWS JDBC Driver для PostgreSQL с открытым исходным кодом, совместимыми с заменой. Также можно использовать Прокси-сервер RDS для сокращения времени обработки отказа и повышения доступности. При обработке отказа Прокси-сервер Amazon RDS направляет запросы непосредственно новому инстансу базы данных, сокращая время обработки отказа на 66 % и при этом сохраняя подключения приложений.

Aurora Global Database

Для глобально распределенных приложений можно использовать глобальную базу данных Aurora, где одна база данных Aurora может охватывать несколько регионов AWS. Это позволяет обеспечить высокую скорость локального чтения и быстро выполнять аварийное восстановление. Глобальная база данных Aurora использует репликацию на основе хранилища, реплицируя базу данных в нескольких регионах при задержке менее одной секунды. Вторичный регион можно использовать в качестве резервного варианта, если понадобится быстро провести восстановление после регионального снижения производительности или сбоя. Базу данных вторичного региона можно назначить для полных рабочих нагрузок чтения и записи быстрее, чем за минуту. Дополнительные сведения см. в разделе Использование Глобальных баз данных Amazon Aurora.

Отказоустойчивое и самовосстанавливающееся хранилище

Том хранилища базы данных Aurora сегментирован на блоки по 10 ГБ и реплицирован в трех зонах доступности, причем во всех зонах хранится по 2 копии каждой записи. Хранилище Aurora обладает отказоустойчивостью и автоматически обрабатывает потерю до двух копий данных без снижения доступности базы данных для операций записи и до трех копий – без снижения доступности для операций чтения. Хранилище Aurora самостоятельно поддерживает свою работоспособность; блоки данных и диски постоянно проверяются на наличие ошибок и автоматически заменяются.

Непрерывные автоматические инкрементные резервные копии и восстановление на момент времени

Функциональные возможности резервного копирования в Aurora обеспечивают восстановление инстанса на момент времени. Это позволяет восстановить базу данных на любой момент периода хранения (до секунды) до последних пяти минут использования. Настраиваемый период хранения автоматически созданных резервных копий может составлять до 35 дней. Автоматические резервные копии сохраняются в Простом сервисе хранения данных Amazon (Amazon S3), рассчитанном на надежность хранения на уровне 99,999999999 %. Резервное копирование в Aurora выполняется автоматически, инкрементно и непрерывно, а потому не отражается на производительности базы данных.

Снимки состояния БД

Снимки состояния БД – это инициированные пользователем резервные копии инстанса, хранимые в Amazon S3 до момента их намеренного удаления пользователем. Они используют автоматизированные инкрементные снимки состояния для ускорения создания и уменьшения требований к хранилищу. Из снимка состояния БД можно в любой момент создать новый инстанс.

Backtrack для Aurora MySQL

Возможность Backtrack позволяет быстро вернуть базу данных в состояние на прошедший момент времени без необходимости восстановления данных из резервной копии. Это позволяет быстро исправлять ошибки пользователей, такие как ошибочное удаление таблицы или отдельной строки. Когда возможность Backtrack включена, Aurora сохраняет записи данных в течение настроенного для Backtrack периода. Настройка Backtrack позволяет, к примеру, возвращать базу данных в состояние на любой момент времени из последних 72 часов. Процесс такого возврата занимает несколько секунд даже для больших баз данных, потому что копировать записи данных не требуется. Backtrack позволяет перемещаться назад и вперед по времени, чтобы найти момент непосредственно перед возникшей ошибкой.

Возможность Backtrack также полезна для разработки и тестирования, особенно в ситуациях, когда тест удаляет данные или искажает их иным образом. Достаточно вернуться к исходному состоянию базы данных, чтобы выполнить повторный тестовый запуск. Можно создать сценарий, который вызывает Backtrack через API и затем запускает тест. Это обеспечит простоту интеграции процесса в платформу тестирования. Возможность Backtrack доступна для версии Aurora, совместимой с MySQL.

Высокий уровень безопасности

Изолирование сети

Aurora работает в виртуальном частном облаке Amazon (Amazon VPC), что помогает изолировать базу данных в своей собственной виртуальной сети и подключиться к локальной ИТ-инфраструктуре с использованием IPsec VPN со стандартным шифрованием. Подробнее о сервисе реляционных баз данных Amazon в VPC см. в руководстве пользователя Amazon RDS. Кроме того, при использовании Amazon RDS можно настроить параметры брандмауэра и управлять сетевым доступом к инстансам БД.

Разрешения на уровне доступа к ресурсам

Сервис Aurora интегрирован с Управлением идентификацией и пользователями AWS (IAM) и предоставляет возможность управлять действиями пользователей AWS IAM и групп на конкретных ресурсах для Aurora (например, инстансах БД, снимках состояния БД, группах параметров БД, подписках на события БД, группах настроек БД). Кроме того, движок позволяет присваивать теги ресурсам Aurora и управлять действиями пользователей и групп IAM на ресурсах, имеющих общий тег и значение тега. Подробнее об интеграции IAM см. на странице сведений об аутентификации баз данных IAM.

Шифрование

Aurora поддерживает шифрование баз данных с использованием ключей, создаваемых и управляемых с помощью AWS Key Management Service (KMS). В инстансе базы данных Aurora с шифрованием шифруются все данные, хранимые в базовой системе хранения, а также автоматические резервные копии, снимки состояния и реплики чтения в том же кластере. Для защиты передаваемых данных в Aurora используется протокол SSL с шифрованием AES‑256.

Расширенные возможности аудита

Aurora помогает вести журнал событий базы данных с минимальным воздействием на ее производительность. Такие журналы в дальнейшем можно использовать для анализа в целях обеспечения безопасности или соответствия нормативным требованиям, администрирования базы данных, управления ими и т. д. Кроме того, для мониторинга активности можно отправлять журналы аудита в Amazon CloudWatch.

Защита Amazon GuardDuty для RDS

Amazon GuardDuty обеспечивает обнаружение угроз для Aurora и помогает выявлять потенциальные угрозы для данных, которые хранятся в базах данных Aurora. GuardDuty RDS Protection создает профили и следит за действиями при входе в имеющиеся и новые базы данных в вашем аккаунте, а также с помощью специальных моделей МО точно выявляет подозрительные входы в базы данных Aurora. При обнаружении потенциальной угрозы GuardDuty генерирует нарушение безопасности со сведениями о базе данных и подробной информацией о контексте подозрительной деятельности. Интеграция Aurora с GuardDuty предоставляет непосредственный доступ к журналам событий баз данных без необходимости в их изменении и не снижает производительность баз данных.

Экономичность

Оплата по факту использования

Предварительные обязательства касательно Aurora отсутствуют. Вы платите почасово за каждый запущенный инстанс, а когда закончите работу с инстансом БД Aurora, то можете удалить его. Необходимости выделять избыточный объем хранилища нет, поэтому оплате подлежит только тот, который фактически используется. Более подробные сведения см. на странице цен на Aurora.

Предсказуемые цены в любом масштабе

Aurora позволяет оптимизировать расходы на базу данных, выбрав один из двух вариантов конфигурации в зависимости от ваших потребностей в соотношении цены и производительности и предсказуемости цены, независимо от потребления операций ввода-вывода вашим приложением. Два варианта конфигурации: оптимизированная для ввода-вывода Aurora и стандартная конфигурация Aurora. Ни один из вариантов не требует предварительного выделения ресурсов ввода-вывода или хранения, и оба могут масштабировать ввод-вывод для обеспечения работы самых требовательных приложений.

Оптимизированная для ввода-вывода конфигурация Aurora – это конфигурация кластера баз данных. Она обеспечивает более высокую ценовую эффективность для клиентов, использующих интенсивные операции ввода-вывода, например, в системах обработки платежей, электронной коммерции и финансовых приложениях. Если затраты на операции ввода-вывода превышают 25 % от общих расходов на базу данных Aurora, вы можете сэкономить до 40 % на рабочих нагрузках с большим количеством операций ввода-вывода с помощью оптимизированной для ввода-вывода конфигурации Aurora. Используя оптимизированную для ввода-вывода конфигурацию Aurora, вы платите за инстансы и хранилище баз данных. Плата за операции ввода-вывода при чтении и записи не взимается, что обеспечивает предсказуемость цен для всех приложений независимо от непостоянства данных ввода-вывода.

Стандартная конфигурация Aurora – это конфигурация кластера баз данных, которая предлагает экономически эффективную цену для абсолютного большинства приложений с низким или умеренным количеством операций ввода-вывода. Используя стандартную конфигурацию Aurora, вы платите за инстансы баз данных, хранилище и операции ввода-вывода с оплатой по запросу.

Оптимизация затрат на операции ввода‑вывода

Затраты на ввод-вывод составляют значительную часть стоимости базы данных аналитического приложения с интенсивной нагрузкой. Операции ввода‑вывода в Amazon Aurora – это операции, которые выполняются ядром БД Aurora при обращении к уровню виртуализированного хранилища, построенного на базе твердотельных накопителей. Каждая операция чтения страницы базы данных считается за одну операцию ввода‑вывода. Ядро базы данных Aurora отправляет операции чтения на уровень хранилища для извлечения страниц базы данных, отсутствующих в буферном кэше. Каждая страница базы данных занимает 8 КБ в версии Aurora, совместимой с PostgreSQL, или 16 КБ в версии Aurora, совместимой с MySQL.

Aurora была разработана для устранения излишних операций ввода‑вывода, что позволяет снизить издержки и обеспечить доступность ресурсов для обслуживания трафика чтения/записи. Операции ввода-вывода потребляются только при отправке записей журнала транзакций на уровень хранилища для постоянного хранения. Операции ввода-вывода при записи исчисляются в единицах по 4 КБ. Например, запись журнала транзакций размером 1,024 байта считается одной операцией ввода‑вывода. При этом ядро базы данных Aurora может создавать пакеты из параллельных операций записи с журналами транзакций менее 4 КБ в целях оптимизации потребления ресурсов ввода‑вывода. В отличие от традиционных ядер базы данных, Aurora никогда не отправляет измененные страницы базы данных на уровень хранилища для еще большей экономии ресурсов ввода‑вывода.

Объем операций ввода‑вывода, потребляемых инстансом Aurora, можно узнать в Консоли управления AWS. Чтобы найти объем потребляемых ресурсов ввода‑вывода, перейдите в раздел консоли RDS, найдите свой список инстансов, выберите в нем инстансы Aurora, а затем посмотрите на показатели «Billed read operations» (Оплачиваемые операции чтения) и «Billed write operations» (Оплачиваемые операции записи) в разделе мониторинга.

При настройке кластеров баз данных на стандартную конфигурацию Aurora взимается плата за операции ввода-вывода для чтения и записи. При настройке кластеров баз данных на оптимизированную для ввода-вывода конфигурацию Aurora плата за операции ввода-вывода для чтения и записи не взимается. Дополнительные сведения о ценах на операции ввода-вывода см. на странице цен Amazon Aurora.

Соотношение цены и качества благодаря оптимизированному чтению Aurora для Aurora PostgreSQL

Оптимизированное чтение Aurora для Aurora PostgreSQL предлагает клиентам, которые используют чувствительные к задержкам приложения и большие рабочие наборы, привлекательную альтернативу по соотношению цены и качества, отвечающую требованиям SLA для бизнеса. Кроме того, заказчики могут более гибко расширять свои наборы данных без необходимости часто увеличивать размер инстансов баз данных для расширения объема памяти. Оптимизированное чтение включает такие улучшения производительности, как многоуровневое кэширование и временные объекты.

Многоуровневое кэширование позволяет сократить время ожидания запросов до 8 раз и до 30 % снизить затраты на приложения, требующие большого количества операций чтения и ввода-вывода, таких как операционные панели управления, обнаружение аномалий и поиск векторных сходств. Данные преимущества реализуются благодаря автоматическому переносу данных кэширования из буферного кэша базы данных в памяти в локальное хранилище для ускорения последующего доступа к этим данным. Многоуровневое кэширование доступно только для Aurora PostgreSQL с конфигурацией, оптимизированной для операций ввода-вывода Aurora.

Временные объекты ускоряют обработку запросов, размещая временные таблицы, созданные Aurora PostgreSQL, в локальное хранилище, что повышает производительность запросов, которые включают сортировку, агрегирование хэшей, высоконагруженные соединения и другие операции с интенсивным использованием данных.

Полностью управляемая инфраструктура

Простота использования

Начать работу с Aurora очень просто. Просто запустите новый инстанс БД Aurora через Консоль управления Amazon RDS, один вызов API или CLI. Для инстансов БД Aurora предварительно настроен набор параметров и установок, соответствующих выбранному классу инстанса БД. Можно запустить инстанс БД и подключить приложение. Процесс занимает несколько минут и не требует дополнительной настройки. Группы параметров БД предоставляют возможность точного управления и подробной настройки базы данных.

Мониторинг и метрики

Сервис Aurora без дополнительной платы предоставляет доступ к метрикам Amazon CloudWatch для инстанса БД. В Консоли управления AWS можно просматривать более 20 основных эксплуатационных метрик инстанса БД, включая использование вычислительных ресурсов, памяти и хранилища, пропускную способность запросов, коэффициент попадания в кэш и активные соединения. Можно также использовать расширенный мониторинг для сбора метрик инстанса операционной системы, на котором работает база данных. Можно использовать Аналитику производительности Amazon RDS, средство мониторинга баз данных, которое упрощает обнаружение и исправление проблем с производительностью. На простой панели управления осуществляется визуализация загрузки базы данных. И, наконец, можно использовать Amazon DevOps Guru для RDS для упрощения обнаружения проблем с производительностью, автоматической идентификации исходной причины проблем с производительностью и получения интеллектуальных рекомендаций, которые помогут решить проблему без помощи специалистов по базам данных.

Развертывания Amazon RDS без перерыва в обслуживании

Развертывание Amazon RDS без перерыва в обслуживании позволяет вам проводить обновление баз данных версии Aurora, совместимой с MySQL и Aurora, совместимой с PostgreSQL безопаснее, проще, быстрее и без потери данных. За несколько шагов развертывание Amazon RDS без перерыва в обслуживании создает промежуточную среду, которая является зеркалом рабочей среды, и синхронизирует обе среды с использованием логической репликации. Вы можете вносить изменения, например обновлять основные и дополнительные версии, модифицировать схемы и изменять значения параметров без снижения производительности вашей рабочей нагрузки.

Во время продвижения промежуточной среды развертывание Amazon RDS без перерыва в обслуживании блокирует запись как в среду с новой версией приложения, так и в среду с текущей его версией до завершения переключения. Развертывание Amazon RDS без перерыва в обслуживании использует встроенные ограничения переключения, которые вызывают тайм-аут переключения, если оно занимает больше времени, чем указано в параметре максимально допустимого простоя, выявляет ошибки репликации, проверяет работоспособность инстансов и выполняет другие функции.

Автоматическая установка исправлений ПО

Aurora будет обновлять базу данных до последней версии ПО со всеми установленными исправлениями. Система управления версиями ядра БД позволяет указать в настройках, должны ли в инстансе применяться исправления, и если да, то когда именно. Aurora использует установку исправлений с нулевым временем простоя, если такое возможно. Как только появляется соответствующее временное окно, инстанс обновляется в текущем состоянии, сеансы приложений сохраняются, а механизм базы данных перезапускается в процессе выполнения установки исправления, что приводит лишь к временному снижению пропускной способности (приблизительно на пять секунд).

Оповещения о событиях БД

Aurora может отправлять оповещения о важных событиях баз данных, например о выполнении автоматической обработки отказа, по электронной почте или с помощью SMS. Через Консоль управления AWS или Amazon RDS API можно подписаться более чем на 40 различных событий БД, связанных с базами данных Aurora.

Клонирование базы данных

Aurora поддерживает быстрое и эффективное клонирование. К примеру, клонирование кластеров баз данных объемом в несколько терабайтов занимает лишь пару минут. Клонирование актуально в самых разных ситуациях, включая разработку и тестирование приложений, обновление баз данных и выполнение аналитических запросов. Немедленная доступность данных позволяет значительно ускорить реализацию проектов по разработке и обновлению программного обеспечения, а также повысить точность аналитики.

Клонировать базу данных Aurora можно всего за несколько шагов. При этом плата за хранение данных взимается только в том случае, если вы используете дополнительное место для хранения изменений данных.

Запуск и остановка базы данных

Ручная остановка и запуск базы данных Aurora осуществляется всего за несколько шагов. Это упрощает работу и позволяет использовать Aurora для разработки и тестирования, когда не требуется постоянная работа базы данных. При остановке базы данных данные не удаляются. Дополнительную информацию см. в документации о запуске и остановке.

Интеграции с нулевым использованием ETL НОВИНКА

Интеграция Aurora с Amazon Redshift с нулевым использованием ETL

Интеграция Amazon Aurora с Amazon Redshift с нулевым использованием ETL дает возможность задействовать машинное обучение и функции анализа в реальном времени вместе с Amazon Redshift для обработки петабайтов транзакционных данных из Aurora, устраняя необходимость создавать и обслуживать сложные конвейеры данных, выполняющие операции извлечения, преобразования и загрузки (ETL). Транзакционные данные автоматически и непрерывно реплицируются в течение нескольких секунд после записи в Aurora и легко доступны в Amazon Redshift.

Как только данные станут доступны в Amazon Redshift, вы можете сразу приступить к их анализу и использовать расширенные функции, такие как обмен данными, материализованные представления и машинное обучение Amazon Redshift, для получения целостной и прогнозной информации. Можно консолидировать данные из нескольких кластеров баз данных Aurora и выполнять их репликацию в одно хранилище Amazon Redshift для унифицированной аналитики данных из нескольких приложений и источников. Когда используется и бессерверная конфигурация Aurora, и бессерверный Amazon Redshift, можно генерировать аналитику транзакционных данных в режиме, близком к реальному времени, без необходимости управлять инфраструктурой конвейеров данных. Подробнее см. в документации по интеграции Aurora с нулевым использованием ETL с Amazon Redshift.

Генеративный искусственный интеллект

Aurora предлагает возможности, позволяющие моделям машинного обучения и генеративного искусственного интеллекта работать с данными, хранящимися в Aurora, в режиме реального времени без перемещения данных. В версии Amazon Aurora, совместимой с PostgreSQL, вы можете использовать возможности векторных баз данных для хранения, поиска, индексирования и запроса внедрений машинного обучения с помощью расширения pgvector.

Векторное встраивание – это числовое представление, отражающее семантическое значение контента, такого как текст, изображения и видео. Генеративный искусственный интеллект и другие системы искусственного интеллекта и машинного обучения используют вложения для отражения семантического значения контента, введенного в большую языковую модель (LLM). В базах данных Aurora можно хранить вложения из моделей машинного обучения и искусственного интеллекта, например из Amazon Bedrock и Amazon SageMaker. Ознакомьтесь с нашей документацией о версиях расширений для Aurora PostgreSQL.

Сервис Amazon Aurora PostgreSQL доступен в качестве базы знаний для Amazon Bedrock. Это позволяет подключать частные источники данных вашей организации к базовым моделям (FM) и реализовать на них автоматизированные рабочие процессы генерации ответов, дополненных результатами поиска (RAG). Это сделает модели FM более осведомленными о вашей конкретной области и организации. Ознакомьтесь с нашей документацией о том, как использовать Aurora PostgreSQL в качестве базы знаний для Amazon Bedrock.

Машинное обучение Aurora (Aurora ML) также упрощает добавление прогнозов генеративных моделей искусственного интеллекта в вашу базу данных Aurora. Aurora ML предоставляет модели машинного обучения в виде функций SQL, что позволяет использовать стандартный SQL для вызова моделей машинного обучения, передачи им данных и возврата прогнозов, текстовых сводок или мнений в качестве результатов запроса. С помощью Aurora ML вы можете добавлять новые вложения в базу данных Aurora PostgreSQL с расширением pgvector в режиме реального времени с помощью периодических вызовов модели SageMaker или Amazon Bedrock, которая возвращает последние актуальные вложения.

Поддержка миграции

Миграция баз данных MySQL

Aurora работает со стандартными инструментами импорта и экспорта MySQL. Кроме того, можно просто создать новую базу данных Aurora из снимка состояния БД Amazon RDS для MySQL. Операции по миграции, использующие снимки состояния базы данных, как правило, занимают менее одного часа, однако точное время миграции зависит от объема и формата перемещаемых данных.

В качестве альтернативы Сервис миграции баз данных AWS (AWS DMS) предлагает встроенные нативные инструменты из консоли DMS для беспроблемного перехода. Если нет необходимости выделять или масштабировать инстансы репликации, вы можете начать миграцию базы данных несколькими щелчками мыши и платить только за использованное время на почасовой основе.

Кроме того, можно самостоятельно настроить репликацию на основе бинарных логов между версией базы данных Aurora, совместимой с MySQL, и внешней базой данных MySQL, работающей в облаке AWS или за его пределами.

Миграция баз данных PostgreSQL

Стандартные инструменты импорта и экспорта PostgreSQL работают с Aurora, включая pg_dump и pg_restore. Также Aurora поддерживает импорт снимков состояния из Amazon RDS для PostgreSQL и репликацию с использованием Сервиса миграции баз данных AWS (AWS DMS).

Миграция коммерческих баз данных

Aurora предоставляет идеальную среду для перемещения рабочих нагрузок баз данных из коммерческих баз данных. Aurora обладает функциональными возможностями, которые близко соответствуют возможностям движков коммерческих баз данных, и обеспечивают производительность, долговечность и высокую доступность на корпоративном уровне, что требуется для большинства рабочих нагрузок корпоративных баз данных. Сервис миграции баз данных AWS (AWS DMS) может помочь ускорить миграцию баз данных в Aurora с помощью таких управляемых функций, как преобразование схемы DMS и бессерверная конфигурация DMS. Преобразование схемы DMS автоматически оценивает и преобразует схемы и исходные объекты для совместимости с целевым кластером Aurora. В то же время Бессерверная конфигурация DMS автоматизирует выделение, мониторинг и масштабирование миграционных ресурсов.

Babelfish для Aurora PostgreSQL

Babelfish для Aurora PostgreSQL – это новая функция версии Aurora, совместимой с PostgreSQL, которая дает Aurora возможность распознавать команды от приложений, написанных для Microsoft SQL Server. С помощью Babelfish Aurora PostgreSQL может понимать проприетарный диалект Microsoft SQL Server T-SQL и поддерживать тот же протокол связи, поэтому ваши приложения, которые были изначально написаны для SQL Server, теперь могут работать с Aurora с меньшим количеством изменений. В результате уходит меньше усилий на изменение и перенос приложений, которые ранее работали на SQL Server 2005 или новее, на Aurora, что означает более быструю и экономичную миграцию с меньшими рисками. Babelfish – это встроенная возможность Aurora, которая не требует дополнительной платы. Включить Babelfish в кластере Aurora можно всего за несколько шагов в консоли RDS.

Производительность разработчика

Надежные языковые расширения для PostgreSQL

Trusted Language Extensions (TLE) для PostgreSQL – это комплект разработчика и проект с открытым исходным кодом, который позволяет быстро создавать высокопроизводительные расширения и безопасно выполнять их в Aurora без необходимости получения сертификата AWS на код. Разработчики могут использовать популярные доверенные языки, например JavaScript, PL/pgSQL, Perl и SQL, для безопасного написания кода расширений. Назначение TLE – предотвращать доступ к небезопасным ресурсам и ограничивать дефекты расширений одним подключением к базе данных. Администраторы баз данных получают возможность для точного онлайн-контроля, что позволяет решать, кому разрешено устанавливать расширения, и могут создать модель разрешений для их запуска. TLE доступны для клиентов Aurora без дополнительной платы.

Машинное обучение Aurora

Aurora предлагает возможности машинного обучения напрямую из базы данных, позволяя добавлять прогнозы на основе машинного обучения к вашим приложениям с помощью знакомого языка программирования SQL. Благодаря простой, оптимизированной и безопасной интеграции сервисов Aurora с машинным обучением AWS вы получаете доступ к множеству алгоритмов машинного обучения без необходимости создавать специальные возможности интеграции или перемещать данные. Подробнее о машинном обучении Aurora.

Прокси-сервер Amazon RDS

Aurora может работать в связке с Прокси-сервером Amazon RDS – полностью управляемым высокодоступным прокси-сервером базы данных, который повышает возможности масштабирования приложений, их безопасность и отказоустойчивость при сбоях в базе данных. RDS Proxy позволяет приложениям объединять подключения в базе данных в пул и предоставлять к ним доступ, улучшая эффективность базы данных и масштабируемость приложений. Он снижает время отказа, автоматически подключаясь к новому инстансу базы данных, при этом сохраняя подключения со стороны приложений. Он повышает безопасность благодаря интеграции с AWS IAM и Менеджером секретов AWS.

API данных

API данных – это простой в использовании и безопасный HTTPS API для выполнения SQL-запросов к базам данных Aurora, который ускоряет разработку современных приложений. API данных решает задачи по настройке сети и приложений, необходимые для безопасного подключения к базе данных Aurora, поэтому доступ к Aurora так же прост, как и вызов API. API данных исключает использование драйверов баз данных и программного обеспечения для объединения подключений на стороне клиента. Он также улучшает масштабируемость приложений за счет автоматического объединения и совместного использования подключений к базе данных. API данных повышает безопасность благодаря интеграции с AWS IAM и Менеджером секретов AWS.

Разработчики могут вызывать API данных через приложения, созданные с помощью AWS SDK. API данных также предоставляет доступ к базам данных Aurora для AWS AppSync GraphQL API.