Внедрение двоичных встраиваний для модели встраивания текста Titan в Amazon Bedrock

Проведено: 19 нояб. 2024 г.

Версия 2 встраивания текста Amazon Titan теперь поддерживает двоичное встраивание. С помощью двоичного встраивания пользователи могут снизить затраты на хранение приложений с дополненной извлеченными данными генерацией (RAG), сохраняя при этом точность обычного встраивания.

Модель встраивания текста Amazon Titan генерирует семантические представления документов, абзацев и предложений в форме 1024- (по умолчанию), 512- или 256-размерного вектора. При использовании двоичных встраиваний 2-я версия встраивания текста Titan будет представлять данные в форме двоичных векторов, каждое измерение которых закодировано одной двоичной цифрой (0 или 1). Это двоичное представление преобразует многомерные данные в более удобный формат для хранения в бессерверном Amazon OpenSearch в базах знаний Bedrock для экономичных приложений RAG.

Двоичное встраивание поддерживается во 2-й версии встраивания текста Titan, бессерверном Amazon OpenSearch и базах знаний Amazon Bedrock во всех регионах, где поддерживается 2-я версия встраивания текста Titan Amazon. Подробные сведения см. в документации, посвященной двоичным встраиваниям.