Amazon SageMaker запускает формирование логических выводов моделью с несколькими адаптерами
Сегодня Amazon SageMaker представляет новые возможности формирования логических выводов с несколькими адаптерами, что открывает интересные возможности для клиентов, использующих предварительно обученные языковые модели. Эта функция позволяет развертывать сотни точно настроенных адаптеров модели LoRA (Low-Rank Adaptation) на одном адресе, динамически загружая соответствующие адаптеры за миллисекунды в зависимости от запроса. Это позволяет эффективно размещать множество специализированных адаптеров LoRA, построенных на общей базовой модели, что обеспечивает высокую пропускную способность и экономию средств по сравнению с развертыванием отдельных моделей.
С помощью логических выводов с несколькими адаптерами можно быстро настраивать предварительно обученные модели в соответствии с разнообразными бизнес-требованиями. Например, маркетинговые компании и компании SaaS могут персонализировать приложения искусственного интеллекта и машинного обучения, используя уникальные изображения, стиль общения и документы каждого клиента для создания персонализированного контента за считанные секунды. Аналогично организации в таких отраслях, как здравоохранение и финансовые услуги, могут повторно использовать общую базовую модель на основе LoRA для решения целого ряда специализированных задач: от медицинской диагностики до выявления мошенничества, просто меняя соответствующий настроенный адаптер. Такая гибкость и эффективность открывают новые возможности для развертывания мощного адаптируемого искусственного интеллекта в организации.
Функция логических выводов с использованием нескольких адаптеров доступна в Азиатско-Тихоокеанском регионе (Токио, Сеул, Мумбаи, Сингапур, Сидней, Джакарта), Канаде (Центральной), Европе (Франкфурт, Стокгольм, Ирландия, Лондон), на Ближнем Востоке (ОАЭ), в Южной Америке (Сан-Паулу), на востоке США (Северная Вирджиния, Огайо) и западе США (Орегон).
Чтобы приступить к работе, обратитесь к Руководству разработчика Amazon SageMaker для получения информации об использовании LoRA и управлении адаптерами модели.