Что такое глубокое обучение?

Что такое глубокое обучение в ИИ?

Глубокое обучение – это методология в области искусственного интеллекта, которая учит компьютеры обрабатывать данные таким же способом, как и человеческий мозг. Модели глубокого обучения могут распознавать сложные закономерности в изображениях, тексте, звуках и других данных для точного анализа и создания прогнозов. Методы глубокого обучения можно использовать для автоматизации задач, которые обычно требуют применения человеческого интеллекта, таких как описание изображений или преобразование звукового файла в текст.

Смотреть введение в глубокое обучение

Что такое глубокое генеративное обучение?

Глубокое генеративное обучение – это глубокое обучение, направленное на создание новых выходных данных на основе изученных входных данных. Традиционно глубокое обучение было направлено на выявление взаимосвязей между данными. Модели глубокого обучения обучались на больших объемах данных, распознавая закономерности в наборе данных.

Глубокое генеративное обучение расширяет возможности распознавания закономерностей. Такие модели ищут в данных закономерности, а затем создают свои собственные уникальные закономерности. Например, они могут анализировать текст нескольких книг, а затем использовать полученную информацию для создания новых предложений и абзацев, которых нет в исходных книгах.

Глубокое генеративное обучение – основа современного генеративного искусственного интеллекта и базовых моделей. В этих моделях технологии глубокого обучения, обученные на огромных объемах данных, используются в необходимых масштабах для выполнения таких сложных задач, как ответы на вопросы, создание изображений на основе текста и написание контента.

Смотреть вводное видео, посвященное базовым моделям

Почему глубокое обучение важно?

На технологии глубокого обучения основаны многие приложения ИИ, которые используются в повседневных продуктах, в том числе следующих:

Чат-боты и генераторы кода
Цифровые помощники
Телевизионные пульты с голосовой активацией
Выявление мошенничества
Автоматическое распознавание лиц

Это также важнейший компонент таких технологий, как беспилотные автомобили, виртуальная реальность и многое другое. Компании используют модели глубокого обучения для анализа данных и прогнозирования в различных приложениях.

Каковы примеры использования глубокого обучения?

Глубокое обучение имеет ряд примеров использования в автомобилестроении, аэрокосмической промышленности, производстве, электронике, медицинских исследованиях и других областях.

В беспилотных автомобилях модели глубокого обучения используются для обнаружения объектов.
Оборонные системы используют глубокое обучение для обозначения областей интереса на спутниковых снимках.
В анализе медицинских изображений глубокое обучение используется для обнаружения раковых клеток в ходе медицинской диагностики.
Заводы используют приложения глубокого обучения, чтобы выявлять ситуации, когда люди или объекты находятся на небезопасном расстоянии от станков.

Эти различные примеры использования глубокого обучения можно разделить на пять широких категорий: машинное зрение, распознавание речи, обработка естественного языка (NLP), механизмы рекомендаций и генеративный искусственный интеллект.

Машинное зрение

Машинное зрение автоматически извлекает информацию и аналитические данные из изображений и видео. Методы глубокого обучения позволяют распознавать изображения так, как это делают люди. Машинное зрение применяется в нескольких областях, например:

Модерация контента для автоматического удаления небезопасного или неприемлемого контента из архивов изображений и видео
Распознавание лиц для идентификации людей и распознавания таких атрибутов, как открытые глаза, очки и растительность на лице
Классификация изображения для идентификации логотипов бренда, одежды, защитного снаряжения и других деталей изображения

Распознавание речи

Модели глубокого обучения могут анализировать человеческую речь независимо от ее речевых моделей, высоты, тона, языка и акцента. Виртуальные помощники, такие как Amazon Alexa, программное обеспечение для преобразования текста в речь и речи в текст, используют распознавание речи для выполнения указанных ниже задач.

Помощь операторам контактного центра и автоматическая классификация звонков.
Преобразование врачебных рекомендаций в документацию в режиме реального времени.
Точные субтитры к видео и записям совещаний для более широкого охвата контента.
Преобразование скриптов в текстовые запросы в рамках интеллектуальных голосовых помощников.

Обработка естественного языка

Компьютеры используют алгоритмы глубокого обучения для извлечения аналитических данных и значения из текстовых данных и документов. Эта способность обрабатывать естественный текст, созданный человеком, имеет несколько примеров использования, в том числе:

Автоматизированные виртуальные агенты и чат-боты
Автоматическое резюмирование документов или новостных статей
Бизнес-аналитика длинных документов: например, электронных писем и форм
Индексация ключевых фраз, указывающих на настроение: например, положительных и отрицательных комментариев в социальных сетях

Сервисы рекомендаций

Приложения могут использовать методы глубокого обучения для отслеживания активности пользователей и составления персонализированных рекомендаций. Они могут анализировать поведение пользователей и помогать им находить новые продукты или услуги. Ниже приведены примеры.

Рекомендации персонализированного видео и контента.
Рекомендации специализированных продуктов и услуг.
Фильтрация результатов поиска для выделения релевантного контента в зависимости от местонахождения и поведения пользователя.

Генеративный искусственный интеллект

Приложения генеративного искусственного интеллекта могут создавать контент и осуществлять более сложное взаимодействие с конечными пользователями. Они могут помочь в автоматизации сложных рабочих процессов, мозговом штурме и интеллектуальном поиске знаний. Например, с помощью инструментов генеративного искусственного интеллекта, таких как Amazon Q Business и Amazon Q для разработчиков, пользователи могут:

задавать вопросы на естественном языке и получать ответы, резюмирующие содержимое из нескольких внутренних источников знаний;
получать рекомендации по коду и доступ к функциям автоматической проверки и обновления кода;
быстрее создавать документы, электронные письма и другой маркетинговый контент.

Как работает глубокое обучение?

Модели глубокого обучения – это нейронные сети, созданные по образцу человеческого мозга. В человеческом мозге есть миллионы взаимосвязанных клеток – нейронов, которые совместно изучают и обрабатывают информацию. Работающие по аналогии с ними искусственные нейроны – это программные модули, называемые узлами, которые обрабатывают данные с использованием математических вычислений. Нейронные сети глубокого обучения, или искусственные нейронные сети, состоят из множества слоев искусственных нейронов, которые совместно работают для решения сложных задач.

Ниже перечислены компоненты глубокой нейронной сети.

Входной слой

Искусственная нейронная сеть содержит несколько узлов, через которые в нее поступают входные данные. Эти узлы составляют входной слой системы.

Скрытый слой

Входной слой обрабатывает и передает данные на слои, расположенные дальше в нейронной сети. Эти скрытые слои обрабатывают информацию на разных уровнях, адаптируя свое поведение по мере получения новых данных. Сети глубокого обучения имеют сотни скрытых слоев, которые они могут использовать для анализа проблемы с разных точек зрения.

Например, если вам дали изображение неизвестного животного, которое нужно классифицировать, вы бы сравнили его с животными, которых вы уже знаете. Вы посмотрели бы на форму глаз и ушей, размер, количество ног и рисунок шерсти. Вы попытались бы определить закономерности, например такие:

у животного есть копыта, значит, это может быть корова или олень;
у животного кошачьи глаза, значит, это может быть дикая кошка.

Скрытые слои в глубоких нейронных сетях работают аналогичным образом. Если алгоритм глубокого обучения пытается классифицировать изображение животного, каждый из его скрытых слоев обрабатывает разные характеристики животного и пытается точно классифицировать его.

Выходной слой

Выходной слой состоит из узлов, которые выводят данные. Модели глубокого обучения, которые выводят ответы «да» или «нет», имеют на выходном слое только два узла. С другой стороны, модели, которые выводят более широкий диапазон ответов, содержат больше узлов. Для генеративного искусственного интеллекта характерен сложный выходной слой для генерации новых данных, соответствующих закономерностям в том или ином наборе обучающих данных.

В чем разница между машинным обучением, глубоким обучением и генеративным искусственным интеллектом?

Термины машинное обучение, глубокое обучение и генеративный искусственный интеллект указывают на прогресс в технологии нейронных сетей.

Машинное обучение

Глубокое обучение – это часть машинного обучения. Алгоритмы глубокого обучения были призваны повысить эффективность традиционных методов машинного обучения. Традиционные методы машинного обучения требуют значительных человеческих усилий для обучения программного обеспечения. Например, при распознавании изображений животных вам нужно сделать следующее.

Вручную ввести пометки для сотен тысяч изображений животных.
Запустить алгоритмы машинного обучения для обработки этих изображений.
Протестировать эти алгоритмы на наборе неизвестных изображений.
Определить, почему некоторые результаты неточны.
Улучшить набор данных, снабдить пометками новые изображения для повышения точности результатов.

Этот процесс называется обучением под наблюдением. При обучении под наблюдением точность результатов повышается только при наличии обширного и достаточно разнообразного набора данных. Например, алгоритм может точно идентифицировать черных кошек, но не белых кошек, потому что в обучающем наборе данных было больше изображений черных кошек. В этом случае вам потребуется больше помеченных изображений белых кошек для повторного обучения моделей машинного обучения.

Преимущества глубокого обучения перед машинным обучением

Сеть глубокого обучения имеет следующие преимущества по сравнению с традиционным машинным обучением.

Эффективная обработка неструктурированных данных

Методы машинного обучения затрудняют обработку неструктурированных данных, таких как текстовые документы, поскольку обучающий набор данных может иметь бесконечное количество вариаций. С другой стороны, модели глубокого обучения могут понимать неструктурированные данные и проводить общие наблюдения без извлечения признаков вручную. Например, нейронная сеть может установить, что два разных входных предложения имеют одно и то же значение:

Не подскажете как произвести оплату?
Как мне перевести деньги?

Обнаружение скрытых связей и закономерностей

Приложение глубокого обучения может проводить углубленный анализ больших объемов данных и выявлять новые идеи, для поиска которых оно, возможно, даже не было обучено. Например, рассмотрим модель глубокого обучения, которая обучена анализировать покупки потребителей. В модели есть данные только о товарах, которые вы уже приобрели. Однако искусственная нейронная сеть может предлагать новинки, которые вы не покупали, сравнивая ваши модели покупок с моделями аналогичных клиентов.

Обучение без наблюдения

Модели глубокого обучения со временем могут обучаться и улучшаться в зависимости от поведения пользователей. Они не требуют больших вариаций маркированных наборов данных. Например, рассмотрим нейронную сеть, которая автоматически исправляет или предлагает слова, анализируя ваше поведение при наборе текста. Предположим, что она обучена английскому языку и может проверять орфографию английских слов. Однако если вы часто вводите слова не на английском языке, например danke, нейронная сеть автоматически запоминает эти слова и исправляет их тоже.

Обработка неустойчивых данных

Неустойчивые наборы данных содержат значительные вариации. Один из примеров – суммы погашения кредита в банке. Нейронная сеть с глубоким обучением также может классифицировать и сортировать эти данные, анализируя финансовые транзакции и помечая некоторые из них для выявления мошенничества.

Подробнее о глубоком обучении и машинном обучении

Генеративный искусственный интеллект

Благодаря генеративному искусственному интеллекту нейронные сети машинного и глубокого обучения вышли на новый уровень. В то время как алгоритмы машинного и глубокого обучения направлены на прогнозирование и распознавание закономерностей, генеративный искусственный интеллект выдает уникальные выходные данные на основе обнаруженных закономерностей. Технология генеративного искусственного интеллекта основана на архитектуре трансформера, объединяющей несколько разных нейронных сетей и уникальным образом сочетающей полученные ими закономерности. Сети глубокого обучения сначала преобразуют текст, изображения и другие данные в математические абстракции, а затем повторно преобразуют их в новые значимые закономерности.

С какими трудностями сталкивается глубокое обучение?

Ниже приведены проблемы, связанные с внедрением глубокого обучения и генеративного искусственного интеллекта.

Большие объемы высококачественных данных

Алгоритмы глубокого обучения дают лучшие результаты, если обучать их на больших объемах высококачественных данных. Отклонения или ошибки во входном наборе данных могут существенно повлиять на процесс глубокого обучения. Например, в нашем примере с изображением животного модель глубокого обучения может классифицировать самолет как черепаху, если в набор данных были случайно введены изображения, не связанные с животными.

Чтобы избежать таких неточностей, прежде чем приступать к обучению модели глубокого обучения, необходимо очистить и обработать большие объемы данных. Для предварительной обработки входных данных требуются носители данных большого объема.

Крупные вычислительные мощности

Для правильного функционирования алгоритмов глубокого обучения требуются крупные вычислительные ресурсы и инфраструктура с достаточной вычислительной мощностью. В противном случае обработка результатов занимает много времени.

Каковы преимущества генеративного искусственного интеллекта и глубокого обучения в облаке?

Использование генеративного искусственного интеллекта и глубокого обучения на основе облачной инфраструктуры позволяет быстрее проектировать, разрабатывать и обучать приложения.

Скорость

Вы можете ускорить обучение моделей глубокого обучения и генеративного искусственного интеллекта, используя кластеры графических и центральных процессоров для выполнения сложных математических операций, необходимых для нейронных сетей. Затем вы можете развертывать эти модели для обработки больших массивов данных с получением все более подходящих результатов.

Масштабируемость

Доступность широкого спектра ресурсов по требованию в облаке позволяет практически без ограничений получать использовать аппаратные ресурсы для работы с моделями глубокого обучения ИИ при любых масштабах. Ваши нейронные сети могут использовать несколько процессоров, что обеспечит беспрепятственное и эффективное распределение рабочих нагрузок между различными типами процессоров и разным их количеством.

Инструменты

Вы можете использовать инструменты искусственного интеллекта и глубокого обучения, такие как блокноты, отладчики, профилировщики, конвейеры, AIOps и многое другое. Вы можете работать с существующими моделями генеративного искусственного интеллекта в облаке, предоставляемыми как услуга, без необходимости создания инфраструктуры для хостинга модели. Сотрудники могут начать работу с приложениями генеративного искусственного интеллекта и глубокого обучения даже в условиях ограниченных знаний и обучения.

Как AWS может помочь вам удовлетворить потребности в сфере генеративного искусственного интеллекта и глубокого обучения?

Сервисы искусственного интеллекта и глубокого обучения AWS основаны на возможностях облачных вычислений и помогают вам создавать и масштабировать новое поколение инновационных решений в области ИИ. Выведите качество обслуживания клиентов на новый уровень с помощью комплексных специализированных услуг, инфраструктуры ИИ, технологий глубокого обучения и решений на основе генеративного искусственного интеллекта. Ниже приведены примеры.

Amazon SageMaker реализует полностью управляемые инфраструктуру, инструменты и рабочие процессы для разработки решений в сфере машинного и глубокого обучения.
Amazon Bedrock обеспечивает единый API для доступа к широкому ряду высокопроизводительных базовых моделей от ведущих компаний в сфере ИИ и их использования.

Вы также можете использовать инфраструктуру ИИ AWS для доступа к комплексным, безопасным и экономичным возможностям вычислений, хранения и организации сети, чтобы создавать любые приложения на основе ИИ. Начните работу с глубоким обучением ИИ на AWS, создав бесплатный аккаунт AWS уже сегодня.

Специализированные сервисы глубокого обучения на AWS

Глубокое обучение на AWS: дальнейшие шаги

Изучите дополнительные ресурсы по продукту

Подробнее о сервисах глубокого обучения

Зарегистрировать бесплатный аккаунт

Получите мгновенный доступ к Уровню бесплатного пользования AWS.

Регистрация

Начните разработку в консоли

Начните разработку в Консоли управления AWS.

Вход

Browse all cloud computing concepts

Browse all cloud computing concepts content here:

Загрузка

Did you find what you were looking for today?

Let us know so we can improve the quality of the content on our pages

Что такое глубокое обучение?