В чем разница между машинным и глубоким обучением?
Машинное обучение – это наука об обучении компьютерной программы или системы выполнению задач без четких инструкций. Компьютерные системы используют алгоритмы машинного обучения для обработки больших объемов данных, выявления закономерностей данных и прогнозирования точных результатов для неизвестных или новых сценариев. Глубокое обучение – это подмножество машинного обучения, в котором используются специальные алгоритмические структуры, называемые нейронными сетями, смоделированные по образцу человеческого мозга. Методы глубокого обучения направлены на автоматизацию более сложных задач, для выполнения которых обычно требуется человеческий интеллект. Например, с помощью глубокого обучения можно описывать изображения, переводить документы или транскрибировать звуковой файл в текст.
В чем сходство между машинным и глубоким обучением?
Для выявления закономерностей в данных можно использовать как машинное, так и глубокое обучение. Они оба используют наборы данных для обучения алгоритмов, основанных на сложных математических моделях. Во время обучения алгоритмы находят взаимосвязи между известными выходами и входами. Затем модели могут автоматически генерировать или прогнозировать выходные данные на основе неизвестных входных данных. В отличие от традиционного программирования, процесс обучения также автоматизирован и требует минимального вмешательства человека.
Ниже приведены другие сходства между машинным и глубоким обучением.
Методы искусственного интеллекта
Как машинное, так и глубокое обучение являются подмножествами анализа данных и искусственного интеллекта (ИИ). Обе технологии могут выполнять сложные вычислительные задачи, для решения которых с помощью традиционных методов программирования в противном случае потребовалось бы много времени и ресурсов.
Статистическая основа
И глубокое, и машинное обучение используют статистические методы для обучения своих алгоритмов наборам данных. Эти методы включают регрессионный анализ, деревья решений, линейную алгебру и анализ функций. Как эксперты по машинному обучению, так и специалисты по глубокому обучению хорошо разбираются в статистике.
Большие наборы данных
Как машинное, так и глубокое обучение требуют больших наборов качественных обучающих данных для более точных прогнозов. Например, для модели машинного обучения требуется около 50–100 точек данных для каждой функции, в то время как модель глубокого обучения начинает работу с тысячами точек данных на функцию.
Широкая сфера применения и различные варианты использования
Решения по глубокому и машинному обучению выполняют сложные задачи во всех отраслях и областях применения. Для решения или оптимизации этих типов задач потребовалось бы значительно больше времени, если бы вы использовали традиционные методы программирования и статистики.
Требования к вычислительной мощности
Для обучения и запуска алгоритмов машинного обучения требуются значительные вычислительные мощности, а для глубокого обучения вычислительные требования еще выше из-за его повышенной сложности. Благодаря последним достижениям в области вычислительных мощностей и облачных ресурсов теперь возможно использовать обе технологии в личных целях.
Постепенное улучшение
По мере того как решения машинного и глубокого обучения обрабатывают больше данных, они становятся более точными при распознавании образов. Когда в систему добавляются входные данные, система совершенствуется, используя их в качестве точки данных для обучения.
Какие ограничения машинного обучения привели к развитию глубокого обучения?
Традиционное машинное обучение требует значительного взаимодействия человека через конструирование признаков для получения результатов. Например, если вы обучаете модель машинного обучения классифицировать изображения кошек и собак, вам необходимо вручную настроить ее для распознавания таких черт, как форма глаз, хвоста, ушей, контуры носа и т. д.
Поскольку целью машинного обучения является снижение необходимости вмешательства человека, методы глубокого обучения избавляют людей от необходимости маркировать данные на каждом этапе.
Хотя глубокое обучение существует уже много десятилетий, в начале 2000-х годов такие ученые, как Янн ЛеКун, Йошуа Бенджио и Джеффри Хинтон, изучили эту область более подробно. Исследователи совершенствовали глубокое обучение, тем не менее большие и сложные наборы данных в это время были ограничены, а вычислительные мощности, необходимые для обучения моделей, – дорогостоящими. За последние 20 лет эти условия улучшились, и глубокое обучение стало коммерчески выгодным.
Ключевые отличия машинного и глубокого обучения
Глубокое обучение – это часть машинного обучения. Вы можете считать его продвинутой техникой машинного обучения. Каждая из этих возможностей имеет широкий спектр применения. Однако решения для глубокого обучения требуют больше ресурсов – больших наборов данных, требований к инфраструктуре и последующих затрат.
Ниже приведены другие различия между машинным и глубоким обучением.
Предполагаемые варианты использования
Решение об использовании машинного или глубокого обучения зависит от типа данных, которые необходимо обработать. Машинное обучение выявляет закономерности на основе структурированных данных, таких как системы классификации и рекомендаций. Например, компания может использовать машинное обучение, чтобы предсказать, когда клиент откажется от подписки на основе предыдущих данных об оттоке клиентов.
С другой стороны, решения для глубокого обучения больше подходят для неструктурированных данных, где для извлечения функций требуется высокий уровень абстракции. Задачи глубокого обучения включают классификацию изображений и обработку естественного языка, где необходимо определить сложные взаимосвязи между объектами данных. Например, решение для глубокого обучения может анализировать упоминания в социальных сетях для определения настроений пользователей.
Подход к решению проблем
Традиционное машинное обучение обычно требует разработки функций, когда люди вручную выбирают и извлекают объекты из необработанных данных и присваивают им веса. И наоборот, решения для глубокого обучения выполняют проектирование функций с минимальным вмешательством человека.
Архитектура нейронной сети глубокого обучения по своей конструкции более сложна. Методы обучения решений для глубокого обучения основаны на принципе работы человеческого мозга, где нейроны представлены узлами. Глубокие нейронные сети состоят из трех или более уровней узлов, включая узлы входного и выходного уровней.
В глубоком обучении каждый узел нейронной сети автономно присваивает вес каждому объекту. Информация проходит через сеть в прямом направлении от входа к выходу. Затем вычисляется разница между прогнозируемым и фактическим выходом, и эта ошибка снова передается по сети для регулировки веса нейронов.
Вследствие процессов автоматического определения веса, глубины уровней архитектуры и используемых техник, для глубокого обучения модели нужно решать гораздо больше операций, чем для машинного обучения.
Методы обучения
Машинное обучение использует четыре основных метода обучения: под наблюдением, без него, с частичным наблюдением и с подкреплением. Другие методы обучения включают трансферное обучение и обучение под наблюдением.
Напротив, в алгоритмах глубокого обучения применяются несколько типов более сложных методов обучения: используются сверточные и рекуррентные нейронные сети, генеративно-состязательные сети и автокодировщики.
Производительность
Как для машинного, так и для глубокого обучения есть конкретные случаи использования, когда одна из технологий работает лучше другой.
Для более простых задач, таких как выявление новых входящих спам-сообщений, подходит машинное обучение, которое обычно превосходит решения глубокого обучения. Для более сложных задач, таких как распознавание медицинских изображений, решения для глубокого обучения превосходят решения машинного, поскольку они позволяют выявлять аномалии, невидимые человеческому глазу.
Участие человека
Решения как для машинного, так и для глубокого обучения требуют значительного участия человека в работе. Кто-то должен определить проблему, подготовить данные, выбрать и обучить модель, а затем оценить, оптимизировать и внедрить решение.
Людям легче интерпретировать модели машинного обучения, поскольку они основаны на более простых математических моделях, таких как деревья решений.
И наоборот, для детального анализа моделей глубокого обучения требуется значительное количество времени, поскольку модели математически сложны. При этом способ обучения нейронных сетей избавляет людей от необходимости маркировать данные. Вы можете еще больше снизить необходимость участия людей, выбрав предварительно обученные модели и платформы.
Требования к инфраструктуре
Поскольку модели глубокого обучения более сложны и требуют больших наборов данных, им требуется больше места для хранения и вычислительных мощностей, чем моделям машинного обучения. Данные и модели машинного обучения могут работать на одном инстансе или кластере серверов, а модель глубокого обучения часто требует высокопроизводительных кластеров и другой существенной инфраструктуры.
Из-за требований к инфраструктуре решений для глубокого обучения затраты на него могут значительно превышать затраты на машинное обучение. Использование локальной инфраструктуры может быть нецелесообразным или экономически неэффективным для запуска решений глубокого обучения. Для контроля расходов можно использовать масштабируемую инфраструктуру и полностью управляемые сервисы глубокого обучения.
Краткое описание различий машинного и глубокого обучения
Machine Learning |
Глубокое обучение |
|
Что это |
Машинное обучение – это методология искусственного интеллекта (ИИ). Не все машинное обучение – это глубокое обучение. |
Глубокое обучение – это передовая методология машинного обучения. Все глубокое обучение – это машинное обучение. |
Лучше всего подходит для |
Машинное обучение лучше всего подходит для четко определенных задач со структурированными и маркированными данными, |
а глубокое обучение – для сложных задач, требующих машинного анализа неструктурированных данных. |
Подход к решению проблем |
Машинное обучение решает проблемы с помощью статистики и математики, |
а глубокое обучение сочетает статистику и математику с архитектурой нейронной сети. |
Обучение |
Для обучения модели машинного обучения необходимо вручную выбирать и извлекать объекты из исходных данных и назначать веса. |
Модели глубокого обучения могут обучаться самостоятельно, используя обратную связь в виде известных ошибок. |
Необходимые ресурсы |
Машинное обучение менее сложное и требует меньшего объема данных. |
Глубокое обучение является более сложной задачей, для которой необходим очень большой объем данных. |
Как AWS может удовлетворить ваши требования к машинному и глубокому обучению?
Существует множество решений для машинного и глубокого обучения в Amazon Web Services (AWS). С их помощью вы сможете интегрировать искусственный интеллект во все свои приложения и сценарии использования.
Для традиционного машинного обучения Amazon SageMaker – это полноценная платформа для создания, обучения и развертывания алгоритмов в мощной масштабируемой облачной инфраструктуре.
Если вам требуется глубокое обучение, вы можете воспользоваться полностью управляемыми сервисами, например, приведенными ниже.
- Amazon Comprehend помогает извлекать ценную информацию из любого текста с помощью обработки естественного языка, а Amazon Comprehend Medical предназначен для более сложных медицинских текстов.
- Детектор мошенничества Amazon помогает выявлять мошеннические операции на основе прошлых записей.
- Amazon Lex помогает создавать интеллектуальные чат-боты и диалоговые интерфейсы.
- Amazon Personalize помогает быстро сегментировать клиентов и создавать тщательно подобранные системы рекомендаций.
- Amazon Polly поможет вам создать естественную устную речь из вводимого текста на десятках языков.
- Amazon Rekognition помогает использовать встроенные средства распознавания изображений и анализа видео.
- Amazon Textract поможет вам извлечь текст из любого созданного на компьютере или написанного от руки документа.
Начните с машинного и глубокого обучения, создав бесплатный аккаунт AWS уже сегодня.