기계 학습과 딥 러닝의 차이점은 무엇인가요?

기계 학습(ML)은 명시적인 지침 없이 작업을 수행하도록 컴퓨터 프로그램 또는 시스템을 훈련시키는 과학 기술입니다. 컴퓨터 시스템은 ML 알고리즘을 사용하여 대량의 데이터를 처리하고, 데이터 패턴을 식별하고, 알려지지 않았거나 새로운 시나리오에 대한 정확한 결과를 예측합니다. 딥 러닝은 인간의 두뇌를 모델로 한 신경망이라는 특정 알고리즘 구조를 사용하는 ML의 하위 집합입니다. 딥러닝 방법은 일반적으로 인간의 지능이 필요한 더 복잡한 작업을 자동화하려고 시도합니다. 예를 들어 딥 러닝을 사용하여 이미지를 설명하거나 문서를 번역하거나 사운드 파일을 텍스트로 변환할 수 있습니다.

기계 학습에 대해 읽어보기 »

딥 러닝에 대해 읽어보기 »

기계 학습과 딥 러닝의 유사점은 무엇인까요?

기계 학습(ML)과 딥 러닝을 모두 사용하여 데이터의 패턴을 식별할 수 있습니다. 둘 다 복잡한 수학적 모델을 기반으로 하는 알고리즘을 훈련시키기 위해 데이터 세트를 사용합니다. 훈련 중에 알고리즘은 알려진 출력과 입력 간의 상관관계를 찾습니다. 그런 다음 모델은 알 수 없는 입력을 기반으로 출력을 자동으로 생성하거나 예측할 수 있습니다. 기존 프로그래밍 기법과 달리 학습 과정도 사람의 개입을 최소화하여 자동으로 진행됩니다.

그 이외에 ML과 딥 러닝의 유사점은 다음과 같습니다.

인공 지능 기법

ML과 딥 러닝은 모두 데이터 과학과 인공 지능(AI)의 하위 집합입니다. 둘 다 기존 프로그래밍 기법을 통해 수행할 경우 시간과 리소스가 많이 소요되는 복잡한 계산 작업을 완료할 수 있습니다.

통계적 근거

딥 러닝과 ML은 모두 통계적 방법을 사용하여 데이터 세트로 알고리즘을 훈련시킵니다. 이러한 기법으로는 회귀 분석, 의사 결정 트리, 선형 대수, 미적분학 등이 있습니다. ML 전문가와 딥 러닝 전문가는 모두 통계학에 대한 지식이 있습니다.

대규모 데이터 집합

ML과 딥 러닝 모두, 더 정확한 예측을 위해서는 양질의 훈련 데이터 세트가 많이 필요합니다. 예를 들어 ML 모델에는 피처당 약 50~100개의 데이터 포인트가 필요한 반면, 딥 러닝 모델에는 피처당 최소 수천 개의 데이터 포인트가 필요합니다.

광범위하고 다양한 애플리케이션

딥 러닝 및 ML 솔루션은 모든 산업 부문과 애플리케이션의 복잡한 문제를 해결합니다. 기존 프로그래밍 및 통계 기법을 사용하면 이러한 유형의 문제를 해결하거나 최적화하는 데 시간이 훨씬 더 많이 걸립니다.

컴퓨팅 파워 요구 사항

ML 알고리즘을 훈련시키고 실행하려면 상당한 컴퓨팅 파워가 필요한데, 딥 러닝은 복잡한 만큼 컴퓨팅 요구 사항이 특히 더 높습니다. 최근 컴퓨팅 성능 및 클라우드 리소싱의 발전 덕분에 이제 ML과 딥 러닝을 모두 개인용으로 사용할 수 있게 되었습니다.

점진적 개선

ML 및 딥 러닝 솔루션이 더 많은 데이터를 수집할수록 패턴 인식의 정확도가 향상됩니다. 입력이 시스템에 추가되면 이를 훈련용 데이터 포인트로 사용하면서 시스템이 개선됩니다.

기계 학습의 어떤 한계로 인해 딥 러닝이 발전했나요?

기존 기계 학습(ML)에는 결과를 산출하기 위해 특성 추출을 통한 상당한 인적 상호 작용이 필요합니다. 예를 들어 고양이와 강아지의 이미지를 분류하도록 ML 모델을 훈련시키는 경우, 눈 모양, 꼬리 모양, 귀 모양, 코 윤곽 등의 특징을 인식하도록 모델을 수동으로 구성해야 합니다.

ML의 목표는 사람의 개입 필요성을 줄이는 것이므로, 딥 러닝 기법을 사용하여 각 단계에서 사람이 데이터에 레이블링할 필요성을 없앱니다.

딥 러닝은 수십 년 전부터 존재했지만, 2000년대 초반에 Yann LeCun, Yoshua Bengio, Geoffrey Hinton explore 같은 과학자들이 이 분야를 보다 자세히 탐구했습니다. 과학자들은 딥 러닝을 발전시켰지만, 당사에는 크고 복잡한 데이터 세트가 한정되어 있었고 모델 훈련에 필요한 처리 성능의 비용도 비쌌습니다. 지난 20년 동안 이러한 상황이 개선되었고 이제 딥 러닝은 상업적으로 활용 가능한 옵션이 되었습니다.

주요 차이점: 기계 학습과 딥 러닝

딥 러닝은 기계 학습(ML)의 하위 집합입니다. 딥 러닝은 발전된 형태의 ML 기법이라고 할 수 있습니다. ML과 딥 러닝은 각각 다양하게 응용됩니다. 하지만 딥 러닝 솔루션에는 더 큰 데이터 세트, 인프라 요구 사항, 후속 비용 등 더 많은 리소스가 소요됩니다.

ML과 딥 러닝의 다른 차이점은 다음과 같습니다.

본래의 사용 사례

ML과 딥 러닝 중 무엇을 사용할지에 대한 결정은 처리해야 하는 데이터 유형에 따라 달라집니다. ML은 분류 및 추천 시스템의 경우와 같은 정형 데이터에서 패턴을 식별합니다. 예를 들어 회사에서 ML을 사용하여 이전 고객 이탈률 데이터를 바탕으로 고객이 언제 구독을 취소할지 예측할 수 있습니다. 

반면 딥 러닝 솔루션은 피처를 추출하기 위해 고도로 추상화해야 하는 비정형 데이터에 더 적합합니다. 딥 러닝 작업에는 데이터 객체 간의 복잡한 관계를 식별해야 하는 이미지 분류와 자연어 처리 등이 있습니다. 예를 들어 딥 러닝 솔루션은 소셜 미디어 멘션을 분석하여 사용자 감정을 파악할 수 있습니다.

문제 해결 방식

기존 ML에는 일반적으로 사람이 직접 원시 데이터에서 피처를 선택하고 추출한 다음 가중치를 할당하는 기능 엔지니어링이 필요합니다. 반면 딥 러닝 솔루션은 사람의 개입을 최소화하면서 기능 엔지니어링을 수행합니다.

딥 러닝의 신경망 아키텍처는 설계상 더 복잡합니다. 딥 러닝 솔루션은 노드로 표현되는 뉴런을 사용하여 인간 두뇌의 작동 방식을 모델링하는 방식으로 학습합니다. 심층 신경망은 입력 및 출력 계층 노드를 비롯하여 3개 이상의 노드 계층으로 구성됩니다. 

딥 러닝에서는 신경망의 모든 노드가 각 피처에 가중치를 자율적으로 할당합니다. 정보는 네트워크를 통해 입력에서 출력으로 순방향으로 흐릅니다. 그런 다음 예측된 출력과 실제 출력 간의 차이가 계산됩니다. 그리고 이 오류가 네트워크를 통해 역전파되어 뉴런의 가중치가 조정됩니다.

자동 가중치 부여 프로세스, 아키텍처 수준의 깊이, 사용되는 기법 때문에, 딥 러닝에서는 ML보다 훨씬 더 많은 연산을 해결할 모델이 필요합니다.

훈련 방법

ML에는 지도 학습, 비지도 학습, 반지도 학습, 강화형 기계 학습이라는 네 가지 주요 훈련 방법이 있습니다. 다른 훈련 방법으로는 전이 학습과 자기 지도 학습이 있습니다.

반면, 딥 러닝 알고리즘은 몇 가지 더 복잡한 유형의 훈련 방법을 사용합니다. 여기에는 컨벌루션 신경망, 순환 신경망, 적대적 생성형 네트워크, 오토인코더가 포함됩니다.

성능

ML과 딥 러닝 모두 특정 사용 사례에서 다른 사용 사례에서보다 더 뛰어난 성능을 발휘합니다.

새로 들어오는 스팸 메시지를 식별하는 것과 같은 간단한 작업에는 ML이 적합하며 일반적으로 딥 러닝 솔루션보다 더 뛰어난 성능을 발휘합니다. 의료 이미징 인식과 같은 더 복잡한 작업의 경우, 딥 러닝 솔루션은 사람의 눈으로 볼 수 없는 이상 징후를 식별할 수 있기 때문에 ML 솔루션보다 성능이 뛰어납니다.

사람의 개입

ML과 딥 러닝 솔루션은 모두 작동하는 데 상당한 인적 개입을 필요로 합니다. 누군가 문제를 정의하고, 데이터를 준비하고, 모델을 선택하여 훈련시킨 다음, 솔루션을 평가, 최적화 및 배포해야 합니다.

ML 모델은 의사 결정 트리와 같은 단순한 수학적 모델에서 파생되기 때문에 사람이 해석하기가 더 쉽습니다.

반대로, 딥 러닝 모델은 수학적으로 복잡하기 때문에 사람이 자세히 분석하는 데 상당한 시간이 걸립니다. 그렇긴 하지만, 신경망이 학습하는 방식 덕분에 사람이 데이터에 레이블링할 필요가 없습니다. 사전 훈련된 모델과 플랫폼을 선택하면 사람의 개입을 더욱 줄일 수 있습니다.

인프라 요구 사항

딥 러닝 모델은 더 복잡하고 더 큰 데이터 세트를 필요로 하기 때문에 ML 모델보다 더 많은 스토리지와 계산 성능이 요구됩니다. ML 데이터 및 모델은 단일 인스턴스 또는 서버 클러스터에서 실행할 수 있지만, 딥 러닝 모델에는 고성능 클러스터와 기타 상당한 인프라가 필요한 경우가 많습니다.

딥 러닝 솔루션의 인프라 요구 사항은 ML보다 훨씬 더 높은 비용을 초래할 수 있습니다. 온사이트 인프라는 딥 러닝 솔루션을 실행하기에 현실적이지 않거나 비용 효율이 낮은 옵션일 수 있습니다. 확장 가능한 인프라와 완전관리형 딥 러닝 서비스를 사용하여 비용을 억제할 수 있습니다.

차이점 요약: 기계 학습과 딥 러닝

 

기계 학습

딥 러닝

무엇인가요?

ML은 인공 지능(AI) 방법론 중 하나입니다. 모든 ML이 딥 러닝인 것은 아닙니다.

딥 러닝은 발전된 형태의 ML 방법론입니다. 모든 딥 러닝은 ML에 해당합니다.

가장 적합한 용도

ML은 레이블링된 정형 데이터를 사용하는 잘 정의된 작업에 가장 적합합니다.

딥 러닝은 시스템이 비정형 데이터를 이해해야 하는 복잡한 작업에 가장 적합합니다.

문제 해결 방식

ML은 통계와 수학을 통해 문제를 해결합니다.

딥 러닝은 통계와 수학을 신경망 아키텍처와 결합합니다.

교육

ML 모델을 훈련시키려면 원시 데이터에서 피처를 수동으로 선택 및 추출하고 가중치를 할당해야 합니다.

딥 러닝 모델은 알려진 오류의 피드백을 사용하여 스스로 학습할 수 있습니다.

필요한 리소스

ML은 딥 러닝보다 덜 복잡하고 데이터 볼륨이 적습니다.

딥 러닝은 ML보다 더 복잡하고 데이터 볼륨이 많습니다.

AWS는 기계 학습 및 딥 러닝 요구 사항을 어떻게 지원하나요?

Amazon Web Services(AWS)에는 다양한 기계 학습(ML) 및 딥 러닝 솔루션이 있습니다. 이러한 솔루션을 사용하여 모든 애플리케이션 및 사용 사례에 인공 지능(AI)을 통합할 수 있습니다.

기존 ML의 경우 Amazon SageMaker는 강력하고 확장 가능한 클라우드 인프라에서 알고리즘을 구축, 훈련, 배포할 수 있는 완벽한 플랫폼입니다.

딥 러닝 요구 사항의 경우, 다음과 같은 완전관리형 서비스를 사용할 수 있습니다.

  • Amazon Comprehend에서 어떤 텍스트에든 자연어 처리 기술을 사용하거나 더 복잡한 의학 텍스트에 Amazon Comprehend Medical을 사용하여 중요한 인사이트를 얻을 수 있습니다.
  • Amazon Fraud Detector는 과거 기록을 기반으로 사기 행위를 탐지하는 데 유용합니다.
  • Amazon Lex는 지능형 챗봇과 대화형 인터페이스를 구축하는 데 유용합니다.
  • Amazon Personalize를 사용하면 고객을 신속하게 분류하고 큐레이팅된 추천 시스템을 구축할 수 있습니다.
  • Amazon Polly를 사용하면 수십 개 언어의 입력 텍스트에서 자연스러운 음성을 생성할 수 있습니다.
  • Amazon Rekognition을 사용하면 사전 구축된 이미지 인식 및 비디오를 분석할 수 있습니다.
  • Amazon Textract를 사용하면 컴퓨터로 생성하거나 손으로 쓴 문서에서 텍스트를 추출할 수 있습니다.

지금 무료 AWS 계정을 만들어 기계 학습과 딥 러닝을 시작하세요.

AWS 활용 다음 단계

기계 학습을 사용하여 구축 시작
딥 러닝을 사용하여 구축 시작