인공 지능(AI)은 학습, 문제 해결, 패턴 인식 등과 같이 주로 인간 지능과 연결된 인지 문제를 해결하는 데 주력하는 컴퓨터 공학 분야입니다. 보통 "AI"로 줄여서 부르는 인공 지능은 로봇 공학이나 미래의 모습을 내포하고 있을 수도 있지만, AI는 공상 과학 소설에 나오는 작은 로봇을 넘어 첨단 컴퓨터 공학의 현실이 되고 있습니다. 이 분야의 저명한 과학자인 Pedro Domingos 교수는 논리와 철학에 기원을 둔 상징주의자, 신경 과학에서 유래한 연결주의자, 진화 생물학과 관련된 진화론자, 통계와 개연성을 다루는 베이지안, 그리고 심리학에 기반을 둔 유추론자로 구성된 기계 학습의 "5가지 집단"을 설명합니다. 최근에 통계 컴퓨팅 효율성이 개선되면서 베이지안이 "기계 학습"이라는 분야에서 몇 가지 영역을 성공적으로 발전시킬 수 있게 되었습니다. 이와 마찬가지로 네트워크 컴퓨팅이 발전하면서 연결주의자도 "딥 러닝"이라는 이름으로 하위 분야를 더욱 발전시킬 수 있게 되었습니다. 기계 학습(ML)과 딥 러닝(DL)은 모두 인공 지능 분야에서 파생된 컴퓨터 과학 분야입니다.
이러한 기법은 크게 "감독된" 학습 기법과 "감독되지 않은" 학습 기법으로 나뉘며, "감독된" 기법은 원하는 출력값이 포함된 교육 데이터를 사용하고 "감독되지 않은" 기법은 원하는 출력값을 제외한 교육 데이터를 사용합니다.
AI는 더 많은 데이터를 통해 "점점 더 똑똑"해지고 더 빠르게 학습하고 있으며, Amazon Redshift와 같은 데이터 웨어하우스에서 집계되고 추출되든, Mechanical Turk의 "대중"의 힘을 통한 실측 자료이든, Kinesis Streams를 통해 동적으로 수집되든 관계없이 기업은 기계 학습과 딥 러닝 솔루션을 실행하는 데 필요한 이러한 연료를 매일 생성하고 있습니다. 또한, IoT가 출현하면서 센서 기술이 분석할 데이터양을 기하급수적으로 늘리고 있습니다. 이는 이전에는 거의 손대지 않았던 소스, 장소, 객체 및 이벤트의 데이터입니다.
기계 학습은 패턴 인식 및 학습에 사용되는 몇 가지 베이지안 기법에 주로 적용되는 이름입니다. 기계 학습은 기록된 데이터에서 학습하고 이를 기반으로 예측하며, 불확실성 하에서 기본 유틸리티 기능을 최적화하고, 데이터에서 숨겨진 구조를 추출하고, 데이터를 간결한 설명으로 분류할 수 있는 알고리즘의 모음입니다. 기계 학습은 명시적 프로그래밍이 너무 엄격하거나 실용성이 없는 경우 주로 배포됩니다. 소프트웨어 개발자가 주어진 입력에 따라 프로그램 코드별로 출력을 생성하기 위해 개발하는 일반 컴퓨터 코드와는 달리, 기계 학습은 데이터를 사용하여 통계 코드(ML 모델)를 생성합니다. 이 통계 코드는 이전의 입력(감독된 기법의 경우 출력) 예제에서 인식한 패턴을 기반으로 "적절한 결과"를 출력합니다. ML 모델의 정확성은 대부분 기록 데이터의 양과 질에 달려 있습니다.
적절한 데이터가 있다면 ML 모델은 수십억 개의 예제를 통해 고차원의 문제를 분석함으로써 주어진 입력을 사용해 출력을 예측할 수 있는 최적의 기능을 찾을 수 있습니다. ML 모델은 예측뿐만 아니라 전반적인 성능에 대한 통계적 신뢰도를 제공합니다. ML 모델 또는 다른 개별 예측을 사용하려는 경우 이러한 평가 점수는 의사 결정에 중요한 역할을 합니다.
Amazon.com은 기계 학습 기반 시스템상에 많은 비즈니스를 구축하고 있습니다. ML 없이는 Amazon.com이 비즈니스를 성장시키고, 고객 경험과 선택을 개선하며, 물류 속도와 품질을 최적화할 수 없었을 것입니다. Amazon.com은 다른 비즈니스에서도 Amazon.com이 사용하는 것과 같은 IT 인프라를 활용하고 민첩성과 비용 혜택을 받을 수 있게 하려고 AWS를 시작했으며, 이제 모든 비즈니스에서 사용할 수 있도록 ML 기술을 계속해서 대중화하고 있습니다.
Amazon.com 개발 팀의 구조와 ML에 집중하여 실질적인 비즈니스 문제를 해결하려는 노력으로 Amazon.com과 AWS가 사용이 간편하며 강력한 ML 도구와 서비스를 개발하게 되었습니다. 이러한 도구는 다른 IT 서비스와 마찬가지로 모든 비즈니스에서 사용하도록 AWS 서비스로 제공하기 전에 Amazon.com의 규모와 미션 크리티컬 환경에서 먼저 테스트합니다.
기계 학습은 기록 데이터를 기반으로 미래의 결과를 예측하는 데 주로 사용됩니다. 예를 들어 조직에서는 기계 학습을 사용하여 특정 인구 통계학을 기반으로 향후 회계 분기에 제품이 얼마나 판매될지 예측하거나 브랜드에 대한 충성도가 높아지거나 불만족하게 될 가능성이 가장 높은 고객 프로파일을 예측합니다. 이러한 예측을 통해 비즈니스 의사 결정을 개선하고, 좀 더 개인적인 사용자 경험을 제공하며, 고객 유지 비용을 줄일 수 있습니다. 과거 비즈니스 데이터를 보고하는 데 집중하는 비즈니스 인텔리전스(BI)를 보완하는 ML은 과거의 추세와 트랜잭션을 기반으로 미래의 결과를 예측합니다.
비즈니스에서 ML을 성공적으로 구현하는 데 필요한 몇 가지 단계가 있습니다. 먼저 정확한 문제를 파악 – 알아내면 비즈니스에 도움이 될 예측이 무엇인지 파악합니다. 다음으로 데이터가 과거 비즈니스 지표(트랜잭션, 판매, 감소 등)를 기반으로 수집되어야 합니다. 데이터가 집계되면 해당 데이터를 기반으로 ML 모델이 구축될 수 있습니다. ML 모델이 실행되고 모델의 예측 결과가 비즈니스 시스템에 다시 적용되어 좀 더 정보에 근거한 의사 결정을 내릴 수 있습니다.

조직에서 기계 학습 구현하기
딥 러닝은 데이터를 좀 더 심층적으로 이해하기 위해 알고리즘을 계층화하는 것과 관련된 기계 학습의 한 분야입니다. 알고리즘은 이제 좀 더 기본적인 회귀 분석에서처럼 설명 가능한 관계 집합을 생성하는 데 국한되지 않습니다. 대신에 딥 러닝은 이러한 비선형 알고리즘 계층을 사용하여 일련의 요소를 기반으로 상호 작용하는 분산 표상을 생성합니다. 대규모 교육 데이터에서 딥 러닝 알고리즘이 요소 간 관계를 파악하는 것이 가능해지고 있습니다. 이러한 관계는 형태, 색상, 단어 등 간의 관계가 될 수 있습니다. 그런 다음 시스템이 예측을 생성하는 데 사용될 수 있습니다. 기계 학습과 인공 지능 분야에서 딥 러닝의 힘은 사람이 실제로 소프트웨어에 코딩할 수 있는 것보다 더 많은 관계 또는 사람이 인지할 수 없을지도 모르는 관계를 파악할 수 있는 데서 나옵니다. 충분한 교육을 한 후에 알고리즘 네트워크가 예측을 수행하거나 매우 복잡한 데이터를 해석하기 시작할 수 있습니다.
Convolutional Neural Network는 객체 분류를 비롯하여 많은 영상 작업에서 인간을 능가합니다. 레이블이 붙은 수백만 개의 사진에서 알고리즘 시스템이 이미지 피사체를 식별하기 시작할 수 있습니다. 딥 러닝 덕분에 많은 사진 스토리지 서비스에서 안면 인식 기능을 제공합니다. 안면 인식은 Amazon Rekognition, Amazon Prime Photos 및 Amazon의 Firefly Service의 핵심 기능입니다.
Amazon Alexa 및 기타 가상 비서는 요청을 인식하고 응답을 반환하도록 설계되었습니다. 사람은 목소리를 이해하는 것이 아주 어린 나이부터 가능하지만, 컴퓨터는 최근에야 사람의 목소리를 듣고 이에 응답할 수 있게 되었습니다. 사람의 억양과 음성 패턴이 모두 다르다는 점에서 음성 인식은 기존 수학 또는 컴퓨터 공학을 사용하여 해결하기에는 매우 어려운 기계 작업입니다. 딥 러닝을 사용하면 알고리즘 시스템이 어떤 소리가 났고 의도가 무엇인지 좀 더 쉽게 파악할 수 있습니다.
자연어 처리는 시스템이 사람의 언어, 억양 및 맥락을 이해하도록 가르치기 위해 노력합니다. 이를 통해 알고리즘이 감정이나 풍자와 같은 좀 더 어려운 개념을 포착할 수 있습니다. Amazon Lex에서 하듯이 기업이 음성 또는 텍스트 봇으로 고객 서비스를 자동화하려고 시도함에 따라 이 분야가 점점 성장하고 있습니다.
온라인 쇼핑에서는 고객이 구매하길 원할지도 모르는 항목, 보길 원할지도 모르는 영화 또는 관심이 있을 수 있는 뉴스와 관련된 맞춤형 콘텐츠 추천이 필요할 때가 많습니다. 지금까지 이러한 시스템은 사람이 항목 간의 연관성을 생성하는 방식으로 제공되었습니다. 하지만 빅 데이터와 딥 러닝의 출현으로 알고리즘이 고객의 과거 구매 또는 방문 제품을 조사하고 해당 정보를 다른 사람들과 비교하여 관심이 있을 만한 항목을 파악할 수 있으므로, 더는 사람이 개입할 필요가 없습니다.
>> 오픈 소스 딥 러닝 프레임워크인 MXnet에 대해 알아보고 시작하는 방법도 알아보세요.