생성형 AI란 무엇인가요?
생성형 인공 지능(약칭 생성형 AI)은 대화, 이야기, 이미지, 동영상, 음악 등 새로운 콘텐츠와 아이디어를 생성할 수 있는 AI의 일종으로 인간 언어, 프로그래밍 언어, 예술, 화학, 생물학 또는 복잡한 주제를 학습하도록 학습시킬 수 있습니다. 알고 있는 점을 재사용하여 새로운 문제를 해결합니다.
예를 들어, 영어 어휘를 학습하고 이를 처리하는 단어로 시를 지을 수 있습니다.
귀사 조직은 챗봇, 미디어 생성, 제품 개발과 설계 등 다양한 목적을 위해 생성형 AI를 사용할 수 있습니다.
생성형 AI 예제
산업 전반에 걸쳐 다양한 사용 사례를 가진 생성형 AI
금융 서비스
금융 서비스 회사는 생성형 AI 도구를 사용하여 비용을 절감하면서 고객에게 더 나은 서비스를 제공할 수 있습니다.
- 금융 기관은 챗봇을 사용하여 상품 추천을 생성하고 고객 문의에 응답하여 전반적인 고객 서비스를 개선합니다.
- 대출 기관은 금융 서비스가 부족한 시장, 특히 개발 도상국의 경우 대출 승인을 신속하게 처리합니다.
- 은행은 청구, 신용카드 및 대출 사기를 신속하게 탐지합니다.
- 투자 회사는 생성형 AI의 기능을 사용하여 저렴한 비용으로 고객에게 안전하고 개인화된 금융 자문을 제공합니다.
의료 및 생명 과학
생성형 AI의 가장 유망한 활용 방식 중 하나는 신약 발견과 연구를 가속화하는 것입니다. 생성형 AI는 항체, 효소, 백신 및 유전자 요법을 설계하기 위한 특정 특성을 가진 새로운 단백질 서열을 생성할 수 있습니다.
의료 및 생명과학 기업은 생성형 AI 도구를 사용하여 합성 생물학 및 대사 공학에 적용할 합성 유전자 서열을 설계할 수 있습니다. 예를 들어, 바이오제조 목적으로 새로운 생합성 경로를 만들거나 유전자 발현을 최적화할 수 있습니다.
또한 생성형 AI 도구를 사용하여 인공 환자 및 의료 데이터를 생성할 수 있습니다. 이 데이터는 대규모 실제 데이터세트에 액세스하지 않고도 AI 모델 훈련, 임상 시험 시뮬레이션 또는 희귀 질환 연구에 사용될 수 있습니다.
자동차 및 제조
자동차 회사는 엔지니어링부터 차량 내 경험 및 고객 서비스에 이르기까지 다양한 목적으로 생성형 AI 기술을 사용합니다. 예를 들어 기계 부품 설계를 최적화하여 차량 설계의 장애 요소를 줄이거나 개인 비서 설계를 조정합니다.
자동차 회사는 생성형 AI 도구를 사용해 가장 일반적인 고객 질문에 빠르게 응답하여 더 나은 고객 서비스를 제공합니다. 생성형 AI는 새로운 재료, 칩, 부품 설계를 생성해 제조 프로세스를 최적화하고 비용을 절감합니다.
또 다른 생성형 AI 사용 사례는 데이터를 합성하여 애플리케이션을 테스트하는 것입니다. 이는 테스트 데이터세트에 자주 포함되지 않는 데이터(예: 결함 또는 엣지 케이스)에 특히 유용합니다.
통신
통신 분야의 생성형 AI 사용 사례는 고객 여정의 모든 접점에서 발생하는 구독자의 누적 상호 작용으로 정의되는 고객 경험을 재창조하는 것에 중심을 둡니다.
예를 들어, 통신 조직은 생성형 AI를 적용하여 실제 사람과 같은 대화 에이전트를 통해 고객 서비스를 개선할 수 있습니다. 이때 개인화된 일대일 영업 보조원을 통해 고객 관계를 재창조할 수 있습니다. 또한 네트워크 데이터를 분석하여 수정 사항을 권장함으로써 네트워크 성능을 최적화합니다.
미디어 및 엔터테인먼트
애니메이션과 대본부터 장편 영화에 이르기까지 생성형 AI 모델은 기존보다 훨씬 적은 비용과 시간으로 참신한 콘텐츠를 제작합니다.
업계의 기타 생성형 AI 사용 사례는 다음과 같습니다.
- 아티스트는 AI가 생성한 음악으로 앨범을 보완하고 개선하여 완전히 새로운 경험을 창조할 수 있습니다.
- 미디어 조직은 생성형 AI를 사용해 개인화된 콘텐츠와 광고를 제공하여 고객 경험을 개선하고 수익을 증대합니다.
- 게임 회사는 생성형 AI를 사용하여 새로운 게임을 만들고 플레이어가 아바타를 만들도록 지원합니다.
생성형 AI의 이점
Goldman Sachs에 따르면 생성형 AI는 전 세계 국내총생산(GDP)를 7%(또는 약 7조 USD) 증가시키고 10년 동안 생산성을 1.5% 포인트 높일 수 있습니다. 다음으로 생성형 AI의 이점을 몇 가지 더 살펴보겠습니다.
생성형 AI 기술은 어떻게 발전했을까요?
원시 생성형 모델은 수치 데이터 분석을 지원하기 위해 수십 년 동안 통계에 사용되어 왔습니다. 신경망과 딥 러닝은 최근 현대 생성형 AI의 선구자입니다. 2013년에 개발된 변이형 오토인코더는 사실적인 이미지와 음성을 생성할 수 있는 최초의 심층 생성형 모델이었습니다.
VAE
변이형 오토인코더(VAE)는 여러 데이터 유형의 새로운 변형을 만들 수 있는 기능을 도입했습니다. 이로 인해 생성형 대립 네트워크 및 확산 모델과 같은 다른 생성형 AI 모델이 급속히 등장했습니다. 이러한 혁신은 인위적으로 생성되었음에도 불구하고 점점 더 실제 데이터와 유사한 데이터를 생성하는 데 중점을 두었습니다.
트랜스포머
2017년에는 트랜스포머가 도입되면서 AI 연구에 또 다른 변화가 일어났습니다. 트랜스포머는 인코더 및 디코더 아키텍처를 어텐션 메커니즘과 원활하게 통합했습니다. 그들은 뛰어난 효율성과 다양성으로 언어 모델의 훈련 과정을 간소화했습니다. GPT와 같은 주목할만한 모델은 광범위한 원시 텍스트를 사전 훈련하고 다양한 작업에 맞게 미세 조정할 수 있는 기본 모델로 등장했습니다.
트랜스포머는 자연어 처리의 가능성을 바꾸었습니다. 번역 및 요약부터 질문에 대한 답변에 이르기까지 다양한 작업을 위한 생성형 기능을 강화했습니다.
미래
많은 생성형 AI 모델은 계속해서 상당한 발전을 이루고 있으며 산업 전반에 적용할 수 있습니다. 최근 혁신은 독점 데이터를 사용할 수 있도록 모델을 개선하는 데 중점을 두고 있습니다. 연구자들은 또한 점점 더 인간과 비슷한 텍스트, 이미지, 비디오 및 음성을 만들고자 합니다.
생성형 AI는 어떻게 작동할까요?
모든 인공 지능과 마찬가지로 생성형 AI도 방대한 양의 데이터를 기반으로 사전 훈련된 초대형 모델인 기계 학습 모델을 사용합니다.
파운데이션 모델
파운데이션 모델(FM)은 광범위한 일반화된 데이터와 레이블이 지정되지 않은 데이터를 대상으로 훈련된 ML 모델입니다. FM은 다양한 일반 작업을 수행할 수 있습니다.
FM은 수십 년 동안 발전해 온 기술 중 가장 발전된 산물입니다. 일반적으로 FM은 학습된 패턴과 관계를 사용하여 시퀀스의 다음 항목을 예측합니다.
예를 들어, 이미지 생성 시 모델은 이미지를 분석하여 더 선명하고 명확하게 정의된 이미지 버전을 만듭니다. 마찬가지로, 텍스트를 다루는 모델은 이전 단어와 문맥을 기반으로 텍스트 문자열의 다음 단어를 예측합니다. 그런 다음 확률 분포 기법을 사용하여 다음 단어를 선택합니다.
대규모 언어 모델
대규모 언어 모델(LLM)은 FM의 한 클래스입니다. 예를 들어 OpenAI의 Generative Pre-trained Transformer(GPT) 모델은 LLM입니다. LLM은 특히 요약, 텍스트 생성, 분류, 개방형 대화 및 정보 추출과 같은 언어 기반 작업에 중점을 둡니다.
LLM을 특별하게 만드는 것은 여러 작업을 수행할 수 있는 능력입니다. 이렇게 할 수 있는 이유는 고급 개념을 학습할 수 있게 해주는 많은 파라미터가 포함되어 있기 때문입니다.
GPT-3 같은 LLM은 수십억 개의 매개변수를 고려할 수 있으며 아주 적은 입력으로도 콘텐츠를 생성할 수 있습니다. LLM은 다양한 양식과 수많은 패턴으로 구성된 인터넷 규모 데이터에 대한 사전 훈련 노출을 통해 지식을 광범위한 컨텍스트에 적용하는 방법을 학습합니다.
생성형 AI 모델은 어떻게 작동할까요?
기존의 기계 학습 모델은 차별적이거나 데이터 포인트를 분류하는 데 중점을 두었습니다. 알려진 요인과 알려지지 않은 요인 사이의 관계를 확인하려고 시도했습니다. 예를 들어 픽셀 배열, 선, 색상, 모양과 같은 알려진 데이터를 보고 이를 알 수 없는 요소인 단어에 매핑합니다. 수학적으로 모델은 알려지지 않은 요인과 알려진 요인을 x 및 y 변수로 수치적으로 매핑할 수 있는 방정식을 식별하는 방식으로 작동했습니다. 생성형 모델은 이를 한 단계 더 발전시킵니다. 특정 특징이 주어지면 레이블을 예측하는 방식 대신에 특정 레이블이 주어지면 특징을 예측하려고 합니다. 수학적으로 생성형 모델링은 x와 y가 함께 발생할 확률을 계산합니다. 다양한 데이터 특징의 분포와 그 관계를 학습합니다. 예를 들어, 생성 모델은 동물 이미지를 분석하여 다양한 귀 모양, 눈 모양, 꼬리 특징, 피부 패턴 등의 변수를 기록합니다. 다양한 동물들이 일반적으로 어떻게 생겼는지 이해하기 위해 특징과 관계를 배웁니다. 그런 다음 훈련 세트에 없었던 새로운 동물 이미지를 다시 만들 수 있습니다. 다음으로 몇 가지 광범위한 범주의 생성형 AI 모델에 대해 논의해보겠습니다.
확산 모델
확산 모델은 초기 데이터 샘플에 제어된 무작위 변경을 반복적으로 수행하여 새 데이터를 생성합니다. 원본 데이터로 시작하여 미세한 변화(노이즈)를 추가하여 점차 원본과 덜 유사하게 만듭니다. 이 노이즈는 생성된 데이터가 일관되고 사실적으로 유지되도록 세심하게 제어됩니다.
여러 번의 반복에 걸쳐 노이즈를 추가한 후 확산 모델은 프로세스를 역전시킵니다. 역 노이즈 제거는 노이즈를 점진적으로 제거하여 원본과 유사한 새 데이터 샘플을 생성합니다.
생성형 대립 네트워크
생산적 적대 신경망(GAN)는 확산 모델의 개념을 기반으로 하는 또 다른 생성형 AI 모델입니다.
GAN은 두 신경망을 경쟁적으로 훈련시키는 방식으로 작동합니다. 생성자라는 첫 번째 네트워크는 무작위 발생 노이즈를 추가하여 가짜 데이터 샘플을 생성합니다. 판별자라는 두 번째 네트워크는 실제 데이터와 생성자가 생성한 가짜 데이터를 구별하려고 시도합니다.
훈련 중에 생성자는 사실적인 데이터를 생성하는 능력을 지속적으로 개선하며, 판별자는 가짜와 진짜를 더 잘 구분합니다. 이러한 대립적 과정은 생성자가 판별자가 실제 데이터와 구별할 수 없을 정도로 확실한 데이터를 생성할 때까지 계속됩니다.
GAN은 사실적인 이미지 생성, 스타일 전송 및 데이터 증강 작업에 널리 사용됩니다.
변이형 오토인코더
변이형 오토인코더(VAE)는 잠재 공간이라는 간결한 데이터 표현을 학습합니다. 잠재 공간은 데이터를 수학적으로 표현한 것입니다. 모든 속성을 기반으로 데이터를 나타내는 고유한 코드라고 생각할 수 있습니다. 예를 들어 얼굴을 연구하는 경우, 잠재 공간에는 눈 모양, 코 모양, 광대뼈 및 귀를 나타내는 숫자가 포함됩니다.
VAE는 인코더와 디코더라는 두 개의 신경망을 사용합니다. 인코더 신경망은 입력 데이터를 잠재 공간의 각 차원에 대한 평균 및 분산에 매핑합니다. 가우스(정규) 분포에서 무작위 표본을 생성합니다. 이 샘플은 잠재 공간의 한 지점이며 입력 데이터의 압축되고 단순화된 버전을 나타냅니다.
디코더 신경망은 잠재 공간에서 이 샘플링된 지점을 가져와 원래 입력과 유사한 데이터로 다시 재구성합니다. 수학 함수는 재구성된 데이터가 원본 데이터와 얼마나 잘 일치하는지 측정하는 데 사용됩니다.
트랜스포머 기반 모델
트랜스포머 기반 생성형 AI 모델은 VAE의 인코더 및 디코더 개념을 기반으로 합니다. 트랜스포머 기반 모델은 인코더에 더 많은 레이어를 추가하여 이해, 번역, 창의적 글쓰기와 같은 텍스트 기반 작업의 성능을 개선합니다.
트랜스포머 기반 모델은 셀프 어텐션 메커니즘을 사용합니다. 시퀀스의 각 요소를 처리할 때 여러 가지 입력 시퀀스 부분의 중요성에 가중치를 둡니다.
또 다른 주요 특징은 이러한 AI 모델이 컨텍스트 임베딩을 구현한다는 것입니다. 시퀀스 요소의 인코딩은 요소 자체 뿐만 아니라 시퀀스 내의 컨텍스트에 따라 달라집니다.
트랜스포머 기반 모델의 작동 방식
트랜스포머 기반 모델이 어떻게 작동하는지 이해하려면 일련의 단어로 구성된 문장을 생각해 보세요.
셀프 어텐션은 모델이 각 단어를 처리할 때 관련 단어에 집중할 수 있도록 도와줍니다. 단어 간의 다양한 유형의 관계를 캡처하기 위해 트랜스포머 기반 생성 모델은 어텐션 헤드라는 다중 인코더 계층을 사용합니다. 각 헤드는 입력 시퀀스의 서로 다른 부분에 주의를 기울이는 법을 학습하여 모델이 데이터의 다양한 측면을 동시에 고려할 수 있도록 합니다.
또한 각 계층은 컨텍스트 임베딩을 개선하여 더 많은 정보를 제공하고 문법 구문부터 복잡한 의미론적 의미에 이르기까지 모든 것을 캡처합니다.
초보자를 위한 생성형 AI 교육
생성형 AI 교육은 기본적인 기계 학습 개념을 이해하는 것으로 시작됩니다. 학습자는 또한 신경망과 AI 아키텍처를 탐색해야 합니다. TensorFlow 또는 PyTorch와 같은 Python 라이브러리에 대한 실제 경험은 다양한 모델을 구현하고 실험하는 데 필수적입니다. 또한 모델 평가, 미세 조정 및 프롬프트 엔지니어링 기술을 배워야 합니다.
인공 지능 또는 기계 학습 학위는 심층적인 교육을 제공합니다. 전문성 개발을 위한 온라인 단기 과정 및 인증을 고려하시기 바랍니다. AWS 기반 생성형 AI 교육에는 다음과 같은 주제에 대한 AWS 전문가 자격증이 포함됩니다.
생성형 AI의 한계는 무엇인가요?
기계 학습이 발전했지만 생성형 AI 시스템은 때때로 부정확하거나 오해의 소지가 있는 정보를 생성할 수 있습니다. 학습한 패턴과 데이터에 의존하며 해당 데이터에 내재된 편향이나 부정확성을 나타낼 수 있습니다. 훈련 데이터와 관련된 기타 우려 사항은 다음과 같습니다.
보안
전용 데이터를 사용하여 생성형 AI 모델을 사용자 지정하는 경우 데이터 프라이버시 및 보안 문제가 발생합니다. 생성형 AI 도구가 독점 데이터에 대한 무단 액세스를 제한하는 응답을 생성하도록 노력해야 합니다. AI 모델의 의사 결정 방식에 대한 책임성과 투명성이 부족한 경우에도 보안 문제가 발생합니다.
AWS를 사용한 생성형 AI에 대한 안전한 접근 방식에 대해 알아보기
창의성
생성형 AI는 창의적인 콘텐츠를 제작할 수 있지만 진정한 독창성은 부족한 경우가 많습니다. AI의 창의성은 학습된 데이터로 제한되기 때문에 반복적이거나 모방적이라고 느껴질 수 있는 결과가 나옵니다. AI가 더 깊은 이해와 감동적인 공감을 수반하는 인간의 창의성을 완벽하게 재현하기는 여전히 어렵습니다.
비용
생성형 AI 모델을 훈련하고 실행하려면 상당히 많은 컴퓨팅 리소스가 필요합니다. 클라우드 기반 생성형 AI 모델은 새로운 모델을 처음부터 구축하는 것보다 접근성이 뛰어나고 경제적입니다.
설명 가능성
생성형 AI 모델은 복잡하고 불투명한 특성 때문에 블랙박스로 간주되는 경우가 많습니다. 이러한 모델이 특정 출력에 어떻게 도달하는지 이해하는 것은 어렵습니다. 신뢰와 채택을 높이려면 해석 가능성과 투명성을 개선해야 합니다.
생성형 AI 도입의 모범 사례는 무엇입니까?
조직에서 생성형 AI 솔루션을 구현하려는 경우, 다음 모범 사례를 고려해 활동을 강화하세요.
AWS는 어떻게 Generative AI를 지원할 수 있나요?
Amazon Web Services(AWS)를 사용하면 데이터, 사용 사례 및 고객을 위한 생성형 AI 애플리케이션을 쉽게 구축하고 확장할 수 있습니다. AWS 기반 생성형 AI를 통해 엔터프라이즈급 보안 및 개인정보 보호, 업계 최고의 FM에 대한 액세스, 생성형 AI 기반 애플리케이션, 데이터 우선 접근 방식을 얻을 수 있습니다.