고성능 컴퓨팅(HPC)이란 무엇인가요?

AWS 고성능 컴퓨팅이란 무엇인가요?

고성능 컴퓨팅(HPC)은 컴퓨팅 시스템 그룹을 결합하여 수조 개의 데이터 요소에 걸쳐 동시적이고 복잡한 계산을 수행하는 IT 인프라 전략입니다. 단일 컴퓨팅 시스템은 하드웨어에 의해 처리 용량이 제한되며, 기후 모델링, 신약 개발, 게놈 연구 등과 같은 분야에서 시뮬레이션을 수행하는 데 있어 활용도가 낮습니다. HPC 기술은 여러 컴퓨팅 시스템을 병렬로 활용하여 처리 속도를 기하급수적으로 증가시킬 수 있습니다.

최근 몇 년 동안 HPC 기술은 과학적 시뮬레이션 수행에서 대규모 AI 모델 및 워크로드 실행하는 것으로 크게 발전했습니다.

HPC 사용 사례란 무엇인가요?

고성능 컴퓨팅은 학계, 산업 및 기업 전반에 걸쳐 다양한 사용 사례가 있습니다.

미디어 및 엔터테인먼트

고성능 클러스터는 비디오 및 3D 그래픽 렌더링, 고화질 라이브 이벤트 스트리밍, CGI 처리 등과 같은 작업에 필요한 연산 성능을 제공합니다. 미디어 기업은 HPC 클러스터를 활용하여 제작 일정을 줄이고, 비디오 인코딩 속도를 높이며, 제작 프로세스 비용을 절감할 수 있습니다.

의료 및 유전체학

의료 산업에서는 유전체 염기서열 분석부터 단백질 구조 예측, 신약 개발 이니셔티브에 이르기까지 다양한 분야에서 HPC를 활용합니다. HPC 클러스터에서 실행되는 AI 기반 모델은 약물 연구와 적용을 한층 더 개선하는 데 기여합니다.

병원에서는 고성능 컴퓨팅이 AI 소프트웨어와 함께 작동하여 이미지 스캔을 통해 질병을 식별하고, 맞춤형 치료 계획을 수립하며, 의료 기록 관리 최적화를 지원합니다.

정부 및 국방

고성능 컴퓨팅은 암호화, 실시간 감시, 정보 분석, 위협 탐지 등 다양한 국방 솔루션에 필요한 자원을 제공하는 지원 기술입니다. 확장 가능한 리소스 시스템에 액세스하면 정부가 국가 안보 이니셔티브, 군사 시뮬레이션 등과 같은 작업을 수행하는 데 필요한 연산 능력을 확보할 수 있습니다.

기후 모델링

기상 예보 및 기후 데이터를 생성하기 위해 지구 전역의 유체 시스템 흐름을 시뮬레이션하려면 방대한 데이터를 동시에 처리해야 합니다. HPS는 데이터를 신속하게 수집하고 처리할 수 있는 연산 능력을 제공하여, 자연재해 예측, 기상 시스템 모니터링, 장기 기후 변화 예측을 수행하는 기관에 중요한 인사이트를 제공합니다.

금융 서비스

헤지펀드, 보험 기관, 은행 등 금융 서비스는 HPC를 사용하여 예측 모델을 실행하고, 신용 위험을 예측하며, 포트폴리오를 최적화하는 데 필요한 데이터를 처리합니다. HPC가 제공하는 연산 능력은 실시간 인사이트를 통해 데이터 분석을 개선합니다.

자동차 부문

고성능 컴퓨팅은 자동차 산업에서 계산 유체역학, 소재 테스트, 충돌 시뮬레이션 테스트 등에서도 필수적인 기술입니다. HPC는 설계의 신속한 프로토타이핑과 실시간 최적화를 제공하며 공장 워크플로를 시뮬레이션하는 데 도움이 됩니다. 또한 HPC는 자율주행 자동차 및 실시간 컴퓨터 비전 기반 의사 결정의 핵심 기술입니다.

사이버 보안

고성능 컴퓨팅을 통해 네트워크 관리자는 트래픽을 분석하여 이상 징후를 탐지하고, 잠재적 위협을 사전에 식별할 수 있습니다. HPC는 암호화, 시스템 전체 평가, 실시간 위협 대응 등에도 필요한 연산 자원을 제공합니다.

HPC는 어떻게 작동하나요?

고성능 컴퓨팅은 여러 서버, 컴퓨터, 워크스테이션의 연산 능력을 결합하여 더 강력한 처리 솔루션을 제공합니다. 이와 같이 여러 노드가 함께 작동하는 프로세스를 병렬 컴퓨팅이라고 합니다. 이 시스템에서 각 개별 시스템을 노드라고 하며, 여러 개의 노드가 모여서 클러스터를 형성합니다. 시스템에서 각 노드는 서로 다른 작업을 담당하며, 모든 노드가 병렬로 작동하여 처리 속도를 증가시킵니다.

클러스터 노드

HPC 솔루션에는 여러 유형의 노드가 포함되어 있습니다.

컨트롤러 노드는 더 광범위한 클러스터 시스템에 걸쳐 작업을 조정합니다.
워커 노드 또는 컴퓨팅 노드는 모든 처리를 수행합니다.
인터랙티브 노드 또는 로그인 노드는 사용자가 명령어 인터페이스나 GUI를 통해 HPC 시스템에 접속할 수 있도록 합니다.

HPC 클러스터는 각 노드가 서로 다른 하드웨어를 갖춘 이기종 클러스터일 수도 있고, 각 노드의 성능이 비슷한 동종 클러스터일 수도 있습니다.

HPC 클러스터 구조

주요 HPC 클러스터 구조에는 두 가지가 있습니다.

클러스터 컴퓨팅

클러스터 컴퓨팅은 병렬 컴퓨팅이라고도 하며, 클러스터 집합이 비슷한 기능과 비슷한 위치에서 함께 작동하는 것을 말합니다. 이 구조는 노드 간 네트워크 토폴로지가 유사하고 물리적으로 가깝게 배치되어 지연 시간을 최소화합니다.

분산 컴퓨팅

분산 컴퓨팅은 비슷한 위치에 있거나 전 세계에 분산되어 있는 클러스터를 사용할 수 있습니다. 이 클러스터 형식은 클라우드 리소스와 온프레미스 하드웨어를 함께 활용할 수 있어 HPC에 보다 유연하고 확장성 있는 접근이 가능합니다.

HPC 작업은 어떻게 작동하나요?

HPC 시스템은 서로 다른 두 종류의 프로세스인 느슨하게 연결된 워크로드와 긴밀하게 연결된 워크로드를 실행합니다.

느슨하게 연결된 워크로드

느슨하게 연결된 워크로드란 시스템 내에서 HPC 시스템이 병렬로 발생할 수 있는 다른 기능과 독립적으로 완료하는 작업입니다. 수많은 독립 작업이 동시에 발생하기 때문에 이러한 형태의 HPC 처리 작업을 병렬 워크로드 작업이라고도 합니다.

예를 들어 비디오를 렌더링할 때, 각 프레임은 다른 작업으로 작동합니다. 각 프레임을 렌더링하는 노드는 동일한 스토리지를 사용할 수 있지만, 작업 완료 여부는 다른 노드의 진행 상황에 영향을 받지 않습니다.

긴밀하게 연결된 워크로드

긴밀하게 연결된 워크로드란 전체 작업을 완료하기 위해 서로 의존하는 HPC 처리 작업입니다. 이러한 워크로드는 클러스터 공유 메모리 및 스토리지를 활용하여 클러스터의 모든 노드 간에 정보를 공유함으로써 각 노드가 동시에 작업을 완료할 수 있도록 지원합니다. 긴밀하게 연결된 워크로드는 종종 실시간 조정이 필요한 경우가 많으며, 대규모 작업을 완료할 수 있도록 수많은 노드가 작은 양으 ㅣ정보를 제공합니다. 예를 들어, 각 노드는 일기 예보의 서로 다른 물리적 요소를 시뮬레이션할 책임을 지며, 최종 일기 예보를 생성하려면 모든 노드의 정보를 결합해야 합니다.

클라우드에서 HPC란 무엇인가요?

클라우드에서 고성능 컴퓨팅을 사용하면 기업은 사용하는 HPC 클러스터를 관리하지 않고도 HPC 솔루션을 활용할 수 있습니다. 클라우드의 HPC는 값비싼 온프레미스 데이터 센터를 구축하는 대신, 기업에 필요하면서 확장 가능한 컴퓨팅 파워를 제공하는 비용 효율적인 솔루션입니다.

세 가지 트렌드가 융합되면서 HPC 클라우드 서비스의 확장 속도가 더욱 빨라졌습니다.

지연 시간이 짧은 RDMA 네트워킹

원격 직접 메모리 액세스(RDMA)를 사용하면 네트워크 노드는 운영 체제를 거치지 않고도 메모리에 액세스할 수 있습니다. 이 방식을 사용하면 한 노드가 다른 노드와 상호 작용할 때 프로세스를 중단하지 않도록 해서 프로세스 병목 현상을 제거하고 지연 시간을 최소화하여 처리량을 극대화할 수 있습니다.

클라우드 컴퓨팅에 대한 수요 증가

HPC는 사용 사례가 다양하기 때문에 이제는 다양한 업계의 많은 기업에서 HPC 서비스를 필요로 하고 있습니다. 클라우드에서 HPC를 사용하면 자체 데이터 센터를 구축하지 않고도 HPC 서비스에 액세스할 수 있어, 기술의 접근성이 크게 향상됩니다.

광범위한 AI 사용

HPC 클라우드 서비스에 대한 수요가 증가하는 또 다른 원인은 AI 및 기계 학습 소프트웨어의 광범위한 사용입니다. 생성형 AI 도구에는 상당한 컴퓨팅 파워가 필요하며, HPC는 이러한 시스템의 컴퓨팅 리소스와 확장성을 제공합니다. HPC는 엔터프라이즈급 AI 도구를 활용하고자 하는 기업에 효과적인 솔루션입니다.

클라우드에서 HPC가 가진 이점은 무엇인가요?

클라우드에서 HPC를 실행하면 여러 가지 이점이 있습니다.

통합 및 원격 관리

모든 HPC 프로젝트마다 고유한 인프라 요구 사항이 있습니다. 직접 구매 방식은 조직이 투자할 수 있는 몇 가지 특정 구성으로 선택을 제한합니다. 하지만 HPC 클라우드를 사용하면 조직은 프로젝트에 필요에 따라 스토리지, 컴퓨팅, 네트워킹, 로그인 노드, GPU, 워크스테이션 등 다양한 구성을 자유롭게 선택하고 조합할 수 있습니다. 관리 콘솔을 활용하여 중앙 위치에서 이러한 모든 시스템과 상호 작용할 수 있습니다. 이로써 워크플로가 간소화되고 클러스터 기능이 자동화되어 향상된 편의성을 제공할 수 있습니다.

동적 리소스 프로비저닝 및 규모 조정

고성능 클라우드 컴퓨팅 시스템을 사용하면 기업은 컴퓨팅 리소스를 필요에 따라 유연하게 확장하거나 축소할 수 있어, 수요 변화에 즉시 대응할 수 있습니다. 이러한 유연성은 효율성을 높이고 리소스 사용을 최적화합니다.

관리형 업데이트

클라우드 컴퓨팅 제공업체를 통해 관리되는 HPC 워크로드는 시스템을 최신 상태로 유지하기 위해 자동으로 업데이트를 수행합니다. 이러한 접근 방식은 HPC 솔루션을 항상 최신 상태로 유지하고 가장 효과적인 서비스를 제공할 수 있도록 지원합니다.

맞춤형 애플리케이션을 사용할 수 있는 유연성

기업은 클라우드 제공업체에게 애플리케이션을 제공할 수 있습니다. 운영 체제 및 사전에 설치된 소프트웨어를 사용자 지정하여 특정 워크로드 요구 사항을 충족시킵니다.

AWS는 HPC 요구 사항을 어떻게 지원하나요?

AWS HPC 완전 관리형 서비스를 사용하면 사실상 무제한의 HPC 클라우드 인프라를 통해 혁신의 속도를 증가시킬 수 있습니다. 예를 들어 다음과 같습니다.

AWS Parallel Computing Service는 고성능 컴퓨팅 워크로드를 호스팅할 수 있는 완전한 탄력적 환경을 구축하는 데 사용 가능한 완전 관리형 서비스를 제공합니다.
AWS ParallelCluster는 AWS에서 HPC 클러스터 관리를 간소화하는 올인원 오픈 소스 클러스터 관리 도구입니다.
Amazon Elastic Fabric Adapter는 사용자가 필요한 규모로 HPC 및 ML 애플리케이션을 실행할 수 있도록 지원하며, 수천 개의 GPU나 CPU까지 확장할 수 있는 기능을 제공합니다.
Amazon DCV는 원격 디스플레이 프로토콜로, 고객이 다양한 네트워크 조건에서 원격 데스크톱 및 애플리케이션 스트리밍을 안전하게 전송할 수 있는 방법에 액세스할 수 있도록 지원합니다.

지금 바로 무료 계정을 만들어 AWS에서 고성능 컴퓨팅을 시작하세요.