AWS 기술 블로그

Category: Technical How-to

Amazon ElastiCache 워크로드를 위한 카오스 실험

Amazon ElastiCache는 Valkey, Memcached 및 Redis OSS와 호환되는 완전관리형 서비스로서 99.99%의 가용성을 갖추고 있으며 현대적 애플리케이션의 성능을 최적의 비용으로 실시간으로 개선합니다. ElastiCache의 다양한 기능 중 다중 AZ(가용 영역)는 자체 ElastiCache 캐시를 설계할 때 가용성이 더욱 뛰어난 구성으로 실행할 수 있는 기능입니다. 특정 유형의 예정된 유지 관리를 수행하는 동안이나 노드(*node, 본 게시글에서는 ElastiCache의 단일 EC2 instance를 […]

Amazon Bedrock Knowledge Bases로 멀티테넌트 RAG 구성하기

이 글은 AWS Machine Learning 블로그에 게시된 글 (Multi-tenant RAG with Amazon Bedrock Knowledge Bases)를 한국어로 번역 및 편집하였습니다. 조직들은 지속적으로 자사의 독점적 지식과 도메인 전문성을 활용하여 경쟁 우위를 확보하는 방법을 모색하고 있습니다. 기초 모델(Foundation Model, FM)과 그들의 놀라운 자연어 처리 능력의 출현으로, 데이터 자산의 가치를 실현할 수 있는 새로운 기회가 생겼습니다. 조직들이 생성형 AI를 […]

LilysAI의 Amazon Bedrock을 활용한 유튜브 검색 기능 구현 여정

3시간 분량의 키노트 영상, 100페이지 분량의 기업 분석 보고서, 2시간짜리 회의 녹음을 살펴보려니 벌써 머리가 지끈거립니다. 특히 영어로 된 자료라면 더 많은 시간을 들여야 합니다. LilysAI는 유튜브 영상, PDF 문서, 음성 녹음, 웹 페이지를 간단한 불릿 포인트로 요약해 줍니다. 또한 원본 언어와 관계없이 한국어로 요약 노트를 제공합니다. 하지만 여전히 콘텐츠를 탐색하는 데 어려움이 있습니다. 특히 […]

Amazon EKS 멀티 클러스터 로드밸런싱으로 고가용성 애플리케이션 구성하기

소개 Amazon Elastic Kubernetes Service(Amazon EKS)는 AWS 클라우드 환경에서 Kubernetes를 운영하시는데 사용할 수 있는 관리형 서비스입니다. Amazon EKS를 사용하면 AWS의 네트워크 및 보안 서비스와의 통합뿐만 아니라 AWS 인프라의 성능, 규모, 신뢰성 및 가용성을 활용할 수 있습니다. Amazon EKS는 클러스터를 다중 가용영역에 걸쳐 구성하는 방법으로 클러스터에 배포된 애플리케이션의 고 가용성을 지원합니다. 하지만 경우에 따라서는 클러스터 단위의 […]

Amazon Q Developer를 활용한 Amazon DynamoDB 개발 가속화

본 게시물은 AWS Database Blog에 게시된 “Faster development with Amazon DynamoDB and Amazon Q Developer” by Chris Gillespie 을 한국어로 번역한 글입니다. Amazon Q Developer는 AWS에서 애플리케이션 개발을 가속화할 수 있는 Generative Artificial Intelligence(Gen AI) 도우미입니다. 통합 개발 환경(IDE)에서 사용될 때, Amazon Q는 소프트웨어 개발 지원을 제공합니다. Amazon Q는 코드에 대해 대화하고, 인라인 코드 완성을 […]

자체 구축 계산기로 AWS 네트워크 비용 추정하기

이 글은 Networking & Content Delivery 블로그의 Estimate AWS networking costs with a self-hosted calculator 을 한국어 번역 및 편집하였습니다. Amazon Web Services (AWS)는 다양한 네트워킹 서비스를 제공합니다. 이러한 서비스를 통해 AWS는 네트워킹과 관련된 더 많은 고객의 요구를 충족할 수 있지만, 이러한 다양성은 AWS 및 하이브리드 네트워킹 인프라를 설계할 때 아키텍처 결정을 내릴 때 고려할 […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 3 – Amazon Elastic Kubernetes Service (EKS) 기반의 GPU 클러스터

서론 “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기” 블로그 시리즈는 Amazon EC2의 가속 컴퓨팅 인스턴스와 AWS에서 제공되는 다양한 리소스를 이용하여, 멀티 노드 가속 컴퓨팅 환경을 쉽게 구축할 수 있는 방법에 대해서 알아 봅니다. 블로그는 아래와 같이 3개의 시리즈로 구성이 되어 있으며, 파트 1에서는 AWS Deep Learning AMI (DLAMI)를 사용한 쉽고 빠른 컴퓨팅 환경 구축에 대해서 알아 […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 2 – AWS ParallelCluster

서론 “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기” 블로그 시리즈는 Amazon EC2의 가속 컴퓨팅 인스턴스와 AWS에서 제공되는 다양한 리소스를 이용하여, 멀티 노드 가속 컴퓨팅 환경을 쉽게 구축할 수 있는 방법에 대해서 알아 봅니다. 블로그는 아래와 같이 3개의 시리즈로 구성이 되어 있으며, “Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 1 – AWS Deep Learning AMI (DLAMI)”에서 […]

Amazon EC2 가속 컴퓨팅 인스턴스 활용하기 – 파트 1 – AWS Deep Learning AMI (DLAMI)

서론 전통적인 고성능 컴퓨팅(HPC, High Performance Computing) 뿐만 아니라, 인공지능, 기계 학습, 그리고 생성형 AI의 활용도가 높아짐에 따라, 고성능 GPU가 장착된 가속 컴퓨팅을 위한 하드웨어의 수요와 사용률이 급격히 증가하고 있습니다. 이는 온프레미스 데이터센터 뿐만 아니라 클라우드에서도 동일한 현상이 나타나고 있습니다. AWS와 같은 클라우드 서비스 제공업체를 통한 빠른 컴퓨팅 리소스의 공급, 구축, 그리고 온디맨드 방식의 과금은 […]

리전 AWS STS 엔드포인트 사용하기

이 글은 AWS Big Data 블로그의 How to use Regional AWS STS endpoints by Darius Januskis의 한국어 번역입니다. 이 블로그 포스팅에서는 글로벌 (현재 레거시) AWS Security Token Service (AWS STS) 엔드포인트의 가용성이 예기치 않게 감소하는 경우 복원력을 개선하는 데 도움이 되는 권장 사항을 제공합니다. 글로벌 (레거시) AWS STS 엔드포인트 https://sts.amazonaws.com은 가용성이 높지만 단일 AWS 리전—미국 동부 […]