AWS 기술 블로그
Category: Analytics
당근페이의 Amazon Bedrock 기반 Text-to-SQL로 완성하는 데이터 혁신, Part 1: 브로쿼리 개요와 아키텍처
이 블로그는 2025 Seoul Summit에서 “Amazon Bedrock 기반Text-to-SQL로 완성하는 데이터 혁신:당근페이의 핀테크 성공 전략”의 주제로도 발표되었으며, 세션에서 다루지 못했던 세부 내용에 대해서도 추가로 소개합니다. 블로그는 당근페이 내부 Text-to-SQL 챗봇인 브로쿼리(Broquery)에 대해 총 2부에 걸쳐 소개하고자 합니다. 1부에서는 브로쿼리의 기획 배경과 전반적인 아키텍처를 소개합니다. 2부에서는 Text-to-SQL의 정확도를 좌우하는 요소인 ‘컨텍스트’, 즉 메타데이터 수집 및 관리 방법을 […]
SAP OData connection과 AWS Glue로 S3 Tables에서 SAP Data 활용하기
AWS Tech Blog ‘SAP 데이터와 AWS Glue를 활용하여 RISE 워크로드 확장하기’에서 AWS Glue OData 커넥터를 활용하여, SAP Data를 S3에 저장하고 Glue Data Catalog를 통해 Data를 활용하는 방법에 대해서 말씀드렸습니다. 이 블로그는 ‘SAP 데이터와 AWS Glue를 활용하여 RISE 워크로드 확장하기’의 내용을 기반으로 하고 있기 때문에, 이 블로그와 함께 꼭 읽어보시기를 추천드립니다. Amazon S3 Tables는 분석 워크로드에 […]
AWS Glue ETL을 활용한 CRM 데이터의 효율적인 병렬처리 전략
노티플라이는 CRM 마케팅 솔루션으로서, 100여 개 이상의 다양한 고객사들의 마케팅 캠페인을 집행하고 결과를 분석하는 기능을 제공하고 있습니다. 마케팅 성과를 보다 정확하고 빠르게 분석하기 위해 캠페인과 관련된 사용자 이벤트 데이터를 수집하고 집계하여 실시간에 가깝게 통계 데이터를 제공해야 합니다. 노티플라이는 다음과 같은 요구사항을 해결하기 위해 AWS 서비스들로 구성된 효율적인 ETL 파이프라인을 구축했습니다. 고객사별 캠페인 성과 데이터의 정기적인 […]
알리는사람들의 Amazon Data Firehose로 Amazon DynamoDB를 Amazon S3 tables로 실시간 복제하기
개요 알리는사람들은 다양한 메시징 채널을 통합하여 기업의 커뮤니케이션을 자동화하고, 고객에게 정확한 메시지를 빠르게 전달할 수 있도록 돕는 테크 스타트업입니다. 인증, 마케팅, 알림 등 다양한 메시지 유형을 유연하게 다룰 수 있는 인프라를 바탕으로, 수많은 기업이 일상적인 고객 커뮤니케이션을 효율적으로 운영하고 있습니다. 센드온(Sendon)은 알리는사람들이 개발한 클라우드 네이티브 메시징 플랫폼으로, 대용량 메시지 전송에 최적화된 서버리스 아키텍처를 기반으로 운영됩니다. […]
더블유젯소프트(WZSOFT)의 미음 챗봇 도입기: AWS Bedrock 기반 AI 챗봇으로 뷰티샵 상담 자동화 하기
들어가며 더블유젯소프트(WZSOFT)는 뷰티샵 운영의 디지털 전환을 선도하는 SaaS 플랫폼 미음을 통해, 예약 관리, 고객 응대, 매출 분석 등 운영에 필요한 기능을 통합적으로 제공합니다. 미음은 디자이너가 시술에 집중할 수 있도록 반복적인 관리 업무를 자동화하고, 매장 운영 효율을 극대화하는 것을 목표로 합니다. 뷰티샵의 고객 상담은 운영 시간, 시술 가격, 예약 변경 등 정형화된 문의가 대부분입니다. 하지만 이러한 […]
티오더의 Amazon Bedrock을 활용한 MCP 기반 운영 플랫폼 개발기
티오더는 ‘테이블 오더’ 서비스를 시작으로, F&B 시장의 새로운 패러다임을 만들어나가고 있는 기업입니다. 누적 25만 대 이상의 태블릿 설치 대수와 매월 2,500만 명 이상의 사용자를 보유하며 태블릿 메뉴판 시장에서 업계를 선도해 나가고 있습니다. 다양한 사용자의 데이터를 수집 및 가공하여 F&B 시장에 꼭 필요한 정보를 추출하고, 가공한 데이터를 다시 매장의 사장님께 제공함으로써 서로 상생해나가는 선순환 구조를 확립하였습니다. […]
Amazon Network Firewall 모범 사례 #4 – 로그 수집 및 분석
1. 시작하며 이 게시물은 AWS Network Firewall(이하 “ANF”) 모범 사례 시리즈의 네 번째 게시물로 ANF의 기능 중 하나인 로그 설정 방안과 특징 및 활용 사례에 대해 알아보도록 하겠습니다. 보안에서 로그는 각종 시스템에서 처리되는 정보와 해당 정보에 대한 처리 메커니즘 등을 이해하고 문제를 해결하거나 내외부에서 발생하는 위협을 탐지하거나 차단하는 데 중요한 정보를 제공합니다. ANF 환경에서 역시 […]
Amazon OpenSearch Service 의 LTR 플러그인을 활용한 검색 품질 개선
개요 Amazon OpenSearch Service는 BM25(Best Match 25)라는 확률론적 순위 알고리즘을 사용하여 문서와 검색 키워드간 관련성 점수를 계산합니다. 문서에 고유 키워드가 더 자주 나타난다면 BM25 알고리즘은 해당 문서에 더 높은 점수를 부여합니다. 이는 검색 서비스에서 사용하는 인기 있는 알고리즘으로 사용자의 검색 의도에 맞게 키워드의 가중치를 조정하여 결과를 정렬합니다. 하지만, 이 알고리즘은 CTR(Click-through rate)과 같은 사용자의 행위는 […]
AWS DataZone에서 OpenLineage 기반의 Airflow 데이터 계보 그리기
배경 Airflow는 데이터 마트(Data Mart)를 포함한 데이터 파이프라인 구축 및 관리에서 매우 널리 사용되는 도구입니다. 이러한 Airflow에서 데이터 계보가 중요한 이유는 데이터의 출처와 변환 과정을 명확히 추적할 수 있어 데이터의 신뢰성을 보장하고, 문제 발생 시 원인을 빠르게 파악할 수 있기 때문입니다. 또한, 데이터 계보는 규제 준수와 감사 요구사항을 충족시키는 데 도움을 주며, 데이터 파이프라인의 변경이 […]
AWS Lambda와 PyIceberg 로 Amazon S3 Tables 시작하기
2024년 AWS re:Invent에서 Amazon S3 Tables가 새롭게 공개되었습니다. S3 Tables는 Amazon S3에 Apache Iceberg 형식의 테이블을 관리할 수 있는 완전 관리형 기능으로, 데이터 레이크 테이블 관리의 복잡성을 크게 줄여줍니다. Iceberg를 통해 S3에 저장된 데이터를 마치 데이터베이스 테이블처럼 다룰 수 있으며, Athena, EMR(Spark), Redshift, Glue 등 다양한 분석 엔진과 통합됩니다. 특히 S3 Tables를 활용하면 자체 관리하는 […]









