AWS Lambda, 모든 상용 AWS 리전으로 응답 스트리밍 지원 확대

게시된 날짜: 2026년 4월 7일

AWS Lambda 응답 스트리밍이 이제 모든 상용 AWS 리전에 출시되어 이 기능에 대한 리전 패리티가 완전히 확보되었습니다. 새롭게 지원되는 리전의 고객은 데이터가 제공되면 InvokeWithResponseStream API를 사용하여 응답 페이로드를 클라이언트로 다시 점진적으로 스트리밍할 수 있습니다.

응답 스트리밍을 사용하면 함수에서 전체 응답을 전송하기 전에 버퍼링하는 대신 클라이언트에 부분 응답을 점진적으로 보낼 수 있습니다. 그러면 첫 번째 바이트까지 시간(TTFB) 지연 시간이 줄어듭니다. 그리고 LLM 기반 애플리케이션처럼 지연 시간에 민감한 워크로드, 응답이 점진적으로 나타날 경우 사용자에게 유용한 웹 및 모바일 애플리케이션에 적합합니다. 응답 스트리밍은 기본 최대 200MB의 페이로드를 지원합니다.

이번 확장으로 모든 상용 리전의 고객은 지원되는 AWS SDK를 통해 또는 응답 스트리밍이 활성화된 Amazon API Gateway REST API를 통해 InvokeWithResponseStream API를 사용하여 응답을 스트리밍할 수 있습니다. 응답 스트리밍은 Node.js 관리형 런타임과 사용자 지정 런타임을 지원합니다.

스트리밍 응답을 사용하면 응답 페이로드의 네트워크 전송에 추가 비용이 발생합니다. Lambda 함수에서 생성되어 스트리밍되는 데이터의 첫 6MB를 기준으로 요금이 부과됩니다. Lambda 응답 스트리밍을 시작하려면 AWS Lambda 설명서를 참조하세요.