AWS Lambda 将响应流式传输功能扩展至所有 AWS 商业区域

发布于: 2026年4月7日

AWS Lambda 响应流式传输功能现已在所有 AWS 商业区域推出,实现了在各区域的全面一致性。新支持的区域中的客户可以使用 InvokeWithResponseStream API,在数据可用时将响应有效载荷逐步流式传输回客户端。

响应流式传输功能使函数能够分批向客户端发送部分响应,而非在传输前缓冲整个响应。这可以降低首字节时间(TTFB)延迟,非常适合对延迟敏感的工作负载,例如基于大语言模型(LLM)的应用程序,以及用户希望逐步看到响应的 Web 和移动应用程序。响应流式传输支持的有效载荷的默认最大值为 200 MB。

此次扩展后,所有商业区域的客户均可使用支持的 AWS SDK 调用 InvokeWithResponseStream API,或通过启用了响应流式传输功能的 Amazon API Gateway REST API 来流式传输响应。响应流式传输支持 Node.js 托管运行时以及自定义运行时。

流式传输响应会因响应有效载荷的网络传输产生额外费用。您将根据 Lambda 函数在前 6 MB 内生成并流式传出的字节数付费。 要开始使用 Lambda 响应流式传输,请访问 AWS Lambda 文档。