亚马逊AWS官方博客
使用 Apache Atlas on Amazon EMR 进行元数据分类、沿袭和发现
随着数据在当今世界中的作用不断发展演变,数据治理已然成为有效数据管理的重要环节。许多组织使用数据湖作为单个存储库,存储属于组织中某个业务实体的各种格式的数据。使用元数据、分类和数据沿袭是有效利用数据湖的关键。
这篇文章将指导您了解安装在 Amazon EMR 上的 Apache Atlas 如何提供此功能。您可以使用此设置来动态分类数据并查看数据在各种过程中移动期间的数据沿袭。在此过程中,您可以在 Atlas 中使用领域专用语言 (DSL) 来搜索元数据。
基于 Amazon EKS 快速构建企业级 Shiny 平台
本文主要介绍如何在 AWS 中国区域的 EKS 服务上运行 ShinyProxy 及 Shiny 应用,文章提供了 Solution 背景,主要组件介绍,详细的 EKS 集群创建和 ShinyProxy 的部署和优化过程。
基于Amazon EC2 Container Service的持续集成/持续交付解决方案
基本概念 持续集成/持续交付 互联网软件的开发和发布,已经形成了一套标准流程,最重要的组成部分就是持续集成(C […]
使用 WorkSpaces Cost Optimizer 自动优化 WorkSpaces 使用成本
Amazon WorkSpaces是在AWS上运行的完全托管、安全的桌面即服务(DaaS)解决方案。借助Amazon WorkSpaces,您可以为团队成员轻松配置云桌面,使他们可以随时随地访问所需的文档、应用程序和资源。为了帮助不便预测WorkSpace使用模式的客户监控WorkSpaces使用情况并优化成本,AWS提供了Amazon WorkSpaces Cost Optimizer,来分析您所有WorkSpace的使用情况数据,并自动将WorkSpace转换为最具成本效益的计费选项(每小时或每月一次)。本文将向您介绍如何在AWS中国区部署WorkSpaces成本优化方案,以及这个方案的工作原理。
使用 Palo Alto Networks 的 Prisma Cloud 计算版本扫描 AWS 镜像仓库ECR
目前企业容器的使用越来越普遍,根据Gartner的统计,目前已经有一半的企业已经使用了容器部署。而且这个增长的趋势也会越来越快。其中容器的镜像仓库为存储和分发应用镜像提供了便捷、集中化的来源。当今我们的企业和组织可以很方便地将数以万计的镜像存储在镜像仓库中,比如说我们AWS的镜像仓库ECR (Elastic Container Registry)。
失去了SDK,云计算将会怎样
本文主要关于如何使用Python或者脚本开发 Signature V4 的API 调用。
开始使用开源 Web 会议解决方案 Jitsi
在这个前所未有的时代,世界各地的团队都在寻找可以帮助他们在线工作和协作的解决方案。客户面临各种各样的选择,如果您也在寻觅,本文将为您提供一些选项,帮您做出选择。
在家办公? 看看 AWS 能为您提供的帮助
现在,许多城市和国家/地区的人们都被要求在家办公或学习,而我们相信,AWS 有些服务可以帮助大家更轻松地从办公室办公或教室学习过渡到在家办公或学习。
AWS Glue 扩展 Apache Spark 作业以及数据分区的最佳实践
本博文讨论管理数据处理作业扩展的两项关键的 AWS Glue 功能,还将介绍在 AWS Glue中,针对采用 Amazon Kinesis Data Firehose 的流应用程序中提取的大量小文件,如何来扩展 Apache Spark 应用程序。此外,文章将介绍对 AWS Glue 作业如何利用在 Amazon S3 上大型数据集的分区结构,来缩短 Apache Spark 应用程序的执行时间。
在最大程度上优化 Amazon Redshift 上的数据提取与报告性能
本文提供了从 S3 将大型数据卷加载到 Amazon Redshift 的方法,并运用有效的分发技术优化在相对小型的 Amazon Redshift 集群上运行报告查询的性能。