亚马逊AWS官方博客

AWS Team

Author: AWS Team

基于Alphafold2一键构建云上高可用蛋白质结构预测平台

Deepmind团队于2021年7月公开了Alphafold2算法源代码和相关论文,这一方案被认为可解决困扰生物学长达半个世纪的蛋白质折叠结构预测难题,其准确度高达92.4(百分制)。Alphafold2基于新颖的机器学习方法,以原子精度预测蛋白质结构,在大部分情况下表现出与实验相媲美的准确性,且大大优于其他方法。但截至目前,其官方的单机部署方式需要人工下载数据集并解压、处理输入输出数据以及执行任务脚本,无法实现弹性按需使用,不适用于大规模的蛋白质结构预测。

EKS 使用Spot 实例最佳实践

帮助大家回顾了EKS集成SPOT使用方式,通过亚马逊云科技不停推出的新的工具和功能的增强,来实现Spot 使用的最佳实践,在大规模工作负载使用Spot的情况下,既有效的节约成本,又相对提升工作负载的可靠性。

使用Amazon Glue构建无服务器流式ETL作业

在本文中,我们将深入探讨Amazon Glue中的流式ETL,介绍此功能如何帮助您在流式数据上构建持续的ETL应用程序。Amazon Glue中的流式ETL基于Apache Spark的结构化流引擎,该引擎提供一种高容错、可扩展且易于实现的方法,能够实现端到端的流处理。本文向大家展示使用Amazon Glue构建流处理管道的示例,其中包括从 Amazon Kinesis Data Streams当中读取流式数据、发现schema、运行流式ETL并将结果写入至接收端。