亚马逊AWS官方博客
Category: Artificial Intelligence
使用 SageMaker AI 运行 GGUF 格式的模型推理实践
本文详细介绍了如何在 Amazon SageMaker AI 中部署 GGUF 格式的 LLM 模型。通过使用自带容器(BYOC)方法,文章展示了从创建 SageMaker Notebook 实例、构建必要文件、创建自定义 Docker 镜像,到在 SageMaker 中部署模型并进行推理测试的完整流程。
使用亚马逊云科技自研芯片 Inferentia2 部署 DeepSeek R1 Distillation 模型(一)
AWS Inferentia2 是亚马逊云科技自主研发的云端机器学习推理芯片,为深度学习推理工作负载提供高性能和高效率的计算能力,帮助客户在云端高效地部署和运行机器学习模型。
使用 Amazon Nova Lite 实现多快好省的智能视频审核
本文将分享我们在实际案例中利用亚马逊在re:Invent 2024刚刚推出新一代自研大模型Amazon Nova Lite构建视频分享平台的智能审核方案。我们分别从审核的准确性、处理速度、运营成本等维度深入探讨这个话题。
AWS 一周综述:DeepSeek-R1、S3 Metadata、Elastic Beanstalk 更新等(2024 年 2 月 3 日)
上周,我在曼谷参加了泰国 AWS Community Day 活动,并度过了一段美妙的时光。此次活动恰逢其时, […]
DeepSeek-R1 模型现已在 AWS 上可用
在刚刚过去的 AWS re:Invent 上,Amazon 首席执行官 Andy Jassy 分享了 Amaz […]
AWS 一周综述:EventBridge、SNS FIFO、Amazon Corretto、Amazon Connect、Amazon Bedrock 等
自上周以来,我统计到 AWS 发布了大约 40 项新的产品/服务,回归到了我们常规的发布节奏。服务团队正在倾听 […]
Luma AI 的 Ray2 视频模型现已在 Amazon Bedrock 中可用
正如我们在 AWS re:Invent 2024 上预先宣布的那样,您现在可以在 Amazon Bedrock […]
Amazon Nova 助力功夫源:提升金融数据分析效率,推动量化投资普惠化
通过云原生架构和 GenAI 服务的结合,功夫源成功将专业级的量化分析工具普惠化,使其能够服务于更广泛的用户群体。使用 Amazon Nova 之后进一步降低 LLM 推理成本和延迟,优化客户交互体验。展望未来,功夫源将继续探索 Nova Pro 的多模态能力,进一步优化用户交互体验,并不断拓展创新的应用场景。功夫源在金融科技领域的创新性尝试为金融服务的智能化转型提供了有价值的参考。通过持续优化和创新,功夫源将继续为用户提供更智能、更高效的量化投资解决方案。
LLM 微调实践 – 利用大语言模型微调进行翻译质量检测(下)
上篇对于翻译质检模型的微调进行了初步验证, 其方法基本有效。但在第一阶段优化时,获取的数据具有很不平衡的情况, […]
LLM 微调实践 – 利用大语言模型微调进行翻译质量检测(上)
问题背景 大语言模型在翻译场景相对传统机翻具备很强的优势,比如更好的场景化、更自然流畅的语言(没有机翻中常见的 […]