客户案例 / 互联网软件

2023

PublicAI 基于亚马逊云科技构建隐私 AI 数据标注服务,赋能行业客户创新前行

PublicAI 是一家具有丰富 AI 算法积累的创始团队,主要成员来自于香港中文大学(深圳)未来智联网络研究院院士、教授和博士。通过加入亚马逊云科技云创计划,PublicAI 使用一系列云上托管服务实现了数据加工和 Web3.0 的分布式经济模型的融合,加速为自动驾驶、医疗等行业的客户提供低成本、高效率的专业服务。

客群增长 30%

通过隐私计算赢得行业客户信任,带来了 30% 的新增客户。

计算成本降低 70%

Amazon SageMaker 托管机器学习服务,减少 70% 的计算成本。

服务报价优惠 45%

采用机器学习数据标注方式,较传统方法的服务报价低 45%。

概述

随着 AI 在不同行业的广泛应用,专业领域数据标注需求的不断上升,吸引更多的专业人士加入到数据标注领域并实现全球化的协作已经成为一个新的趋势。

在加入亚马逊云科技针对初创企业提供的云创计划后,PublicAI 推出的分布式 AI 训练师数据服务,利用 Web3.0 的模式为 AI 企业提供 AI 大模型的数据标注。PublicAI 通过将亚马逊云科技在可信执行环境、机器学习与数据标注服务的优势整合在一起,在为客户提供具有隐私保护的数据标注服务的同时,也提供了竞争力更强的服务报价,赢得了行业客户的认可。

PublicAI基于亚马逊云科技构建隐私 AI 数据标注服务,赋能行业客户创新前行

机会 | 将 Web 3.0 与机器学习结合,借助专业人士与分布式协作实现数据标注模型训练

数据标注是人工智能(AI)发展的基石,机器学习的目的是为了让机器能够像人类一样理解文字、语音、图片等信息。为实现这一目标,人们通过对相关的数据进行标注、清洗以转化为机器能够理解的代码。随着数据标注的不断丰富,AI 的应用场景也在持续拓展到更多的行业领域。传统数据标注通常集中在日常场景中,采用众包方法,由成本较低地区的标注员完成,无需专业知识。然而,随着 AI 渗透到医疗、自动驾驶、农业等领域,专业数据标注需求不断增长,这要求具备专业背景的标注员参与,吸引更多专业人士参与数据标注并实现全球协作已成为新的趋势。

PublicAI 为了满足未来垂直领域 AI 大模型和微调等对垂类专精技能训练师人才需求,借助区块链建立了一个可信高效的数据加工分布式全球协作网络,并打通全球范围内的支付。训练师可以通过完成数据标注任务获得令牌悬赏。PublicAI 在为 AI 研究机构大幅降低数据标注成本的同时,提升了训练师的劳动收入。作为具有丰富 AI 算法积累的创始团队,主要成员来自香港中文大学深圳未来智联网络研究院院士、教授和博士组成的 PublicAI Team 通过将数据加工和 Web 3.0 的分布式经济模型进行融合,加速大规模智能化应用的落地。同时,致力让每一个人都能公平透明和自由地参与训练数据加工,并能够获得应有的劳动报酬。

“未来 80% 的公司都需要 AI 辅助参与业务的落地,就意味着大量公司需要 AI 本地化的部署和专属定制化的数据训练,培养高度专业化的 AI 来为公司创造价值,这里面必然需要专业人士参与的高度定制化垂直的数据标注。”PublicAI CEO Steven Wong 谈到,“在这样的大背景下,我们推出了 PublicAI 分布式 AI 数据服务,这是一个将 Web 3.0 与机器学习融合的平台,分布在全球各地的垂直领域专业人士可以通过贡献自己的知识获得奖励令牌,而这些专业人员的经验也能够进入到我们自主研发的数据标注机器学习模型,为相关行业提供 AI 支持的数据标注能力。”

kr_quotemark

Amazon Nitro Enclaves 让我们可以在 PublicAI 上设置多方隐私计算和存储,这意味着平台无需分别给每个参与方披露或共享实际数据,包括众包团队在内的参与方能够以安全的方式加入到项目中并处理一些高度敏感的数据,并将数据保持在隐私计算环境中。隐私计算模式的引入提升了医疗保健与金融服务等行业客户对于 PublicAI 的信心,也为我们带来了更多的客户,实现了超过 30% 的客群数量增长。”

Steven Wong
PublicAI  CEO

解决方案 | 在亚马逊云科技上构建服务企业客户的 AI 大模型数据标注平台

要打造一个全球化的 Web 3.0 与 AI 结合的数据标注服务,PublicAI 需要可靠的云服务提供商提供从底层算力、安全到可信执行环境的一系列支持。在经过评估后,PublicAI 选择加入亚马逊云科技针对初创企业所推出的云创计划,借助一系列起步云资源和专业的技术与支持服务,将分布式劳动力 AI 数据服务的业务构想变为现实。

亚马逊云科技云创计划为 PublicAI 提供了包括 Web 3.0 与机器学习专业架构师团队在内的多种支持,根据 PublicAI 的业务愿景进行详细的规划,将亚马逊云科技的优势服务与业务结合在一起,帮助 PublicAI 实现分布式全球协作网络,并将机器学习能力整合到专业数据标注服务中。在实现安全的 Web 3.0 底层服务方面,PublicAI 采用了 Amazon Elastic Compute Cloud(Amazon EC2)Amazon Simple Storage Service (Amazon S3) 等服务,同时标注数据集在 s3 上存储,实现服务器端加密,以及 99.999999999% 的数据持久性保障。

使用 Amazon RekognitionAmazon SageMaker 提供的机器学习能力加速模型训练与数据标注,并结合 Amazon WAFAmazon Shield Standard 提供的安全能力抵御来自第三方的恶意流量与攻击,为分布式 AI 数据标注服务的平稳运行提供保护。

在 AI 驱动的数据标注场景中,PublicAI 充分利用 Amazon Rekognition 的机器学习能力,实现了部分图像的自动识别和分析。这种自动化方法不仅可以快速筛选标注内容,过滤不安全、不适宜或有害的信息,还能结合预先训练的模型,实现 AI 驱动的自定义标签标记。这样,标注员在标注任务中可以专注于特定行业内容,提高数据标注的效率。

在机器学习驱动数据标注方面,PublicAI 将 Amazon SageMaker 托管机器学习服务引入数据标注业务,以创建高质量的训练数据集,同时满足数据安全、隐私和合规的需求。“在业务起步阶段,Amazon SageMaker JumpStart 让我们可以快速地访问一些预训练的模型,其中不仅有常见的基础模型,也包括一些医学相关的预构建机器学习解决方案,有效加速了我们在数据标注业务中采用机器学习的过程。”Steven Wong 说,“我们可以直接在 Amazon SageMaker 服务中去创建高质量的数据集,Amazon SageMaker Ground Truth 让我们可以灵活地去管理数据标注工作流程、结合机器学习的自动化与全球众包专家人力资源,对文本、图像、3D 点云等多模态数据进行处理,并根据客户的特定需求完成模型的微调,充分发挥专家和机器学习的优势,以持续优化模型的标注能力。”

基于亚马逊云科技服务,PublicAI 已成功聚集了全球众多行业 AI 训练数据处理专家。利用机器学习技术,为智能驾驶的 3D 点云标注、智能硬件设备检测与识别、医院肿瘤检测和病情分析等多个专业场景提供服务。

业务成果 | 通过隐私计算赢得信赖,提升 30% 的客源并提供比传统模式低 45% 的服务报价

在亚马逊云科技技术团队的协助下,PublicAI 成功构建了基于云托管服务的分布式劳动力 AI 数据标注服务。这一服务巧妙结合了 AI 与 Web 3.0 的优势,改变了传统的众包数据标注方式,迅速赢得了行业客户的认可。

亚马逊云科技云创计划的支持加速了 PublicAI 的业务发展,也协助行业客户优化了数据标注成本。与自行采购 GPU 资源构建模型训练所需的算力资源相比,Public AI 采用 Amazon SageMaker 托管机器学习服务,实现了更快的速度和训练效率,同时节省了近 70% 的计算成本。这使得 PublicAI 能够将更多资金用于提升平台的支持性和服务成熟度。结合亚马逊云科技的成本效益服务和 Web 3.0 众包模式,PublicAI 成功提供了比传统模式低 45% 的服务报价,使行业客户以更低的价格获得更多的业务价值。

此外,将数据标注服务构建在亚马逊云科技上,还帮助 PublicAI 成功应对了一系列的安全威胁,确保业务在全球范围内的安全稳健运营。“DDoS 是针对 Web 3.0 的常见攻击,我们将业务应用放置在 Elastic Load Balancing 之后,实现了弹性的流量分发并借助 Amazon Shield Standard 来抵御网络层和传输层的 DDoS 威胁。”Steven Wong 说,“在保护信息安全方面,我们也在 Amazon Identity and Access Management 中设置了精细化的权限,用预防性防护机制建立数据边界,保护业务数据的安全,让更多的行业客户能够信赖 PublicAI,也让全球众多的专业人士可以通过 PublicAI 所提供的众包服务发挥所长并获得可观的回报。”

展望未来,Public AI 计划加入亚马逊云科技合作伙伴网络(APN),将基于 Web 3.0 与 AI 的数据标注和处理服务提供给更多行业用户,通过亚马逊云科技 Marketplace 拓展全球广泛的服务群体,推动 AI 在更多行业中的创新实现。

关于 PublicAI

PublicAI 是一个基于 Web3 的数据基础设施,致力于将 web3 的分布式、去中心化的经济激励机制与 AI 模型训练进行融合。AI 训练通常需要大量人类训练师加工过的数据集。目前人工智能研究者是通过传统中心化的数据加工公司提供服务。PublicAI 为了满足未来垂直领域 AI 大模型和微调等对垂类专精技能训练师人才需求,借助区块链建立了一个可信高效的数据加工分布式全球协作网络,并打通全球范围内的支付。训练师可以通过完成数据标注任务获得令牌悬赏。PublicAI 在为 AI 研究机构大幅降低数据标注成本的同时,提升了训练师的劳动收入。 团队成员包括多位国家级院士,IEEE Fellow,斯坦福等顶尖学府的教授和已毕业的博士,及前高盛和 JP Morgan 的资深员工,已与多家头部 AI 研究机构进行合作,并完成交付部分商业订单。

使用的亚马逊云科技服务

Amazon SageMaker

Amazon SageMaker 建立在 Amazon 二十年来开发现实世界 ML 应用程序的经验之上,这些应用程序包括产品推荐、个性化、智能购物、机器人技术和语音辅助设备。

了解更多>>

Amazon Rekognition

Amazon Rekognition 提供预先训练和可定制的计算机视觉 (CV) 功能,可从您的图像和视频中提取信息和获得洞察力。

了解更多>>

AWS Nitro Enclaves

AWS Nitro Enclaves 使客户能够创建隔离的计算环境来进一步保护和安全地处理高度敏感的数据,例如其 Amazon EC2 实例中的个人身份信息 (PII)、医疗保健、金融和知识产权数据。

了解更多>>

AWS Shield

AWS Shield 是一种托管式 DDoS 保护服务,可以保护在 AWS 上运行的应用程序。

了解更多>>

行动起来

无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。