AWS 案例研究: 格物钛
2020
格物钛是一家 AI 数据服务平台提供商,致力于通过专业的数据管理 SaaS 服务和构建以 AI 开发者为核心的开源数据集生态,降低 AI 开发过程中因处理非结构化数据所带来的不断增长的数据获取、存储和处理成本,加速 AI 开发流程和产品创新,为人工智能赋能百业,驱动产业升级提供坚实的人工智能基础设施。
TensorBay 是格物钛专为算法工程师打造的非结构化数据集管理 SaaS,集数据托管、数据集版本管理、数据可视化和开发者工具等多种功能于一体,为算法训练提供深度效率提升解决方案,帮助开发者高效地获取、加工和管理数据,并通过协同功能开展模型训练,助力企业快速、低成本地实现 AI 技术导入和算法模型迭代。
同时,格物钛通过构建以 AI 开发者为核心的公开数据集平台,赋能其更好地应对人工智能领域全新商业形态所带来的数据挑战,实现更加高效的 AI 开发和创新。平台聚集了超过1000个全球高质量公开数据集,覆盖机器视觉与自动驾驶、智慧工业、新零售、互联网娱乐等众多 AI 应用领域。该平台于2020年8月份上线,经过2个多月实现了爆发式的增长,11月增长量级是9月总量级的近 8 倍。
业务需求与挑战
凭借强大的技术研发实力和深厚的行业积累,格物钛创立短短一年时间即获得红杉资本、云启资本、真格基金、风和投资等一线资本的投资。通过将创新技术与行业场景深度结合,格物钛目前已面向自动驾驶、视频直播、新零售、医疗健康、智能制造等多领域提供针对性的AI数据解决方案,并与众多国际知名企业、顶尖高校实验室以及生态伙伴展开深度合作,共同推动AI技术落地,助力产业智能升级。
与其他技术型初创企业类似,格物钛在创业初期也面临着许多挑战。对于格物钛这样专注于数据科学和AI的初创企业来说,在短时间内让更多的客户了解其品牌和能力并非易事。格物钛创始人崔运凯在无人驾驶领域具有深厚的技术积累,并拥有多年的海外科研与工作经验。企业创建初期,崔运凯就希望将格物钛打造成一家面向全球提供AI数据服务的企业。初创企业最大的资源是研发人员,在商务、市场等领域的资源相对缺乏。如果要在海外开展业务,一方面需要面对当地市场对于数据驻留、合规等方面要求,另一方面也要花费大量的成本和精力进行品牌宣传与客户寻找。“我们更希望将所有的资源投入到产品创新迭代上,并且我们是一家基于云的创业公司,在云上寻找合作资源是我们业务发展的必然选择。” 崔运凯说。
AWS是一个对技术型初创企业非常友好的云服务商。通过加入AWS云创计划,我们在技术和商业层面获得了非常丰富的资源,可以更加专注于自己的核心业务,高效地开拓海外市场。”
崔运凯
格物钛(上海)智能科技有限公司 创始人
为什么选择Amazon Web Services
为了满足业务发展和全球布局所需,格物钛创立之初就选择了基于AWS对外提供TensorBay云端数据托管服务与Open Datasets公开数据集服务。之所以携手AWS,格物钛认为基于AWS构建和开展业务具有以下几方面的优势:
-
遍布全球的基础设施消除业务出海的障碍
-
良好的性能为大规模应用提供强大后盾
-
针对初创企业度身定制的资源与服务
-
满足未来业务发展需求的服务能力和架构
-
遍布全球的基础设施消除业务出海的障碍
-
作为一个面向全球市场提供针对非结构化数据存储、标注、模型训练和管理预测的一站式AI服务供应商,格物钛首先需要考虑云服务商的全球化业务能力。AWS作为一个成熟的云计算品牌,在全球有着广泛的基础设施和业务经验,同时也在客户中具有良好的口碑。AWS在安全与合规性方面的认证、内置数据加密能力和安全预防措施可以让格物钛的客户更有信心在云上进行数据集托管和相关操作,特别是对于数据安全保护有严格监管的欧美市场。基于AWS开展业务可以帮助格物钛减少在合规认证方面人力和财力投入,让业务在短时间内投入运营。
-
良好的性能为大规模应用提供强大后盾
-
AWS作为一个企业级的云服务平台,在大规模应用场景中可以提供良好的性能表现。格物钛的技术团队可以轻松地将AWS各种服务进行集成,尤其在数据科学场景中,I/O性能尤为关键。Amazon Elastic Compute Cloud (Amazon EC2)目前已经提供具备增强型联网的计算实例,在云上可以获得高达400 Gbps 以太网连接能力,可以满足格物钛的需求。“在某大规模面试语音数据模型训练项目中,我们基于AWS构建的TensorBay高效地完成了数据集创建、训练、过滤和版本迭代,AWS的表现不仅达到了我们的预期,也得到了客户的认可。” 崔运凯谈到。2020年,格物钛与加州大学伯克利分校的机械系统控制(MSC)实验室合作举办了PREdicTion Challenge数据集挑战赛。在该赛事中,格物钛提供了数据集管理和模型评估的基础架构,由AWS作为赞助方提供了赛事所需的云服务资源并实现数据托管,让来自全球多个国家的数百名数据科学开发者、高校学生和科研人员能够针对无人驾驶的预测场景实现技术创新,为今后产业发展进行人才和技术储备。在为期数月的赛程中,AWS的稳定性和可靠性不仅为参赛选手提供了良好的体验,也让格物钛能够借助这一赛事在全球行业参与者中建立良好的品牌形象。
图:格物钛TensorBay基于AWS的系统架构示意图 -
针对初创企业度身定制的资源与服务
-
AWS致力于通过创新的云服务、初创企业扶植计划等丰富的资源让创新者能够用低成本以及易用的基础设施来拓展业务,其中已有部分初创企业成功实现了IPO或成为行业翘楚。“我们在加入AWS云创计划之后,在技术与商务方面获得了双重支持。例如我们可以使用AWS提供的服务抵扣券来部署AWS服务、获得技术支持,也可以通过各类初创公司路演活动及时了解行业的趋势、与AWS架构师团队探讨在云上实现完善架构的方法,缩短产品的研发周期和上线时间,”崔运凯说,“在品牌宣传和营销方面,我们也可以依托AWS云创计划上的联合营销资源在行业内提高品牌的曝光率,发现更多潜在客户,加速品牌在全球的推广。”
-
满足未来业务发展需求的服务能力和架构
-
格物钛基于AWS云原生的架构为TensorBay云端数据托管设计了具有负载均衡能力的访问层、服务层、基于Amazon Relational Database Service (Amazon RDS) 托管数据库服务的中间件层以及容器集群,结合SpringCloud微服务框架对外提供稳定服务,同时也让服务实现平滑的升级以满足未来业务发展的需求。技术团队可以针对微服务架构中的每个组件服务进行开发、部署、运营和扩展,不会对其他服务的功能产生影响。将Amazon CloudWatch与AWS Lambda结合应用,格物钛也让TensorBay云端数据托管平台具有了更好的自我监控和运维管理能力,即使用户在短期内实现快速增长,也无需担心云上性能和资源出现瓶颈。
获得的成效
通过加入AWS云创计划,并基于AWS对外提供TensorBay云端数据托管和Open Datasets公开数据集服务,格物钛在进行海外业务拓展时获得了多方面的成效:
-
专业化的团队和资源加速海外拓展步伐
-
用低成本开展研发与业务
-
通过SaaS化方式将创新技术输出给用户
-
专业化的团队和资源加速海外拓展步伐
-
由具备国际化背景的创始人、风险投资者和加速器专业人士组成AWS初创业务拓展团队可以为格物钛这样的技术初创企业提供良好的资源支持。借助AWS与世界各地的优秀加速器和孵化领导团队、商务和投资资源的密切关系,格物钛能够在海外市场拓展时缩短前期准备的时间,加速海外布局。“AWS团队帮助我们对接了非常丰富的海外资源,包括芬兰招商局、德国孵化器运营商等,也提供了媒体宣传的支持,让我们可以在短时间内完成海外宣传与运营。” 崔运凯谈到。
-
用低成本开展研发与业务
-
借助AWS云创计划所提供的权益,使格物钛这样的初创企业能够借助一定额度的的服务抵扣券来使用云资源、结合AWS提供的工具和技术,快速在云上进行产品和服务研发,并通过AWS在全球开展业务。“在公司业务运营初期,AWS云创计划提供的服务抵扣券帮助我们覆盖了TensorBay云端数据托管研发过程和PREdicTion Challenge数据集挑战赛等场景中的云资源消耗,让技术团队可以在几乎没有任何基础成本的情况下进行创新与试错。” 崔运凯说,“AWS云创计划专属的Activate控制台也提供了量身定制的成本优化建议,让我们随时了解并控制服务抵扣额度的使用情况,做出明智的架构决策,将资源更好地用于核心业务的发展上。”
-
通过SaaS化方式将创新技术输出给用户
-
格物钛可以充分利用AWS在弹性计算、微服务、容器化以及无服务架构等领域的托管服务,构建一站式的数据集解决方案。依托AWS的稳定性为客户提供SaaS模式的数据集管理供应、标注、沙箱性训练、模型评估。这种方式让客户可以直接登录格物钛的服务并在云上完成从数据集构建、管理到使用的各个环节操作,帮助客户解决此前在数据和AI应用领域的高成本、高技术门槛,化繁为简,有效应对复杂结构数据的处理与应用场景。
未来,格物钛将继续与AWS保持紧密的合作,并以AWS合作伙伴的身份在全球市场开拓核心客户。通过深度参与AWS举办的各类线上/线下活动,让行业客户了解格物钛在云上数据集解决方案方面的优势,使更多领域的客户能够借助AWS和格物钛提供的数据集解决方案实现便利的数据分享与协同。
关于格物钛
格物钛是一家 AI 数据服务平台提供商,致力于通过专业的数据管理 SaaS 服务和构建以 AI 开发者为核心的开源数据集生态,降低 AI 开发过程中因处理非结构化数据所带来的不断增长的数据获取、存储和处理成本,加速 AI 开发流程和产品创新。
为什么使用AWS
- 遍布全球的基础设施消除业务出海的障碍
- 良好的性能为大规模应用提供强大后盾
- 针对初创企业度身定制的资源与服务
- 满足未来业务发展需求的服务能力和架构
使用的AWS服务
Amazon RDS
Amazon Relational Database Service (Amazon RDS) 让您能够在云中轻松设置、操作和扩展关系数据库。
AWS Lambda
通过 AWS Lambda,无需预置或管理服务器即可运行代码。您只需按使用的计算时间付费。
Amazon CloudWatch
Amazon CloudWatch 是一种面向开发运营工程师、开发人员、站点可靠性工程师 (SRE) 和 IT 经理的监控和可观测性服务。
Amazon ECR
Amazon Elastic Container Registry (ECR) 是完全托管的容器注册表,使您能够在任何地方轻松存储、管理、共享和部署您的容器映像和构件。
开始使用
各行各业中所有规模的公司都在使用 AWS 对其日常业务进行转型。联系我们的专家,立即踏上您的 AWS 云之旅。