借助机器学习,制造业巨头 3M 实现新老产品的创新

 

1916 年,明尼苏达矿业与制造公司(简称 3M)成立了自己的第一家研究实验室,该实验室只是其位于圣保罗砂纸厂内的一个壁橱大小的空间。在该公司成立的头 14 年里发生了一系列事故,其中有一件关于一批砂纸在运输中因一箱橄榄油而污损,这表明砂纸质量很差。这也激励了时任总经理 William McKnight 腾出一个空间来测试产品,以提高质量控制水平。

随着 McKnight 的影响力扩大(于 1949 年升任 3M 董事会主席),他对质量也越来越看重。在 3M 的这些年里,创业科学家将所有东西(从天马行空的想法到诸如砂纸运输之类的事件,甚至是失败的实验)都转化为现已成为家庭必需品的产品,例如透明胶带和便利贴。

由 Wired 提供

质量始终是 3M 企业文化的精髓。在实验室取得成功的推动下,3M 显著扩大了其研究设施。现在,该公司约 6% 的收益用于研发。在圣保罗,近 12,000 名员工携手合作,致力于打造和推出新产品和提升旧产品。该公司实验室中的数千位研究员和科学家都在努力扩大创新渠道。

3M 学院最重要的主题之一是机器学习。通过使用 Amazon Web Services(AWS)的机器学习,3M 改进了经试验测试的产品,如砂纸,并推动新领域的创新,如医疗保健。作为这些计划有效性的证明,一直以来,推出时间不到五年的产品为公司贡献了大约 30% 的收入,而每年 3M 都会发布约 1,000 种新产品。

“没有很多公司能够将我们拥有的丰富物质基础与数字能力相结合来真正创造出新的东西。”圣保罗企业研究系统实验室首席架构师 Hung Brown Ton 说,“利用机器学习之类的新的云功能所取得的成绩令我们非常兴奋。”

利用机器学习改进具有 100 年历史的产品

自从克服了公司早期遇到的无数个砂纸制造障碍以来,3M 不断提高其长期运营产品的研磨能力。但是,在最近将机器学习技术引入到产品开发工作流程中之前,这个过程非常耗时。

理想的沙粒(实际上是一种称为 Cubitron 的合成材料)切割效果最好且最耐用。传统上,为了达到这一理想状态,3M 技术人员会检查每张砂纸的 CT 扫描,以评估一张纸上的沙粒数量。然后,技术人员将会在粗糙表面测试每个样品,以评估其有效性,并尝试将该有效性与颗粒百分比相关联。

“这涉及一个漫长的开发过程,需要数周时间,” Brown Ton 说,因为他和他的团队需要与持续开发新磨料样品和产品(包括仍通俗地称为砂纸的产品)的研究科学家合作。

借助 Brown Ton 团队在不到一年前开始实施的 AWS 上的机器学习,该过程现在变得更快、更精确。3M 团队目前正在测试使用传统图像训练以及利用 Amazon SageMaker 上的神经网络的模型。尽管技术人员仍在测试样品,但这些模型可以显著加快图像分析速度,帮助缩小最佳选择范围。这些机器学习模型使研究人员能够分析形状、大小和方向上的细微变化将会如何改进研磨性和耐用性。反过来,这些建议也会提供制造过程改进信息。

考虑到这些扫描和测试生成的数据量(每张手掌大小的砂纸生成约 750GB 数据),该团队最初是使用重型工程笔记本电脑来运行分析。“因此,将此功能迁移到云非常有用,”Brown Ton 说,“因为我们购买的任何传统笔记本电脑或台式机所具有的计算能力都严重阻碍了我们。如今,在 AWS 中执行这一流程使得效率提高了几个数量级,而且我们非常高兴能够将时间花在研究磨料上,而非等待数据收集和测试完成。”

将大量非结构化文本转换为可计费代码

虽然砂纸是 3M 的主要产品,但随着该制造公司的发展,其业务已扩展到新的领域,包括医疗保健。3M 于 1983 年成立其旗下的健康信息系统(HIS),此时间点是首个主要电子健康记录 (EHR)系统开发后不久。与十年前只有一小部分医院使用 EHR 相比,现在 96% 的医院都在使用 EHR。而且,基于所有这些数据,HIS 迎来了构建新事物的机会:一套由机器学习提供支持的医疗编码产品。

为了向保险提供商收取服务费,医疗保健提供商必须将 EHR 转换为适当的计费代码。在这一过程中常常会出现错误,造成付款延迟或超额收费,而这被视为是欺诈性的。在美国,许多医院都是在 HIS 的自然语言处理(NLP)工具的帮助下管理这一过程,该工具由 AWS 上的机器学习提供支持。

David Frazee 是研究实验室的负责人,他在 3M 工作了 14 年,以前是 HIS 的首席技术官(CTO)。他说,传统的计费代码确认过程需要人员(称为编码员)审查每条记录,并根据知识和经验,从 141,000 个选项中选择正确的代码。“三周后,您可能会向同一编码员提供完全相同的记录,而他们可能会确认不同的代码,”Frazee 说。

自 2016 年 4 月以来,HIS 将这些并不完善的人类专业知识与机器学习模型相结合,以减少在该过程中出现的错误。EHR 的大部分内容都是非结构化的,正如 Frazee 所说,除了医生在餐巾纸上乱写的字迹外,任何东西都可能被视为记录。因此,单单让模型理解每条记录的含义就是一项壮举。

为此,语言学家训练 NLP 模型解析令人困惑的记录,例如,知道医生将身体部位描述为“冷”并不意味着患者感冒了。编码员需要签核(或不签核)模型的决定。他们的评估将会反馈给模型,从而使模型能够在下次改进。该模型每天处理高达 300 万份文档。因此,它的学习速度非常快,并且在许多程序中,约 98% 的时间都会选择正确的代码。该模型本身在高性能的 Amazon EC2 和 S3 实例上运行。

Frazee 和 Brown Ton 都认为 AWS 上的机器学习在未来几年内的使用将在整个公司中激增。

“我认为,磨料研发项目是 3M 在未来将材料科学和数据科学相结合的典型代表,”Frazee 说。“我们是世界上最好的材料制造公司之一,但是,我们并没有充分利用我们拥有的大量材料相关数据。”

“如果细想一下,您会发现在云中聚合、通过物联网收集、通过机器学习处理的数据,同时利用建模、模拟以及可视化大量数据的能力,都为我们提供了帮助,”Brown Ton 补充说。“对我们以及我们的客户来说,持续利用这些快速发展的创新云功能确实令人兴奋不已。”

 

Coinbase 使用 ML 创建安全的加密货币交易

了解更多 »

Capital One 利用机器学习更好地保护客户免遭欺诈

了解更多 »

Zendesk 通过使用 AI 技术帮助很多公司为最终用户提供更快速的客户服务

了解更多 »

T-Mobile 使用机器学习实现人性化客户服务

了解更多 »