AWS ML | 3M

1916 年，明尼蘇達礦業和製造公司 (即 3M) 開設了第一間研究實驗室，該實驗室位於聖保羅砂紙工廠內，僅有壁櫥大小。公司成立的前 14 年內發生了一系列事件—其中涉及一批砂紙在運輸途中被一箱橄欖油弄壞了，這表明砂紙品質很差—這激勵當時的總經理 William McKnight 打造一個測試產品以改進品質控制的空間。

隨著 McKnight 影響力的逐漸提升 (他於 1949 年成為 3M 董事會主席)，其對品質的熱情也越來越高昂。在 3M 不斷發展期間，創業科學家將所有設想，從瘋狂的想法到諸如砂紙運輸之類的事件，甚至是失敗的實驗，都轉化為現在已成為家庭必需品的產品，例如透明膠帶和便利貼。

由 Wired 友情提供

品質仍然是 3M 企業文化的內在要素。在實驗室取得成功的激勵下，3M 大幅擴大了研究設施的規模。目前該公司有近 6% 的收入投入研發之中。在聖保羅—近 12,000 名員工齊聚一堂，創造和推出新產品，同時改進舊產品—公司實驗室的數千名研究人員和科學家正在努力擴充創新渠道。

3M 研發團隊探討最重要的主題之一是機器學習。透過在 Amazon Web Services (AWS) 上使用機器學習，3M 力圖改進久經考驗的產品，如砂紙，並推動醫療保健等新領域的創新。作為這些計劃行之有效的證明，五年內推出的產品為公司貢獻了大約 30% 的收入；每年 3M 都會發佈大約 1,000 款新產品。

聖保羅企業研究系統實驗室的首席架構師 Hung Brown Ton 表示：「沒有幾家公司能夠像我們一樣，將擁有的豐富材料基礎與數位化能力結合起來，真正創造出新的產品。」「利用機器學習等新的雲端功能讓我們倍感興奮。」

藉助機器學習改造有著 100 年歷史的產品

自從攻克公司早期面臨的大量砂紙製造難題以來，3M 不斷提高其長期供應產品的研磨能力。然而，在最近將機器學習技術引入產品開發工作流程之前，該過程一直非常耗時。

理想的沙粒 (實際上是一種稱為 Cubitron 的合成材料) 應切割效果最佳，且最為耐用。過去，為了達到這一理想狀態，3M 技術人員會檢查每張紙的 CT 掃描，以評估紙上的砂粒數量。然後，技術人員將在粗糙表面上測試每個樣本以衡量其有效性，並嘗試將此有效性與砂粒的含量相關聯。

「這涉及漫長的開發過程，需要花費數周時間，」Brown Ton 表示，因為他和團隊與正在開發新研磨樣本和產品（包括通俗地稱為砂紙的產品）的研究科學家合作。

Brown Ton 的團隊在不到一年前開始實作 AWS 上的機器學習，該過程現在變得更快速、更精確。3M 團隊目前正在測試使用傳統影像訓練的模型以及利用 Amazon SageMaker 上的神經網路。雖然技術人員仍在測試樣本，但這些模型可以顯著加快影像分析速度，協助 Brown 縮小最佳選擇的範圍。這些機器學習模型可讓研究人員分析形狀、大小和方向的細微變化如何提高研磨性和耐用性。得到的建議可為製造過程提供有用的資訊。

考慮到這些掃描和測試生成的資料量（每張手掌大小的紙張約 750 GB），團隊最初是在為運行分析而購買的重型工程筆記型電腦上進行測試。「因此，將這種能力遷移到雲端是非常有意義的行為，」Brown Ton 說道，「因為我們極大地受限於所購買任何傳統筆記型電腦或桌上型電腦的運算能力。如今，在 AWS 中執行過程的效率提高了幾個數量級 – 而且我們充分利用時間瞭解研磨效能，而不是等待資料收集和測試完成。」

將大量非結構化文字轉換為可計費程式碼

雖然砂紙是 3M 的主要產品，但隨著製造公司的業務發展，它已擴展到新的領域—包括醫療保健。在第一個主要電子健康記錄 (EHR) 系統研發成功後不久，3M 於 1983 年成立了子公司 Health Information Systems (HIS)。當今，96% 的醫院都在使用 EHR，對比之下，十年前只有一小部分醫院在使用。並且，透過分析所有這些資料，HIS 瞭解到打造新產品的機會：一套機器學習驅動的醫療編碼產品。

為了收取服務的費用，醫療保健供應商必須將 EHR 轉換為適當的計費程式碼。此過程中經常會出現錯誤，可能導致延遲付款或多付帳單，後者會形成欺詐。在美國，大多數醫院都在 HIS 的自然語言處理 (NLP) 工具的幫助下管理計費，這些工具由 AWS 上的機器學習提供支援。

David Frazee 是研究實驗室的主任，在 3M 任職長達 14 年，之前擔任 HIS 的 CTO。他表示，確定計費程式碼的傳統過程要求編碼人員審核每條記錄，並根據知識和經驗，從多達 141,000 個選項中選擇正確的程式碼。「三周後，您可以向同一位編碼人員提供完全相同的記錄，而他們可能會確定不同的程式碼，」Frazee 說道。

自 2016 年 4 月以來，HIS 將不完善的人類專業知識與機器學習模型相結合，以減少過程中產生的錯誤。EHR 的大部分內容都是非結構化的—正如 Frazee 所說，除了醫生在餐巾紙上亂寫的任何內容都可能有資格作為記錄—因此，直接讓模型理解記錄的含義是一項突破性的進展。

為此，語言學家教導 NLP 模型解析令人困惑的記錄—例如，模型應知悉，醫生將身體部位描述為「冷」並不意味著患者感冒。編碼人員簽字 (或不簽字) 確認模型的決定。他們的評估結果會回饋給模型，讓模型開展下一輪的改進。該模型每天處理驚人的 300 萬份文件，並且學習速度很快，在許多程序中，大約 98% 的時間都選擇了正確的程式碼。模型本身在高效能 Amazon EC2 和 S3 執行個體上執行。

Frazee 和 Brown Ton 均認為 AWS 上的機器學習於未來幾年將在整個公司內得到更廣泛的運用。

「我認為，磨料研發專案顯著代表了 3M 材料科學和資料科學碰撞的未來，」Frazee 說道。「我們是全球最佳的材料製造公司之一，但我們沒有充分利用自身擁有大量材料資料這一事實。」

「如果您考慮在雲端中聚合、透過 IoT 收集、透過機器學習處理的資料—同時利用建模和模擬以及視覺化大量資料的能力—所有這些都為我們提供了幫助，」Brown Ton 補充說道。「繼續利用這些快速發展的全新雲端功能對我們和客戶來說都很令人興奮。」

藉助機器學習改造有著 100 年歷史的產品

將大量非結構化文字轉換為可計費程式碼

相關案例

Coinbase 使用 ML 建立安全的加密虛擬貨幣交易方式

進一步了解 »

Capital One 使用 ML 更好地保護客戶遠離詐欺

進一步了解 »

Zendesk 使用 ML 協助許多公司提供更快的客戶服務

進一步了解 »

T-Mobil 使用 ML 讓客戶服務更加人性化

進一步了解 »

藉助機器學習改造有著 100 年歷史的產品

將大量非結構化文字轉換為可計費程式碼

相關案例

Coinbase 使用 ML 建立安全的加密虛擬貨幣交易方式

進一步了解 »

Capital One 使用 ML 更好地保護客戶遠離詐欺

進一步了解 »

Zendesk 使用 ML 協助許多公司提供更快的客戶服務

進一步了解 »

T-Mobil 使用 ML 讓客戶服務更加人性化

進一步了解 »

結束對 Internet Explorer 的支援