Amazon Web Services ブログ
寄稿: JFE スチールが挑むインテリジェント製鉄所への道 – Amazon SageMaker AI による CPS 開発実行基盤の構築
本稿は、JFE スチール株式会社による CPS 開発実行基盤の構築について、これを主導された JFE スチール株式会社 庄村 啓様、JFE システムズ株式会社 杉田 朋晃様、原 洋平様、髙山 翔伍様より寄稿いただきました。
はじめに
JFE スチール株式会社は、グローバル鉄鋼サプライヤーとして、自ら学習し自律的に最適自動操業を行う「インテリジェント製鉄所」の実現を目指しています。その実現の鍵を握るのが、製造プロセスの CPS(Cyber Physical System)化です。
CPS は、製造現場(フィジカル)から収集したセンサーデータをもとに、デジタル空間上に高度な仮想プロセス(サイバー)を再現する技術です。この 2 つをリアルタイムに連携させることで、現実では見えない設備内部の状態把握や将来予測を実施し、仮想プロセスでの健全性監視・異常予測の結果を実際の操業にフィードバックします。JFE スチールでは統計モデルと物理モデルを融合した予測モデルを構築し、安定操業、生産性向上、品質安定化、GHG 排出削減などを実現します。
インテリジェント製鉄所のコアとなる全製造プロセスの CPS 化を推進するためには、機械学習モデルの開発から製鉄所エッジでの推論実行まで、一気通貫で対応できる「CPS 開発実行基盤」が不可欠です。しかし、従来の機械学習基盤ではユーザーが個人ごとに環境分離を行えないなど当社の要件と合致しない点が複数あり、CPS 開発実行基盤の構築が停滞していました。これを解決するため、JFE スチールは Amazon SageMaker AI を中核とした CPS 開発実行基盤の構築プロジェクトに着手しました。
プロジェクト体制
本プロジェクトは、JFE スチール、JFE システムズ、AWS の 3 社協業体制で推進されました。
JFE スチールは、事業会社として業務要件を熟知していることから、全体統括と要件定義を担当しました。JFE システムズは長年にわたり当社の IT システム構築・運用に携わり、当社 IT システムに関する環境を熟知しています。近年はクラウド事業に注力し、クラウド活用推進部(CCoE)を新設してクラウド活用の推進に取り組んでいます。本案件では AWS パートナーとしての高度な技術力を活かし、閉域接続環境と CPS 開発実行基盤の設計および運用を担当しました。AWS は、基盤に関する技術支援に加え、全国の製鉄所・研究所への普及活動を支援しました。この 3 社協業により、それぞれの強みを活かした効率的なプロジェクト推進が実現しました。
本プロジェクトにおいて AWS ソリューションアーキテクト (SA) の皆様には、基盤構築の初期段階から全国拠点への展開に至るまで、専門性と実務経験に基づく多面的なご支援をいただきました。これらの伴走的な支援は、CPS 開発実行基盤の高品質な構築とスムーズな利用定着を大きく後押しし、今回構築した基盤を利用する研究者・製鉄所エンジニアから高い評価を得る結果につながりました。
まず、SageMaker AI、IAM、ネットワーク、セキュリティなど多岐にわたる領域に対して体系的な AWS 技術勉強会をご提供いただき、プロジェクトメンバーの AWS に対する理解が深まりました。これにより、企画・設計フェーズを効率的に進めることができました。アーキテクチャ設計においては、今回の用途の特性を踏まえ、サービス選定から構成設計に至るまで AWS の最新ベストプラクティスに基づく具体的な助言をいただきました。特に、当社固有のセキュリティ要件への適合や権限分離に関する設計提案は、基盤品質の向上に大きく寄与しました。
加えて、基盤を利用する研究者や製鉄所エンジニアが迅速に開発に取り組めるよう、SageMaker Studio を中心とした操作手順やワークフローを体系化したハンズオン教材の整備にご協力いただきました。このコンテンツにより、導入直後から利用が加速し、現場での活用が円滑に進みました。さらに、ハンズオンや個別相談会においても必要に応じて国内各拠点に足を運んでいただき、研究者・技術者に対するきめ細かな支援を実施いただきました。現場の課題に寄り添った対応により、利用者の理解が深まり、基盤の定着と活用拡大が加速しました。
これら AWS SA の皆様による専門的かつ丁寧なご支援により、本基盤は短期間で安定稼働へと移行し、全国の研究者・製鉄所エンジニアからの高い評価につながりました。AWS の技術力と伴走支援は、本プロジェクト成功の重要な推進力となりました。
既存基盤の課題
従来の機械学習環境には、いくつかの課題がありました。
最も大きな課題は、研究者ごとに独立した開発環境を提供できなかったことです。機密情報管理の観点からユーザーは個人ごとの環境分離を要望していましたが、従来検討していたサービスではこの要件を満たすために多額のコストが発生する可能性があり、CPS 開発実行基盤の構築が停滞していました。
さらに、環境構築の手間も大きな負担でした。新しい研究者が開発を始める際、PC のセキュリティ設定や必要なライブラリやツールのインストールを行う必要があり、セットアップが複雑でした。
加えて、キャパシティ不足により、必要な時に十分な計算リソースを確保できないという制約もありました。大規模な機械学習モデルの開発や、複数の研究者が同時に計算リソースを必要とする場合、リソース不足が開発のボトルネックとなっていました。また、キャパシティ不足を解決するために新たなサーバーを調達する際には、コスト負担も課題となっていました。
全プロセスの CPS 化を加速するためには、これらの要件を満たす機械学習基盤が必要でした。
Amazon SageMaker AI による解決策
JFE スチールは、これらの課題を解決するため、Amazon SageMaker AI を中核とした以下のような CPS 開発実行基盤を構築しました。
Amazon SageMaker Studio を用いた独立した環境の提供
SageMaker Studio は、SageMaker AI が提供する機械学習の各種機能にアクセスする ための Web ベースのプラットフォームです。SageMaker Studio からアクセスできる IDE 機能である Code Editor は、従来から使用していた Visual Studio Code と同様の使用感を提供し、デフォルトで個人ごとに開発環境が分離されています。Code Editor は、一定時間使用されない場合に自動的にシャットダウンされる仕組みを備えており、個人ごとの環境分離を低コストで実現できます。さらに、Amazon S3 上の学習データや SageMaker AI のリソース(学習ジョブ、モデル、エンドポイントなど)へのアクセス権限を AWS IAM で個人ごとにきめ細やかに制御しています。これにより SageMaker Studio 全体で作業環境とリソースの個人ごとの環境分離を実現しました。
環境構築の簡単化
従来の環境では、新しい研究者が開発を始める際に PC へのライブラリやツールのインストールなど、煩雑なセットアップ作業が必要でした。SageMaker Studio の導入により、研究者は PC へのインストール作業から解放され、Web ブラウザからアクセスするだけで、すぐに開発を開始できるようになりました。Code Editor には、データ解析や機械学習で利用される主要なライブラリが一式プリインストールされており、イメージの最新版が頻繁にアップデートされて提供されるため、研究者は常に最新のアルゴリズムやライブラリを容易に試すことができます。また、Amazon Q Developer による生成 AI を活用したコーディング支援も利用できます。
コストを増加させないキャパシティ不足の解決
従来の環境では、キャパシティ不足により必要な時に十分な計算リソースを確保できないという課題がありました。SageMaker Training は、機械学習モデルの学習を実行するための機能で、学習ジョブを実行すると機械学習用インスタンスが自動起動し、学習終了後に自動でシャットダウンされる仕組みです。インスタンス起動時には、研究者が自由にインスタンスの種類や数を指定できます。これにより、必要な時に必要なだけ計算リソースを柔軟に拡張できるようになり、従来は困難だった大規模な機械学習モデルの開発も、複数のインスタンスを並列で稼働させることで対応可能になりました。また、従来環境では常時起動による時間課金が発生していましたが、SageMaker Training では起動した時間分のみの課金となるため、使用していない時間のコストを削減できます。
得られた成果
基盤の改善
従来の機械学習環境における課題であった、個人ごとの環境分離、環境構築の手間、キャパシティ不足を解決しました。
また、Amazon SageMaker AI の導入により以下の副次的なメリットがありました。
SageMaker Studio や Code Editor では最新のイメージを利用者が自由に選択できるため、開発に必要なアプリケーションや OS レイヤーの維持管理作業が不要になりました。また、必要に応じて柔軟にリソースを拡張できるため、従来必要だったキャパシティの常時モニタリングからも解放されました。セキュリティ面では、AWS IAM Identity Center により、個人ごとに分離された環境への認証を社内の既存の認証基盤と連携させることで、認証の利便性を向上させました。さらに、閉域構成など社内ネットワークポリシーに準拠した構成を維持しました。
利用の拡大と研究者からの評価
機械学習基盤は全国の製鉄所・研究所で展開され、勉強会やハンズオンを通じて利用者からの高い評価を得ています。利用者からは、「これまでできなかったことができるようになった」「自由に計算資源を立ち上げられて良い」というフィードバックが寄せられています。現在、品質改善、異常検知、基盤モデルのファインチューニングなど、多様なユースケースで利用されています。
利用者の間では SageMaker AI の様々な便利機能の利用が始まっています。例えば、SageMaker Training では、学習の実験記録が自動保存されるため、ハイパーパラメータやモデル格納場所、コードの紛失リスクが解消され、実験の再現性が向上しました。この実験管理機能は、社内で大規模な実験の管理に利用されています。
また、利用者自身が学習済みの機械学習モデルをより簡単にデプロイすることが可能となっただけでなく、本格的な業務利用が予定されるユースケースにおいては、JFE システムズの支援により SageMaker AI のバッチ変換ジョブと Amazon ECS を組み合わせた機械学習推論パイプラインを構築し運用しています。
今後の展望
JFE スチールの CPS 開発実行基盤は、Amazon SageMaker AI の導入を第一歩として、さらなる進化を目指しています。
CPSはそのすべてがクラウド上で完結するものではなく、ユースケースによっては製鉄所のエッジにオンプレミスサーバを配置して運用する必要があります。これを見据え今後は AWS IoT Greengrass によるエッジ配信基盤を構築予定です。SageMaker AI で開発した機械学習モデルを、製鉄所のエッジサーバに Greengrass で配信し、エッジでのリアルタイム推論を実現します。これにより、機械学習モデルの開発から製鉄所エッジでの推論実行まで、一気通貫のワークフローが完成します。
この CPS 開発実行基盤を活用し、主要ラインの CPS 化を加速させ、最終的には全プロセスを CPS 化して仮想空間に製鉄プロセス全体を再現する「インテリジェント製鉄所」の実現を目指します。
まとめ
JFE スチール、JFE システムズ、AWS の 3 社協業により、Amazon SageMaker AI を中核とした CPS 開発実行基盤の構築を行い、個人ごとの環境分離、環境構築の簡単化、キャパシティ不足の解決を実現し、研究者や製造現場のエンジニアから高い評価を獲得しました。
今後は、AWS IoT Greengrass によるエッジ配信基盤の統合により、インテリジェント製鉄所の実現に向けて前進していきます。
執筆者
写真左から髙山様、庄村様、杉田様、原様

