概要

課題・ソリューション・導入効果
ビジネスの課題
ピーク時に備えた余剰インフラコストの削減
atama plus は、学びのあり方を進化させている企業です。全国の学習塾で活用されている小中高生向けの AI 学習システム「atama+」は、生徒一人ひとりの理解度に応じたカリキュラムを自動作成できるのが特長です。教師が生徒の進捗をリアルタイムで把握できるようデータを提供することで、教育の質を高めます。同社は「基礎学力」の習得にかかる時間を短くし、そのぶん増える時間で「社会でいきる力」を伸ばすことにより、自分の人生を生きる人を増やし、これからの社会をつくろうとしています。
atama+のメインのアプリケーション基盤は、これまで AWS 以外のクラウドプラットフォーム上に展開していました。しかし、年間契約のライセンス費用が固定であることや、事業の成長とともにインフラに対する要望が増加し、将来性に課題を感じていました。「学習塾には夏期/冬期の講習など、年間の利用ピークがあります。従来利用していた従来環境は年間固定のプランで、閑散期に縮退してコストを削減する柔軟な対応ができませんでした。また、利用可能なインスタンス数の上限に近づいていたため、拡張性を考慮して、2021 年頃から AWS 環境への移行を検討し始めました」と語るのは、SRE チーム マネージャーの石井俊匡氏です。
データベースは当初から AWS のサービスを利用しており、一部のアプリケーションも AWS 上で安定して動作していたことから、SRE チームは AWS への移行が適切だと判断しました。さらに、2022 年からの円安の影響もあり、経営陣からはインフラコストの削減を求められていました。周辺サービスも含めて全てを AWS に移行することで、より柔軟にスケールやコストのコントロールをしたいと考えたのです。
「従来環境ではメッセージブローカーに RabbitMQ を使用していましたが、AWS には Amazon MQ for RabbitMQ があるため、アプリケーションに大きな影響を与えずに移行ができる点もポイントでした」(石井氏)
2023 年 6 月末に控えていた従来環境の年間ライセンス更新の前に移行を完了したいと考え、2022 年の夏頃に SRE チームとアプリケーションチームによるインフラ移行タスクフォースが組成されました。そこに 2022 年 8 月頃に加わったのが前職でオンプレミスから AWS への移行を経験した稲田寛氏です。
ソリューション
開発者の操作性を維持するために AWS サービスを駆使
AWS 移行に伴う課題について、稲田氏は「AWS 環境でコストを抑制できるといっても、移行期間中は従来環境と AWS の両方のコストが発生する点が課題の 1 つでした。この問題に対処するため、AWS Migration Acceleration Program(MAP)のクレジットを活用しコストの低減を図りました」と語ります。
技術的課題は、移行によるトラブルをいかにゼロにするかという点でした。DNS サービスの Amazon Route 53 を利用して新旧環境をいつでも切り替えられるようにし、加重ルーティングにより徐々に新環境に移行しました。従来環境で使用されていた RabbitMQ については、本来なら Amazon Simple Queue Service(Amazon SQS)に変更したいところでしたが、一旦 Amazon MQ for RabbitMQ にそのまま移行することで安定稼働を保証しました。
技術的な課題の 2 番目は、従来環境と AWS の機能差分をどのように埋めるかという点でした。新しい環境では Amazon Elastic Container Service(Amazon ECS)を使用することにしました。「従来環境はバッチ処理のスケジューラの機能が充実しており、Amazon ECS の標準の機能では不十分でした。そのため、Event Bridge と AWS Step Functions を組み合わせて、これを補いました。AWS Step Functions を利用することで、バッチ終了時刻の監視や、バッチの前後処理が簡単に実装できるようになりました。この選択は正しかったと感じています」(稲田氏)
また、これまでの環境では容易に行えた操作が AWS で同じようにはいかない部分は、タスクフォースのチームメンバーで話し合って対策を講じました。その一例が AWS Chatbot の採用です。従来環境では、運用時の設定変更は管理画面から行っていましたが、AWS の場合は設定項目が多くマネジメントコンソールでの操作は非効率になることが予想されました。AWS Chatbot は普段使っているチャットアプリから AWS CLI のコマンドを受け取る機能を提供しているため、CLI コマンドをドキュメント化し、開発者がそれをコピー&ペーストするだけで使用できるようにしました。「これは開発者に非常に好評で、操作の難しさを軽減するのに役立ちました。CLI コマンドだけで実行できない操作については、シンプルな AWS Lambda 関数を作成し、これを AWS Chatbot を介して実行できるようにしました。アプリケーション開発チームも、作業効率が向上しているといいます」(稲田氏)
導入効果
より低いコストで変わらぬ価値を提供できる環境に
アプリケーション環境の AWS 移行は2023 年 4 月に完了しました。石井氏は「移行によって、コストを約 4 割削減できました。利用量に応じて柔軟にサーバーを配備できるなど、コスト効率を考慮した最適化が可能になりました。また、従来環境では難しかった IaC(Infrastructure as Code)の適用範囲も拡大し、1 週間ほどかかっていた環境構築が半分以下の時間で完了するようになりました。AWS ではさまざまな指標が計測できるようになり、より最適化したリソースコントロールが行えるようになるとともに、コストの無駄を正確に検知できるようになりました。それにより、コスト最適化の取り組みが定着し、経営にも貢献することができました」と語ります。稲田氏は移行について振り返り、「困ったときには AWS の技術者から丁寧な支援を受けました。他社のクラウドサービスと比較して、サポートは非常に充実していると感じます」と評価しています。
SRE チームは、インフラの最適化に引き続き取り組んでおり、サーバーレスデータベースである Amazon Aurora Serverlessや、コストパフォーマンスの優れた AWS Graviton プロセッサ、AWS アジアパシフィック(大阪)リージョンの災害復旧環境の評価を進めています。石井氏は、生成系AI サービス Amazon Bedrock にも注目しており、「今後も新たなサービスの情報を随時提供してほしい」と期待を寄せています。

AWS への移行によって約 4 割のコスト削減が実現しました。使用していないリソースを削除するなど、コスト効率を考えた最適化ができるようになりました
石井 俊匡 氏
atama plus 株式会社 SRE チーム マネージャーアーキテクチャ

atama plus 株式会社
「教育に、人に、社会に、次の可能性を。」をミッションに、学習塾を通じて小中高校生向けの AI 教材「atama+(アタマプラス)」を提供する企業。AI を活用し、一人ひとりにカスタマイズされたカリキュラムを自動で作成し、学習者が基礎学力を効率的に身につけることを支援する。現在全国 47 都道府県にわたる 3,500 教室以上で展開している。
取組みの成果
40% - インフラコスト削減
1 週間かかっていた開発環境の構築工数が半減
ChatOps によって作業効率が向上
本事例のご担当者
石井 俊匡 氏

稲田 寛 氏
