SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2023 セッションレポート(AD)

機械学習システムの技術的負債を防ぐ! Alibaba CloudでMLOpsを実現するためのサービスとポイント

【10-B-5】クラウドではじめるMLOps(機械学習オペレーション):Alibaba Cloud 製品を活用した機械学習の全ライフサイクルにおけるプロセスの自動化および標準化

  • X ポスト
  • このエントリーをはてなブックマークに追加

機械学習システムは技術的負債が課題に

 今回のテーマは機械学習や深層学習インフラストラクチャの運用(MLOps)のための機械学習パイプラインとなる。まずは基本的なところから確認していこう。

 厳密にはMLOpsの定義は各社ごとに異なるものの、ここではWikipediaの表記「MLOpsとは、ディープラーニングなどの機械学習のライフサイクルを管理するための、データサイエンティスト、エンジニア、保守運用担当者のコラボレーションおよびコミュニケーションに関する実践手法」を採用していく。泉氏は「あくまでもコンセプト。DevOpsと組み合わせて、機械学習のプロセスを回していくという発想」と説明する。

 なお似たような用語に「AIOps」もある。泉氏は「これはAIをITの運用プロセスに生かしていこうというものなので、本質的には機械学習そのものの運用とはあまり関係がない」とくぎを刺す。

 もともと機械学習自体は数十年前に開発されていた。近年急速に実用化が進んでいる背景には、ツール群が発展し、利用しやすい環境が整ってきたためと言える。かつては最小限のライブラリしかなかったところ、今ではPyTorch、Scikit-learn、TensorFlowなど充実している。周辺にはHadoopなどのデータストア、Apache SparkやApache Flinkなどビッグデータ分析フレームワーク、JenkinsなどDevOps周辺を支えるツール群、DockerやKubernetesのようなコンテナやオーケストレーション技術もある。

 さらに各種のグローバル展開するクラウドインフラが発展し、そこで拡張性や、ほぼ無制限のようなデータ容量といったメリットを享受できるようになっている。そうした背景のなか「Alibaba Cloudも担い手の1つになっています」と泉氏は言う。Alibaba Cloudでは機械学習で使える各種サービスを提供している(詳しくは後述)。

 ただしMLOpsで避けて通れないのが機械学習の技術的負債だ。泉氏は機械学習に関する国際会議(NIPS:Neural Information Processing Systems)で提出された論文「Hidden Technical Debt in Machine Learning Systems」を挙げた。

 実は機械学習開発そのものの負荷はそう大きくない。しかし機械学習を実践していくにあたり、設定、データの収集、データの検証、マシンリソース管理、プロセス管理、監視など周辺には多くの負荷がある。機械学習では学習を継続していくことも重要になるため、MLOpsのようなコンセプトを実践していかないと負担だらけになってしまい、結果的には機械学習のプロセスが停滞し、陳腐化してしまうということが起こりかねない。

機械学習の技術的負債
機械学習の技術的負債

 そのため機械学習においては、機械学習以外の開発コストや負荷、役割分担、環境間の再現性の確保、処理リソースの確保、開発からデプロイまでのリードタイムなどをクリアしていくなどワークフローや体制を整えていく必要がある。

 機械学習を実践していくなら、機械学習は継続的な取り組みが必要だと認識しておくべきだろう。アルゴリズムを開発し、モデルを構築したら終わりではない。データをフィードしてトレーニングを重ね、予測と推論ができるサービスとしてデプロイできるような形にする。そして品質や性能を検証して、本番環境にリリースする。ここでも終わりではない。モデルを陳腐化させないためには、フィードバックループを繰り返していく必要があるのだ。

MLOpsワークフロー
MLOpsワークフロー

次のページ
Alibaba CloudならMLOpsをこう実現できる

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
Developers Summit 2023 セッションレポート連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

フリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Onlineの取材・記事や、EnterpriseZine/Security Onlineキュレーターも担当しています。Webサイト:http://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

丸毛 透(マルモ トオル)

インタビュー(人物)、ポートレート、商品撮影、料理写真をWeb雑誌中心に活動。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:アリババクラウド・ジャパンサービス株式会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/17520 2023/04/27 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング