次世代SageMaker Studioノートブック
最後に、「Amazon SageMaker」のアップデート情報です。re:Invent2022では、SageMaker Studioノートブックに関する複数のアップデートがありました。
SageMaker Studioノートブックは、機械学習用の統合開発環境(IDE)であるSageMaker Studioで起動できるノートブックです。それぞれのアップデートについてご紹介します。
ノートブックのコードがジョブ実行可能に!
個人的には今回のre:Inventで最もありがたいアップデートです。
これまでは、ノートブック上でインタラクティブに構築したコードを本番環境にデプロイしようとすると、Pythonファイル化、Dockerイメージの準備、Amazon SageMaker Pipelines、AWS Lambda、Amazon EventBridgeなどさまざまなサービス・機能を組み合わせてインフラの設定やデプロイ設計をする必要があり、広範なスキルセットが必要かつ時間もかかる作業だったと思います。
本機能を利用すると、数回クリックするだけで、自動でノートブック全体のスナップショットを取得し、その依存関係をコンテナにパッケージ化し、インフラストラクチャを構築して、定義したスケジュールに従ってノートブックをジョブとして実行できるようになります(即時実行も可能)。
SageMaker Studioから、インスタンスタイプ、実行スケジュールなどの実行環境の設定も簡単に変更可能となっており、非常に便利な機能だと思います。
ノートブック上でGUIでのデータ準備・分析が可能に!
本アップデートは、ノートブック上でのデータ準備・分析の生産性を向上させてくれます。
利用方法は非常にシンプルで、SageMaker Studioノートブックで、PandasのDataFrameを使ってデータを読み込むのみで、統計値、データ分布、欠損値、無効なデータ、外れ値などのデータ品質の問題を特定するための情報を自動で分析・可視化してくれます。
また、それらのデータをGUIで変換することもできます。GUIで実施したデータ変換のソースコードも自動で生成してくれるので、本番環境へのデプロイも簡単にできます。
複数人でリアルタイムにノートブックを共有・編集可能に!
データアナリティクスプロジェクトでは、データサイエンティストやエンジニアが複数人で作業することが多く、お互いの作業内容などを共有したり、一緒に課題検討したりする場面が多くあると思います。
このアップデートにより、SageMaker Studioで複数人で同時に同じノートブックにアクセスし、リアルタイムで読み込み、編集、共有を行えるようになりました。
ファイルを送りあったり、コミュニケーションツールを別途利用して画面共有するなどする手間がなくなります。チームの生産性を向上させ、より効率的に成果を出せるようになるのではないでしょうか。
おわりに
AWS re:Invent 2022で発表のあったサービスアップデートはもちろんのこと、アナリティクス・機械学習サービスは、AWS re:Invent 2022以降も多くのアップデート情報がありますので今後もご紹介していきたいと思います。