SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

CodeZineニュース

機械学習用データの迅速な準備を可能にする「Amazon SageMaker Data Wrangler」提供開始

  • X ポスト
  • このエントリーをはてなブックマークに追加

  • X ポスト
  • このエントリーをはてなブックマークに追加

 米Amazon Web Servicesは、Amazon SageMakerの新機能として、データサイエンティストやエンジニアがビジュアルインターフェイスを使用して機械学習アプリケーション用データをすばやく準備できるようにする「Amazon SageMaker Data Wrangler」の提供を、12月8日(現地時間)に開始した。

 Amazon SageMaker Data Wranglerは、機械学習用のフルマネージド統合開発環境(IDE)であるAmazon SageMaker Studioに統合されている

 従来、機械学習に費やされる時間の最大80%を、データの準備が占めていたが、Amazon SageMaker Data Wranglerを使用することで数クリックにてデータソースに接続し、データを探索して視覚化し、組み込みの変換と独自の変換を適用し、結果のコードを自動生成されたスクリプトにエクスポートして、管理されたインフラストラクチャでの実行が可能になる。

 データソースは、Amazon S3、Amazon Athena、Amazon RedShift、AWS Lake Formationに対応しており、Amazon SageMaker Feature Storeからインポートすることもできる。データは、概要、ヒストグラム、散布図の表示が可能で、データの検索と置換、列の分割/名前変更/削除、数値のスケーリング、カテゴリ値のエンコードなど、300以上の変換機能を用意する。

 処理パイプラインに変換ステップを追加することで、処理の概要をグラフィカルに表示でき、データのサブセットを選択してモデルをトレーニングし、予測される結果にもっとも貢献している機能を特定可能な「クイックモデル」機能も備えている。

 作成した処理パイプラインはPythonスクリプトにエクスポートでき、機械学習プロジェクトへ組み込めるほか、Amazon SageMaker処理ジョブ/Amazon SageMakerパイプランワークフローを実行するノートブックや、処理された機能をAmazon SageMaker Feature Storeにプッシュするノートブックへエクスポートすることもできる。

関連リンク

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
この記事の著者

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/13325 2020/12/11 08:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング