米Googleの、オープンソースの機械学習ライブラリTensorFlow開発チームは、「TensorFlow 2.3」を7月27日(現地時間)にリリースした。
「TensorFlow 2.3」では、データのロードと前処理をさらに容易にし、1台のマシンで作業している場合でも、複数のマシンで作業している場合でも、入力パイプラインのボトルネックを解決する新たな機能が追加されている。
「tf.data」では、入力パイプラインのボトルネックを解決してリソース使用率を改善すべく、トレーニングジョブと並行して実行されるデータ処理ワーカーのCPUクラスターに入力前処理をオフロードして、アクセラレータの使用率を向上する方法が提供されたほか、入力前処理パイプラインの出力をディスクに保持することができるスナップショットAPIが追加された。
また「TF Profiler」では、モデルのメモリ使用量を可視化するメモリプロファイラと、モデル内のPython関数呼び出しをトレースできるPythonトレーサが追加されている。
ほかにも、Keras Preprocessing Layers APIの実験的なサポートが追加されており、前処理ロジックをモデル内にパッケージ化してデプロイを容易にすることが可能になり、入力としてテーブルからraw文字列、画像、または行を取得するモデルを出力できる。さらに、数行のコードでディスク上のイメージやテキストファイルのディレクトリから、tf.data.Datasetを作成可能なユーティリティも用意している。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です