Python向け深層学習フレームワーク「PyTorch」を開発しているPyTorch Foundationは、PyTorch向けの画像処理ライブラリ「TorchVision」に新たな機能を加えていることを11月3日(現地時間)に明かした。新機能は現在プロトタイプとして提供しており、2023年第1四半期に正式版として提供することを予定している。
プロトタイプでは、物体検出や画像分類、動画分類に新たに対応した。さらに、画像内の任意の領域を指定するバウンディング・ボックスや、分類に使用するセグメンテーションマスクの機能も提供するようになった。さらに、画像のサイズ変更、トリミング、アフィン変換、パディングにも対応した。
そして、「MixUp」「CutMix」「Large Scale Jitter」「SimpleCopyPaste」「AutoAugmentation」といったデータ拡張手法を利用できるようになった。
今回提供するプロトタイプには、JIT(Just-in-Time)コンパイラを利用できないという制限がある。PyTorch Foundationは正式版提供までに、新機能のオーバーヘッドを削減して、処理速度を引き上げるとしている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です