CodeZine(コードジン)

特集ページ一覧

Python向け自然言語処理ライブラリ「spaCy 3.0.0」がリリース

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2021/02/03 08:00

 オープンソースのPython向け自然言語処理(NLP)ライブラリであるspaCyの開発チームは、最新版となる「spaCy 3.0.0」を1月31日(現地時間)にリリースした。

 「spaCy 3.0.0」では、新機能としてマルチタスク学習をサポートするトランスフォーマーベースのパイプラインや、18以上の言語用に再トレーニングされたモデルファミリーと5つのトランスフォーマーベースパイプラインを含む計58のトレーニング済みパイプラインが追加されている。

 ほかにも、サポートされているすべての言語用に再トレーニングされたパイプラインとともに、マケドニア語とロシア語用の新しいコアパイプライン、新しいトレーニングワークフローと構成システム、PyTorch、TensorFlow、MXNetといった機械学習フレームワークを使用したカスタムモデル、前処理からモデル展開までのエンドツーエンドのマルチステップワークフローを管理するためのspaCyプロジェクトが実装された。

 機能改善としては、データバージョン管理(DVC)、Streamlit、Weights&Biases、Rayなどとの統合や、Rayを使用した並列トレーニングと分散コンピューティングのサポート、新たなパイプラインコンポーネントの実装、カスタムコンポーネントに向けたパイプラインコンポーネントAPIとデコレータの改善、他のパイプラインからのトレーニング済みコンポーネント調達への対応などが行われている。

関連リンク

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

あなたにオススメ

All contents copyright © 2005-2021 Shoeisha Co., Ltd. All rights reserved. ver.1.5