「spaCy 3.2」では、スコアリングをカスタマイズするために、各コンポーネントのスコアリング関数を指定できるようになったほか、ほとんどのパイプラインコンポーネントにおいて、設定の上書きがサポートされた。
また、nlpとnlp.pipeではDocによる入力が可能になり、文字列の代わりにDocが提供される場合にはトークナイザがスキップされ、カスタムトークナイザによるDocの作成や、処理前のカスタム拡張機能の設定が容易になっているほか、サブワードとBloom組み込みによって、コンパクトでフルカバーのベクトルを実現するfastTextの拡張版であるfloretのサポートが追加されている。
さらに、spacy-transformersがシリアル化を改善し、インライントランスフォーマーコンポーネントとリスナの置き換えをサポートするようリファクタリングされたほか、transformer_config設定もサポートされたバージョン1.1にアップデートされるとともに、日本語用のTransformerパイプラインパッケージの追加なども行われた。