オープンソースのPython向け自然言語処理(NLP:Natural Language Processing)ライブラリであるspaCyの開発チームは、最新版となる「spaCy 3.4」を7月12日(現地時間)に(公開)した。
「spaCy 3.4」ではまず、型安全なプログラムを作るための機能を備えた。型情報を提供する「pydantic v1.9」と、型チェッカー「mypy 0.950以上」に対応した。機械学習ライブラリThinkCを使ったプログラムを記述する際に、型に関する間違いが減る。
macOSの環境では、パーサーで「saxpy」「sgemm」関数を使うようになった。これで処理性能が上がるとしている。ほかには、すべての環境でベクターを検索する際の性能が上がり、「Example.get_aligned_parse」と「Example.get_aligned」の2つメソッドの性能が向上した。
そのほか、新たに訓練済みの状態でクロアチア語に対応したほか、英語への対応を改善し、「AirTags」「Brexit」「covid」「doomscrolling」など、複数の言葉を組み合わせた新しい言葉を認識するようになった。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です