米Microsoftは、自然言語処理サービス「Azure Cognitive Service for Language」に向けたクライアント・ライブラリ「Azure Text Analytics」の最新ベータ版を2月9日(現地時間)に公開した。Python、.NET、Java、JavaScriptに対応するライブラリをそれぞれ公開した。
今回のベータ版ではまず、自然言語による文章を要約する機能である「Abstractive Summarization」が利用できるようになった。文章を要約する機能としては、すでに「Extractive Summarization」が利用できるようになっているが、Extractive Summarizationでは、元の文章から重要な文を抽出して要約するのに対して、Abstractive Summarizationでは、文を書き換えたり、新しい単語を使うなどして、独創的な要約文を生成する。
さらに、文章に登場する語句を分類する「Named Entity Recognition」の機能も利用できるようになった。この機能を使用すると例えば「twenty-six USD」という句を、「Quantity」のサブカテゴリである「Currency」に分類できるといった結果が得られる。
そして、文章が大体どのようなことを話題にしているのかによって分類する「Dynamic Classification」の機能も使えるようになった。この機能では訓練済みの学習モデルを使用するため、ユーザーが事前にモデルを訓練する必要はない。文章を入力すると、その文章がどのような話題について書いたものなのかを、「スポーツ」「映画」「天気」「政治」などのジャンルに分けて回答する。回答の際には、ジャンルのほかに回答が正しいものである可能性を示す「confidence score」も合わせて提示する。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です