
「長文要約生成API」は、長い文章から、各文を圧縮したり、指定文字数ごとに区切って要約したり、重要な文を抽出したりすることが可能。過去30年分の朝日新聞の記事データおよび、記事を生み出すフローで生み出される内部データを活用し、学習データとしての処理効率を上げるためのフィルタリングなどをした上で、ディープラーニングを用いて学習させている。
「長文要約生成API」では下記の5つの機能を提供している。
- 入力された文章を、指定した長さごとに区切って要約する
- 文ごとの長さが揃うように圧縮する
- 文ごとに指定した割合まで圧縮する
- 重要な文を抽出する
- 抽出した重要文を圧縮し、文書全体を指定した長さにする
朝日新聞社はこれまで、自動で見出しや要約を生成する「自動要約生成API TSUNA」をリリースしてきた。今回、TSUNAで培ってきた技術をもとに研究を進め、「長文要約生成API」の公開に至った。本APIは評価用途に限って無償で利用することができる。