Amazon Web Services(以下、AWS)は、人工知能(以下、AI)を活用した3つの新サービス、「Amazon Polly」「Amazon Rekognition」「Amazon Lex」を、米国・ラスベガスで現地時間の11月29日から12月2日にかけて開催されたAWSのイベント、「re:Invent 2016」にて発表した。
re:Invent 2016での発表を受け、12月15日には国内のメディア向け事後説明会が東京・目黒のアマゾン ウェブ サービス ジャパン本社で行われた。
今回提供が開始されるAIサービスについて、アマゾン ウェブ サービス ジャパン 技術統括本部 本部長 技術統括責任者の岡嵜禎氏は、「AmazonがこれまでEC事業で培ってきたテクノロジー、例えば商品のリコメンデーション機能や物流倉庫ロボットで活用されてきた技術をユーザーに使いやすい形で提供したもの」と、コメントした。
いずれのサービスを使用する場合も、ディープラーニングアルゴリズムの構築や、機械学習モデルのトレーニング、インフラへの先行投資などを必要とせず、開発者はアプリケーションの開発に注力することができる。
それぞれのサービスの概要は以下の通り。
Amazon Polly
Amazon Pollyはフルマネージド型の”Text-to-speech”(文章を音声に変換する)機能を提供する。AWSのコンソール、もしくはAPIを利用してテキストをAmazon Pollyに送信すると、音声ストリームか標準音声フォーマットに保存されたファイルとして音声化される。日本語を含む24の言語に対応しており、47種類のボイスを利用することができる。
料金体系は、変換したテキストの分だけ支払いが発生するシステムで、一度生成された音声はキャッシュに保存して何度でも繰り返し再生することができる。
現在の対応リージョンはオレゴン、アイルランド、オハイオ。
Amazon Rekognition
Amazon Rekognitionはディープラーニングを利用した画像認識サービスで、人物の顔や画像の状況、その他の物体や景色を自動で検出する。例えば、画像内から人物の顔を特定して「顔が笑っている」「目が開いている」などの表情の特徴を検出したり、2枚の画像に映る顔を比較して同じ人物なのか計測したりすることが可能。
サービスを利用するための初期費用は不要で、分析した画像や保存した顔の特徴要素の数に応じて料金を支払う。また、月5000回の認識までは無料となっている。
現在はバージニア、オレゴン、アイルランドのリージョンで利用可能。
Amazon Lex(Preview)
Amazon Lexは音声またはテキストメッセージに応答するチャットボットの開発を容易にするサービス。Amazon Alexa[1]で使用されているものと同様の自動音声認識技術と自然言語理解機能が利用されている。自然言語の入力を解析し、意味合いに応じてアプリケーションコードを実行することによって、ユーザーとのインタラクションを実現することができる。また、Amazon Lexで作成されたボットは、WebアプリケーションやSlack、Facebook Messengerなどのアプリケーションや、モバイルアプリやコネクテッドデバイス内の音声を介して、さまざまな場所で使用することができる。
料金体系は、Amazon Lex APIにコールした回数に応じて支払いが発生する従量課金制。
現在の対応リージョンはバージニアとなっている。
注
[1]:Amazon AlexaはAmazonが提供するAIアシスタントサービス。サーバーサイドで動作しており、これまでも音声制御ハードウェアの「Amazon Echo」などで利用されてきた。
【関連リンク】
・Amazon Web Service
・Amazon Polly
・Amazon Rekognition
・Amazon Lex
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です