Defined.ai は、AIトレーニングデータのワンストップショップ。AI開発者がトレーニングデータにアクセスし、試して購入できるマーケットプレイスを展開している。また、スピーチ、NLP(自然言語処理)、CV(コンピュータビジョン)などあらゆる分野のトレーニングデータを、グローバル企業に提供している。今回発表された製品は3つ。
スピーチデータ は、モノローグ、対話型IVRとの発話、二者間の会話を業種ごとに再現した音声認識トレーニング用の商品。日本語を含め約90言語を取り揃えている。現在の対応業種は、通信・小売・保険・銀行の4つ。 加えて、発話者の年齢層や男女比、アクセントなどの属性情報を用意しており、用途・予算に合わせてご希望の時間単位で購入が可能。また、Webサイトより30分の無料サンプルをダウンロードできる。

アスペクトに基づく感情分析は、これまで行われてきた文レベルでの感情分析に比べて、製品やサービスのレビューに込められた感情にさらに深く踏み込むデータセットである。現在は、日本語、英語、スペイン語、ドイツ語、北京語にて販売されている。
顔認識データは、顔認識モデルの性能向上のためのデータセット。 多数派への偏りを防ぐため、7つの民族のデータセットを均等な男女比、幅広い年齢で用意している。

Defined.aiマーケットプレイスは、自社製品だけではなく、企業・個人オーナーのための販売の場としても展開予定。