SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Developers Summit 2023 セッションレポート(AD)

Google Cloudが解説! エンジニアはAI/MLソリューションのレイヤー構造を理解しよう!

【10-A-2】ML/AIソリューションのレイヤー構造を理解しよう!~ エンジニアとして知っておきたいアーキテクチャの全体像

  • このエントリーをはてなブックマークに追加

AI/MLの機能の集合体としての「Document AI」

 ではいよいよ「Document AI」の仕組みを分解して見ていこう。

 最もシンプルな機能となるのがテキストとレイアウトの抽出で、これのモデルにはDocument OCRがある。画像やPDF、手書きであってもテキスト情報を抽出することができる。続いて構造化されたフォームからキーとバリューのペアを抽出する学習済みモデルにはForm Parserがある。請求書や経費など一般的なフォームから構造を理解する。チェックボックスや表形式のコンテンツにも対応している。

 こうした事前学習済みのモデルはあるものの、自社ビジネスでは十分な精度が出せない場合もある。その場合は追加学習することで精度を高めることができる。追加学習は事前学習済みのモデルをベースとして、最小限の学習データでフィールドや言語を追加して「転移学習」することになる。モデルをチューニングするようなイメージだ。そうしてユーザーは追加学習されたモデルを利用可能となる。

追加学習による制度の改善
追加学習による精度の改善

 追加学習で対応できず、一からモデルを作るならDocument AI Workbenchという機能もある。これまで自社専用のカスタムモデルを作るのはデータサイエンティストや専門家の仕事だったが、これを使えばGUIで比較的簡単に作成できてしまう。

 意味のあるテキストを抽出したら、あとは蓄積し、検索可能な形で管理していく必要がある。そのレポジトリとなるのがDocument AI Warehouse。これは文書に特化したストレージサービスとイメージしていいだろう。

Document AIをどのように利用するべきか?
Document AIをどのように利用するべきか?

 ただし単なるストレージサービスではない。Googleの文書のセマンティックサーチ技術が盛り込まれており、検索性能を高めている。鍵となるのがKnowledge Graphで、データを実世界のエンティティと関係性に変換する。例えば「翔泳社」という文字列で検索をかけたとき、Knowledge Graphでは、会社、組織、所在地など実世界の実態に合わせて構造的に情報を保存している。これにより関係性を加味して、より適切な検索結果を返すことができる。

 このようにDocument AIの機能を分解してみると、このサービスが複数のAI/MLの機能の集合体であることがイメージできるのではないだろうか。最初の読み込みはOCRやParser、追加学習はAutoML、変換したデータはDocument AI Warehouseに蓄積され、Knowledge Graphでより適切な検索結果を返すことができる。「Document AI」をSaaSのサービスと考えるなら、複数PaaSを組み合わせて提供されていることになる。

AI/MLソリューションのレイヤー構造
AI/MLソリューションのレイヤー構造

 同 下田倫大氏は「皆さんもPaaSレイヤーのものを組み合わせることでDocument AIのようにビジネスユーザーが使うサービスを作ることが可能です」と話す。なお補足として、図で示したPaaSは似た機能を持つものを挙げており、Document AIを構成するものと全く同じではないことを念頭においてもらいたい。

次のページ
AI/ML機能を組み合わせ、ビジネスに生かした事例:ポケトークとNew York Times

この記事は参考になりましたか?

  • このエントリーをはてなブックマークに追加
Developers Summit 2023 セッションレポート連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

フリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Onlineの取材・記事や、EnterpriseZine/Security Onlineキュレーターも担当しています。Webサイト:http://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

提供:グーグル・クラウド・ジャパン合同会社

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/17423 2023/04/03 12:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング