SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

Power Automate Desktopチュートリアル

無償デスクトップ自動化ツール「Power Automate Desktop」でOCR処理を自動化する

Power Automate Desktopチュートリアル 第23回

  • このエントリーをはてなブックマークに追加

 Power Automate for Desktopは、自動化可能な作業の流れ(フロー)をデザインし、実行するためのソフトウェアです。第22回では、フローを任意のタイミングで実行する一つの方法を紹介しました。今回は、もともと組み込まれているOCRアクショングループのアクションで画面や画像ファイルの画像内の文字列を文字認識によって抽出する「OCRを使ったテキスト抽出」アクションを紹介します。

  • このエントリーをはてなブックマークに追加

はじめに

 日々の業務作業で、画面や画像を見てその内容によって、その後の作業の流れや結果を変更する場面があります。そういった業務作業をPower Automate for desktopで自動化する際に、OCRのアクションを利用できます。

 今回は、文字列が含まれた画像ファイルが複数入ったフォルダーを用意して、その中の各画像の文字列を抽出するサンプルフローを作成します。

[注意]

  • アクションには、MicrosoftコグニティブのOCRの機能もありますが今回は使用しません。Azureアカウントなどは不要です。
  • 「ファイル選択ダイアログ」アクションの後に「OCRを使ってテキストを抽出」アクションを使用するとデッドロックしてフリーズしてしまう問題があるようですので、ご注意ください。

フォルダー/素材の準備

 まずはOCR読み込みのもととなる画像ファイルと、サンプル実行に必要なフォルダーを準備します。

[1]フォルダを作成する

 ドキュメントフォルダにOCRフォルダーを作成してその中に、Image、Text、Excelbookというフォルダーを作成します。

 今回のフローでは、Imageのサブフォルダーにある各画像ファイルに対して、Textのサブフォルダーを作成し、対応する結果テキストファイルを格納します。

 Excelbookは後編で作成するフローでの出力先として使用します。

ドキュメント
└─OCR
  ├─Image
  │  ├─(対象の画像フォルダ)A
  │  └─(対象の画像フォルダ)B
  ├─Text
  └─Excelbook

 本節で作成するフローの実行後

ドキュメント
└─OCR
  ├─Image
  │  ├─(対象の画像フォルダ)A
  │  └─(対象の画像フォルダ)B
  ├─Text
  │  ├─(Aの各画像から抽出したテキストが入ったフォルダ)
  │  └─(Bの各画像から抽出したテキストが入ったフォルダ)
  └─Excelbook

[2]画像が複数入ったフォルダーをImageフォルダーに配置する

 サンプルフローの対象となるファイルは、文字列が含まれていて対応している画像形式の画像ファイルであればどんなものでもかまいません。紙の書類をスキャンした画像データ、Webページのキャプチャ画像などです。

 サンプルフローでは、

の「ログインなしで閲覧可能」の古い書籍の画像を「印刷」でjpg形式でダウンロードしたもののいくつかを使用します。Imageフォルダーに複数の画像の入ったフォルダーを配置します。

図:画像フォルダーの配置
図:画像フォルダーの配置

 複数のフォルダーでもかまいませんが、フローの正常な動作確認が完了する前は、少数の画像での確認をおすすめします。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

次のページ
OCRでテキストを抽出するフローの作成

この記事は参考になりましたか?

  • このエントリーをはてなブックマークに追加
Power Automate Desktopチュートリアル連載記事一覧

もっと読む

この記事の著者

WINGSプロジェクト 飯島 聡(WINGSプロジェクト イイジマ サトシ)

WINGSプロジェクトについて> 有限会社 WINGSプロジェクトが運営する、テクニカル執筆コミュニティ(代表 山田祥寛)。主にWeb開発分野の書籍/記事執筆、翻訳、講演等を幅広く手がける。2018年11月時点での登録メンバは55名で、現在も執筆メンバを募集中。興味のある方は、どしどし応募頂きたい。著書記事多数。 RSS Twitter: @yyamada(公式)、@yyamada/wings(メンバーリスト)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山田 祥寛(ヤマダ ヨシヒロ)

静岡県榛原町生まれ。一橋大学経済学部卒業後、NECにてシステム企画業務に携わるが、2003年4月に念願かなってフリーライターに転身。Microsoft MVP for Visual Studio and Development Technologies。執筆コミュニティ「WINGSプロジェクト」代表。主な著書に「独習シリーズ(Java・C#・Python・PHP・Ruby・JSP&サーブレットなど)」「速習シリーズ(ASP.NET Core・Vue.js・React・TypeScript・ECMAScript、Laravelなど)」「改訂3版JavaScript本格入門」「これからはじめるReact実践入門」「はじめてのAndroidアプリ開発 Kotlin編 」他、著書多数

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/18419 2023/10/18 11:00

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング