対象読者
- Excel/PowerPointなど、一般的なツールの操作を理解している人
- RPAツールを用いて業務を自動化したい人
PDFアクション
PDF(Portable Document Format)とは、Adobe社が開発したページ記述言語PostScriptをベースにしたドキュメント形式のこと。環境やプリンターによらずに保存・転送・閲覧・印刷が可能であり、電子ドキュメントにおける事実上の標準のファイル形式として広く使用されています。ファイルの中に、テキストデータと描画命令、画像などのコードが圧縮されて格納されています。
Power Automate for Desktopでも、これらのファイルを扱うアクションが用意されています。
- PDFからテキストを抽出
- PDFから画像を抽出
- PDFからテーブルを抽出
- 新しい PDFファイルへのPDFファイルページの抽出
- PDFファイルを統合
本稿では、既存のPDFからデータを抽出するフローを作成します。そのために、事前にPDFを用意します。スキャンなどで作成されたPDFでは正常にデータ抽出ができませんのでご注意ください。
ドキュメントフォルダに[PDFフォルダ]というフォルダを作成して、Wikipediaの「ネコ」のページの左側から[PDF 形式でダウンロード]リンク先のページでPDFフォルダにPDFをダウンロードします。
「ネコ - Wikipedia」