変数の設定アクションを配置する
[5]変数の設定アクションを配置する
検索するキーワードを変えることできるように[変数]アクショングループから、[変数の設定]アクションを、[Webページ内のテキストフィールドに入力する]よりも上に配置します。
設定が開いたら、検索するキーワードを入力した変数を設定します。このサンプルでは変数名を[Word]、検索するキーワード[宇宙の終焉について]としました。設定する検索するキーワードによっては検索結果のページの状況が異なり、以降の手順通りにいかない場合もあるので、この検索するキーワードをいろいろ変更して試してください。変数名は、NewVarとなっているところをクリックして編集できます。
- 設定: %Word% (編集モード以外のときはWordと表示されます)
- 宛先: 宇宙の終焉について
このサンプルでは変数の設定で固定的な文字列を設定しますが、ファイルから読み取ったデータが入った変数を使用すると、フローのデザインを変えずに検索するキーワードを変更できるようになります。
[6]検索するキーワードを変更する
[Webページ内のテキストフィールドに入力する]アクションの設定画面を開きます。
テキストを上記で設定した変数の値になるように
- テキスト:%Word%
と設定して保存します。
[7]フローを実行する
ここまでに設定したフローを保存&実行すると、Googleで検索が実行されて、検索結果のページが表示されます。このページを表示したまま、フローデザイナーに戻ります。
[8]Webページからデータを抽出するアクションを配置する
[ブラウザー自動化]アクショングループ[Webデータ抽出]―[Webページからデータを抽出する]アクションをデザインしているフローの末尾に配置します。
[Webページからデータを抽出する]の設定画面が表示されたら、そのまま、ブラウザーの検索結果のページをアクティブにします。
[9]HTMLの繰り返し要素の最初の要素を抽出する
[ライブWebヘルパー]ウィンドウが表示され、ページ内のマウスカーソルホバーで、赤枠が表示されます。
検索結果1つ目のリンクの<h3>要素をホバーして赤枠が表示されている時に、右クリック―[要素の値を抽出]―[テキスト: ('宇宙の…')]を選択します。[ライブWebヘルパー]ウィンドウに値が入ります。
[10]繰り返し要素2つ目以降の要素を抽出する
続いて、検索結果2つ目のリンクの<h3>要素をホバーしている時に、右クリック―[要素の値を抽出]―[テキスト: '宇宙の…']を選択します。
すると、[ライブWebヘルパー]ウィンドウに、検索結果2つ目だけでなく自動で推測された3つ目以降の同階層の要素が抽出されます。
[11]親要素(ハイパーリンク)を選択する
再び、検索結果1つ目のリンクの<h3>要素をホバーしている時に、右クリック―[親要素の選択]を選択します。すると、<a>要素を赤枠が囲んでいる状態になります(マウスカーソルがブラウザーからはみ出ないように操作する必要があります)。
[12]リンクのURLを抽出する
<a>の赤枠の中で右クリック―[要素の値を抽出]―[Href: https…]を選択します。
すると、[ライブWebヘルパー]ウィンドウに、2列目に検索結果のそれぞれのURLが抽出されます。
[13][次へ]リンクをページャーとして抽出する
次に、検索結果のページの最下部近くにある[次へ]リンクを探します。マウスカーソルホバーしてして、赤枠で囲まれた時に、右クリック―[要素をページャーとして設定]を選択します。
[14]詳細設定を確認する
[ライブWebヘルパー]ウィンドウ左下の[詳細設定]リンクをクリックして、内容を確認します。
抽出対象のページのHTMLソースの構造を把握していれば、このウィンドウで抽出対象の要素をCSSセレクターで指定することもできます。
Chromeであれば、ページ閲覧中に右クリック―[検証]でHTMLソースの該当要素部分を表示できます。HTMLソースの該当要素の上でさらに右クリックすることで、[コピー]―[selectorをコピー]でクリップボードにCSSセレクターをコピーできます。
[OK]で詳細設定を閉じて、[終了]で[ライブWebヘルパー]ウィンドウを閉じます。
[15]Webページからデータを抽出するアクションの設定
[Webページからデータを抽出する]の設定画面が表示されるので、以下のように設定します。
- [処理するWebページの最大数]:4
- [データ保存モード]:[Excelスプレッドシート]
[保存]ボタンをクリックして閉じます。
[16]フローを実行する
フローデザイナーのツールバーの保存ボタンで保存して、実行ボタンでフローを開始します。検索と結果のページングが行われ、フローが完了すると、Excelが起動して、Excelの新しいブックのシートに結果のページのタイトルとURLの組が表示されます。
次のフローで使用するため、このExcelブックを保存して閉じます。
- 名前:検索結果.xlsx
- 保存場所:デスクトップ
もしくは、フローにあらかじめ[Excelを閉じる]アクションなどを追加して、自動で保存するようにしても構いません。同じく、フローデザイナーも終了します。