Shoeisha Technology Media

CodeZine(コードジン)

記事種別から探す

Amazon Redshiftによるビッグデータ分析環境の構築手順

Amazon Redshiftによるビッグデータ分析環境の構築(3)

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2014/10/01 14:00

 連載第1回目はデータ分析環境に関する概要を、第2回目は分析で用いるデータの整備整形について解説を進めてきました。第3回目となる今回は、いよいよAWS環境下に分析環境で必要となる各種インスタンスを作成していく部分へと進んでいきます。

目次

 当回では、AWSアカウントを持っていない状況から、一から環境構築を行うという前提で以下の流れで作業を進めていく形を取ります。手順や画面キャプチャがこれまでの回とは異なり非常に多くなっていますが、ご了承ください。

  • アカウント取得
  • リージョン選択
  • VPCおよびネットワーク構成の作成
  • ルートテーブルの設定
  • Redshiftクラスタの作成
  • EC2インスタンスの作成
  • EC2経由でのRedshiftアクセス確認

 以降、AWSでの各種環境構築はブラウザ上で操作可能なAWSマネジメントコンソールを用いて行います。

 当エントリ公開時点では最新のスクリーンショットを表示しておりますが、AWS側のアップデートなどでレイアウトや見た目などが変わることが予想されます。その際は適宜置き換える形で進めていただけますと幸いです。

アカウント取得

 まずはAWSサービスを利用するために、AWSアカウントを作成します。

 アカウントを所有していない場合、以下のドキュメントを参考にAWSアカウントを作成してください。すでにアカウントを所有している場合は、この手順はスキップしてください。

リージョン選択

 今回の連載で使うための環境を構築するリージョンを選択します。AWSアカウントを取得して「AWSマネジメントコンソール」へのサインインを行ってください。

 そしてサインイン処理後、画面右上のメニューから「Asia Pacific (Tokyo)」を選択してください(※今回構築する環境は全て東京リージョンに作成する方向で進めたいと思います)。

構成図

 今回構築するAWS各種サービスの構成は以下のようなものを想定しています。AWS VPC内にシンプルにパブリックサブネットを1つ設け、その中にRedshiftクラスタとEC2インスタンスを配置。外部からのアクセスについては関連するセキュリティグループで制御を行う形としたいと思います。

 AWSの枠の範囲内における、Amazon S3以外の要素を当連載回で構築する形です。


  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • しんや(シンヤ)

    2010年末~2013年前半位までの期間で興味のある勉強会に頻繁に参加。参加してきた勉強会のレポートブログとTogetterをひたすらまとめ続け、まとめ職人(自称/他称含む)として暫く過ごしておりました。色々な縁あってDevelopers Summit 2013では『公募レポーター』も務めました。...

バックナンバー

連載:Amazon Redshiftによるビッグデータ分析環境の構築
All contents copyright © 2005-2018 Shoeisha Co., Ltd. All rights reserved. ver.1.5