フリーのビッグデータ分析学習環境を使って、Apache Sparkによるバスケット分析を行ってみる
「Cloudera Quick Start VM」を活用したビッグデータ分析の学習環境構築 第3回
前回の記事では、Impalaを使って、構造化データ(RDBMSからインポートしたデータ)の分析と、Hiveを使用して非構造化データ(アクセスログ)の分析を行いました。今回は、Apache Sparkを使って簡単なバスケット分析を行ってみましょう。
この記事は参考になりましたか?
- 「Cloudera Quick Start VM」を活用したビッグデータ分析の学習環境構築連載記事一覧
-
- フリーのビッグデータ分析学習環境を使って、全文検索アプリケーションを構築してみる
- フリーのビッグデータ分析学習環境を使って、Apache Sparkによるバスケット分析を行...
- フリーのビッグデータ分析学習環境を使って、構造化データと非構造化データの分析を試してみる
- この記事の著者
-
嶋内 翔(Cloudera株式会社)(シマウチ ショウ)
2011年、Clouderaの最初の日本人社員として入社。サポートエンジニアとして3年務めた後、セールスエンジニアとして働いている。監訳書に「Apache Sqoop クックブック」。ライフワークで技術系ポッドキャスティング garsue.fm のファシリテーターを務めている。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です