ゼロからはじめるSparkアプリケーション入門 Sparkの主な拡張コンポーネントの紹介と、SparkSQLを利用した簡単な分析 ゼロからはじめるSparkアプリケーション入門(2) Apache Spark 印刷用を表示 ブックマーク ツイート 田中 裕一(日本アイ・ビー・エム株式会社)[著] 2016/05/31 14:00 目次 Page1 Sparkのテクノロジースタック SparkSQL GraphX Spark Streaming MLlib Page2 SparkSQLでのプログラミング csvファイルの読み込みとSQLでの操作 トランザクションごとの購入価格のサマリー Page3 複雑な構造のファイルとSparkSQLでのマッピング Page4 MariaDBとSparkSQLの連携 商品の購買ログの補完を行う データベースの準備 購入ログの準備 インタラクティブシェルの起動 分析処理 Page5 キャッシュと遅延評価 RDDのキャッシュ なぜキャッシュ処理が必要なのか まとめ ※この続きは、会員の方のみお読みいただけます(登録無料)。 会員登録(無料) ログインはこちら <<前へ 1 2 3 4 5 連載通知を行うには会員登録(無料)が必要です。 既に会員の方はログインを行ってください。 バックナンバー 印刷用を表示 ブックマーク ツイート あなたにオススメ 著者プロフィール 田中 裕一(日本アイ・ビー・エム株式会社)(タナカ ユウイチ) Web系・広告系企業にて、Hadoop/Spark/Kafka等Hadoopエコシステムを利用した広告システム(DMP)・行動分析基盤・レコメンド基盤の全体アーキテクチャ設計やプログラミング、最適化、行動解析を担当。Spark/Hadoopエコシステムを筆頭にOSSを組み合わせた大規模なアーキテクチ... ※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です Article copyright © 2016 Tanaka Yuichi, Shoeisha Co., Ltd. バックナンバー 連載:ゼロからはじめるSparkアプリケーション入門 Sparkの主な拡張コンポーネントの紹介と、SparkSQLを利用した簡単な分析 Sparkアプリケーションの基本と、はじめに押さえておきたい重要な概念 × ログイン Eメール パスワード ※旧SEメンバーシップ会員の方は、同じ登録情報(Eメール&パスワード)でログインいただけます。 × ブックマークを利用するにはログインが必要です 会員登録(無料) ログインはこちら All contents copyright © 2005-2021 Shoeisha Co., Ltd. All rights reserved. ver.1.5