Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

著者情報

  • 田中 裕一(日本アイ・ビー・エム株式会社)(タナカ ユウイチ)

    Web系・広告系企業にて、Hadoop/Spark/Kafka等Hadoopエコシステムを利用した広告システム(DMP)・行動分析基盤・レコメンド基盤の全体アーキテクチャ設計やプログラミング、最適化、行動解析を担当。Spark/Hadoopエコシステムを筆頭にOSSを組み合わせた大規模なアーキテクチャの設計に従事。2016年にSpark/Hadoopを多様な業種に広げるため、活動の場をIBMに移す。

執筆記事

  • 2016/05/31

    Sparkの主な拡張コンポーネントの紹介と、SparkSQLを利用した簡単な分析

     前回は、Sparkの入門ということでローカルPCにSparkの開発環境を構築し、インタラクティブシェルを使ってScala、PythonでのSparkのコアコンポーネントを使ったプログラミングを行いました。また、サンプルを用いてRDD、DAGや遅延実行といったSparkの概念についても簡単に紹介致しました。今回は、Sparkをより便利に使い込むためにSparkコアを拡張した各コンポーネントを使ったプログラミングを行っていきます。各コンポーネントの概要を見た後、それぞれのプログラミングを行っていき...

  • 2016/05/02

    Sparkアプリケーションの基本と、はじめに押さえておきたい重要な概念

     本連載は、Apache Sparkによるプログラミングやデータ処理のやり方を、ScalaやPythonのエンジニアに向けて解説する入門記事です。第1回では、ローカル環境の構築方法やインタラクティブシェルの使い方、「RDD」「DAG」「遅延実行」といった重要な概念を紹介します。

2件中1~2件を表示
戻る


All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5