SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

「PyData.Tokyo Meetup」イベントレポート

どこまで速くできる? 達人に学ぶPython超高速データ分析~PyData.Tokyo Meetup #4イベントレポート


  • X ポスト
  • このエントリーをはてなブックマークに追加

PyData.Tokyo運営だより

 PyData.Tokyoオーガナイザーの池内(@iktakahiro)です。Meetup #4も大変盛況で、100名を超える参加登録をいただきました。ご参加いただいた皆様、ご応募いただいた皆様、誠にありがとうございました。

 今回も気になるPyDataのトピックをお知らせ致します。

世界のPyData

 4月に入り、初々しい新入社員の姿を見かける季節となりました。フランス・パリでは、4月3日にPyData Paris 2015が開催されました。@atelierhideが作成したTogetter : PyData Paris 2015で開催の様子をうかがい知ることができます。

 PyData Paris 2015では、PyData.Tokyo #4のテーマ「高速化」と関係するNumbaやPythranの他、やはりscikit-learnを扱うセッションが目立ちました。登壇者のスライドはSlideshareにアップロードされています。

 注目のスライドをいくつかピックアップしてご紹介します。

Numba, a JIT compiler for fast numerical code

 Numbaの解説です。イジングモデルの計算を行ったパフォーマンステストでは、CPythonに比べて130倍の性能が発揮されています。今回の佐藤さんの発表スライドと併せて読むとNumbaの理解が深まります。

 スライド8ページの簡単なサンプルコードの実行結果を記載します。

import numba

@numba.jit
    def f(x):
    res = 0
    for i in range(x):
        res += 1
    return res

 Numbaは、通常のPythonコードで書かれた関数に@numba.jitを付与するだけで高速化を図れます。

 関数f()の実行結果は下記のとおりです。

@numba.jit x の値 timeitでの計測結果
使用あり 10 150 ns
使用あり 100000 157 ns
使用なし 10 653 ns
使用なし 100000 3.85 ms

introduction to Pandas

 Pandasを取り扱ったセッションですが、かなり詳細にPandasの機能とビジュアライゼーションについて解説しています。スライドよりも、公開されているIPython Notebook - Introduction to Pandasを参照するのがよいでしょう。ビジュアライゼーションツールは、Seabornを利用しています。

 Seabornはリッチな見栄えのグラフを提供するパッケージで、SeabornのGalleryページでさまざまなグラフを確認することができます。

 IPython Notebookで描画した画像を掲載します。

scikit-learn for easy machine learning

 機械学習ライブラリscikit-learnの解説です。INRIAの研究者でありscikit-learnのコントリビューターでもあるGael VaroquauxさんのKeynoteで、非常にお薦めのスライドです。パッケージの紹介だけではなく、機械学習の歴史や機械学習にはどのような種類があるかを予備知識として解説しています。

 Random Forestの実行速度を比較した場合、scikit-learnはRやWekaOrange(Python製のデータマイニングツール)よりも実行速度が速いことが示されています。scikit-learnは複数のコントリビューターが速度改善を試みており、0.13、0.14、0.15とバージョンを経るごとにパフォーマンスが改善しています。

ステッカー完成

 PyData.Tokyoのステッカーが完成しました。ミートアップ会場での配布の他、オーガナイザーが参加するエンジニア系イベントでも入手のチャンスがあります。姿を見かけたら「ステッカーください!」とお気軽に声をかけてみてください。

次回ミートアップのお知らせ

 ミートアップ #5を5月22日(金)に開催予定です。テーマは「自然言語処理」。既に100名を超える参加希望をいただいております。

資料一覧

 発表資料、ビデオ(ライブ配信とアーカイブ)、勉強会に関するツイートなど、PyData.Tokyoのコンテンツは一部を除き、すべて公開しています。これらを参考にして、Python+Dataに興味を持つ方が増えていくことを期待しています。

  1. 資料一覧
  2. Ustreamチャンネル(ライブ配信)
  3. Youtubeチャンネル(ビデオアーカイブ)
  4. Togetterまとめ
  5. Twitter参加者リスト
  6. 写真

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
「PyData.Tokyo Meetup」イベントレポート連載記事一覧

もっと読む

この記事の著者

シバタアキラ(シバタ アキラ)

データサイエンティスト@DataRobot, Inc. PyData.Tokyoオーガナイザー 人工知能を使ったデータ分析によるビジネス価値の創出が専門分野。物理学博士。NYU研究員時代にデータサイエンティストとして加速器データの統計モデル構築を行い「神の素粒子」ヒッグスボゾン発見に貢献。その後ボストン・コンサルティング・グループでコンサルタント。白ヤギコーポレーションCEOを経て現職 Twitter: @madyagi Facebook: Akira Shibata DATAブログ: http://ashibata.com DataRobot, Incウェブサイト: http://datarobot.com

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

池内 孝啓(イケウチ タカヒロ)

神奈川県横浜市出身。1984年生まれ。ソフトウェア開発会社、インフラサービス提供会社を経て2011年3月株式会社ALBERT入社。クラウドコンピューティングを活用したマーケティングプラットフォーム事業の立ち上げに携わる。2014年1月に同社執行役員に就任。2015年8月株式会社ユーリエを設立。同社代表取締役社長兼CTO。2014年にコミュニティ PyData.Tokyo を共同で立ち上げるなど、Python と PyData ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

田中 秀樹(タナカ ヒデキ)

PyData TokyoオーガナイザーシリコンバレーでPython×データ解析の魅力に出会う。帰国後、ディープラーニングに興味を持ち、PyCon JP 2014に登壇したことがきっかけとなりPyData Tokyoをスタート。カメラレンズの光学設計エンジニアをする傍ら、画像認識を用いた火星および太陽系惑星表面の構造物探索を行うMarsface Project(@marsfaceproject)に参加。インドやモロッコなど、旅先で...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山本 光穂(ヤマモト ミツオ)

デンソーアイティーラボラトリ シニアエンジニア。2006年デンソーアイティーラボラトリ入社以来、時空間情報閲覧サービス(製品名:今昔散歩)や情報検索等に関する研究に従事。特に最近はドライバーの意図推定技術や同推定結果に基づく最適な情報提示技術に興味を持つ。趣味はマウンテンバイクとイングレス(Resistance)。Facebook: https://www.facebook.com/mitsuo.yamamoto.0112 Twitter: @kaita

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/8687 2015/05/08 18:30

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング