SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

「PyData.Tokyo Tutorial & Hackathon」イベントレポート

データサイエンティストを育成する試み
~PyData.Tokyo Tutorial & Hackathon #1 イベントレポート


  • X ポスト
  • このエントリーをはてなブックマークに追加

成果発表会&全体を通して

 PyData.Tokyoオーガナイザーの山本(@kaita)です。

 成果発表会では、チュートリアルを得られた知識に加え、さらに参加者独自の改良を加え推定手法を発表するチームが多くみられました。

 タイタニックのデータベースでは、職業などの情報は含まれていないのですが、例えば「Dr」というミドルネームがある名前は医者か博士などである、ということが分かるように、ミドルネームからある程度その人の職業や身分を推定できます。同情報を他の特徴量と組み合わせて利用することによって、推定精度を向上しよう、というアプローチを提案される方がいらっしゃいました。

 他の特徴量の設計方法としては、

  • 名前から家族構成を取得する手法
  • チケットナンバーから乗船地などを取得する手法
  • チケットナンバーから船の右舷/左舷どちらに乗船しているかを取得する手法

などの提案がありました。

 どのアプローチも与えられたデータを単純にSVMやランダムフォレストなどの機械学習アルゴリズムに投入して推定するのではなく、それぞれのデータの持つ意味(今回のタスクの場合はタイタニックが沈没した際の背景)を理解し特徴量を設計した上で、それら特徴量に適合するアルゴリズムをきちんと選定する、というデータ解析における最も基本的なアプローチを躊躇している点が印象的でした。

 最後に、今回のチュートリアルやハッカソンへ参加した方の意見としては、

  • データ解析における基本的なデータ解析の作業手順を確認できたのが良かった
  • pandas, scikit-learnなど、pythonでデータ解析をする際に必要な環境についての理解が深まった
  • 日常の業務や研究における課題を本日学習した参考にして応用してみたい
  • kaggle,TRECなどのデータ分析コンペティションにチャレンジングしてみたい

などのご意見をいただきました。

 そのようなご意見からも分かる通り、今回のハッカソン開催は、PyData.Tokyoの開催目的の一つである「データサイエンティストになることを目指している方々の育成」という開催目標に対してある程度寄与できたのではないかと考えております。

 今後のPyData.Tokyoでは、引き続き勉強会やハッカソン開催などを開催していきます。こうご期待ください。

資料一覧

 発表資料、ビデオ(ライブ配信とアーカイブ)、勉強会に関するツイートなど、PyData.Tokyoのコンテンツは一部を除き、すべて公開しています。これらを参考にして、Python+Dataに興味を持つ方が増えていくことを期待しています。

  1. 資料一覧
  2. Ustreamチャンネル(ライブ配信)
  3. Youtubeチャンネル(ビデオアーカイブ)
  4. Togetterまとめ
  5. Twitter参加者リスト
  6. 写真
修正履歴

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
「PyData.Tokyo Tutorial & Hackathon」イベントレポート 連載記事一覧
この記事の著者

シバタアキラ(シバタ アキラ)

データサイエンティスト@DataRobot, Inc. PyData.Tokyoオーガナイザー 人工知能を使ったデータ分析によるビジネス価値の創出が専門分野。物理学博士。NYU研究員時代にデータサイエンティストとして加速器データの統計モデル構築を行い「神の素粒子」ヒッグスボゾン発見に貢献。その後ボストン・コンサルティング・グループでコンサルタント。白ヤギコーポレーションCEOを経て現職 Twitter: @madyagi Facebook: Akira Shibata DATAブログ: http://ashibata.com DataRobot, Incウェブサイト: http://datarobot.com

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

池内 孝啓(イケウチ タカヒロ)

神奈川県横浜市出身。1984年生まれ。ソフトウェア開発会社、インフラサービス提供会社を経て2011年3月株式会社ALBERT入社。クラウドコンピューティングを活用したマーケティングプラットフォーム事業の立ち上げに携わる。2014年1月に同社執行役員に就任。2015年8月株式会社ユーリエを設立。同社代表取締役社長兼CTO。2014年にコミュニティ PyData.Tokyo を共同で立ち上げるなど、Python と PyData ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

田中 秀樹(タナカ ヒデキ)

PyData TokyoオーガナイザーシリコンバレーでPython×データ解析の魅力に出会う。帰国後、ディープラーニングに興味を持ち、PyCon JP 2014に登壇したことがきっかけとなりPyData Tokyoをスタート。カメラレンズの光学設計エンジニアをする傍ら、画像認識を用いた火星および太陽系惑星表面の構造物探索を行うMarsface Project(@marsfaceproject)に参加。インドやモロッコなど、旅先で...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

山本 光穂(ヤマモト ミツオ)

デンソーアイティーラボラトリ シニアエンジニア。2006年デンソーアイティーラボラトリ入社以来、時空間情報閲覧サービス(製品名:今昔散歩)や情報検索等に関する研究に従事。特に最近はドライバーの意図推定技術や同推定結果に基づく最適な情報提示技術に興味を持つ。趣味はマウンテンバイクとイングレス(Resistance)。Facebook: https://www.facebook.com/mitsuo.yamamoto.0112 Twitter: @kaita

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/8636 2015/04/21 14:51

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング