データサイエンス系のセッション紹介
宵です。PyCon Taiwanでは学術系の方の発表が多く、さらにpython自体numpyなど数値計算系のライブラリが出てきているため、いくつかデータサイエンス系の発表もありました。ここでは軽く掲載しておきます。
Getting Python To Learn From Only Parts Of Your Data
- 発表者:Dr. Ami Tavory
- 資料:http://tw.pycon.org/2013/site_media/media/proposal_files/PythonPartsData2.odp
- 動画:http://www.youtube.com/watch?v=pFbjBzhrUpY
機械学習用ライブラリScikit-learnを使った、交差検定やブースティングの例を紹介していました。
Scientific Data Analysis Pipelines - Push, Pull, React, Or Schedule?
- 発表者:Dr. Ami Tavory
- 資料:http://tw.pycon.org/2013/site_media/media/proposal_files/PythonPartsData2.odp
- 動画:http://www.youtube.com/watch?v=neGrScpSy6w
ETL(Extract/Transform/Load)的なデータの処理に関して、pythonのgeneratorを使って対処する方法を紹介していました。
Big Data Analysis in Python
- 発表者:Jimmy Lai
- 資料:Big data analysis in python
- 動画:http://www.youtube.com/watch?v=FKgDL8GeDpM
あるWeb投稿サイトのテキストを収集して、オススメのテキストを推薦するシステムの構築について紹介していました。テキストの格納にはmongoDB,Solrを使い、オススメするかどうかの判定には、単語の出現頻度に対してSVM(サポートベクターマシーン)を使うことで対処しています。
朝食、お弁当、ティーブレイク
鈴木たかのりです。1日目のレポートで清水川さんも書いていましたが、今回は朝食、ランチのお弁当、ティーブレイクがついていて、会期中にお腹が空いたということがありませんでした。どちらかというと食べ過ぎになりそうなので、おやつを節制していたくらいです。ランチ、ティーブレイク会場はメインのカンファレンスホールの裏にあり、それほど混雑することもなく、おいしいランチにありつけました。
また、2日目のティーブレイクの時間では日本からお土産に持っていったPyCon JP Tシャツを主要なスタッフや台湾のスピーカーに渡して「Proposal出してね、今年は日本に来てね」と地道なアピール活動もしてみました。なんとかTシャツを配りきって荷物を減らすことができてほっとしました。