Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

ビズリーチ、276万件の求人情報に基づくHR領域の「単語ベクトル」公開

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2018/03/13 18:48

 ビズリーチは、ビズリーチAI室で利用しているHR領域に適した「単語ベクトル」を3月13日に公開し、データセットを提供した。

 今回公開したのは、2018年1月に求人検索エンジン「スタンバイ」に掲載されていた約276万件の求人情報(のべ約10億単語)から獲得した、「単語ベクトル」と呼ばれる言語研究用データ。

 求人情報に含まれる単語について、周辺の単語群との傾向を機械学習を用いて学習し、その特徴をword2vecによって数値化(ベクトル化)したもので、単語の特徴が数値化されることで自然言語処理の精度が向上し、さまざまな目的に利用可能となる。

 なお、単語ベクトルのデータセットは、100次元、200次元の2種類を用意している。


【関連リンク】
ビズリーチ
単語ベクトルデータセット(GitHub)

  • LINEで送る
  • このエントリーをはてなブックマークに追加
All contents copyright © 2005-2018 Shoeisha Co., Ltd. All rights reserved. ver.1.5