米Googleは、BigQuery MLに教師なし機械学習を活用して、ラベル付きデータを使用することなく異常を検出できるようにする新たな異常検出機能のプレビュー提供を、7月2日(現地時間)に開始した。
新たな異常検出機能を使用することで、トレーニングデータが時系列であるかどうかに応じて、オートエンコーダモデル(パブリックプレビュー)、K-meansモデル(一般提供中)、ARIMA_PLUS時系列モデル(一般提供中)のいずれかのモデルを使用して、ML.DETECT_ANOMALIES関数によるトレーニングデータまたは新たな入力データの異常を検出可能になる。
K-meansモデルでML.DETECT_ANOMALIESを使用する場合、各入力データポイントのもっとも近いクラスタまでの正規化された距離の値に基づいて異常が識別され、その距離がユーザーによって提供された汚染値によって決定されたしきい値を超える場合、データポイントは異常として識別される。
オートエンコーダモデルでML.DETECT_ANOMALIESを使用する場合、各データポイントの再構成エラーに基づいて異常が識別され、エラーが汚染値によって決定されたしきい値を超えると、異常として識別される。
ARIMA_PLUS時系列モデルでML.DETECT_ANOMALIESを使用する場合、タイムスタンプの信頼区間に基づいて異常が識別され、タイムスタンプのデータポイントが予測区間外で発生する確率が、ユーザーによって提供された確率しきい値を超える場合に、データポイントは異常として識別される。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です