ニュース

新規
会員登録

翔泳社新刊紹介（AD）

視覚的にイメージしにくいアルゴリズムを徹底的にイラストで表現するとこうなる

渡部拓也[著]

2017/06/13 07:00

ポスト

k-means法――クラスタリング

　最後に紹介するのは、クラスタリングのアルゴリズム「k-means法」です。

　クラスタリングとは、多数のデータを似たもの同士のグループに分類する操作のことで、それぞれのグループをクラスターと呼びます。データ間の距離を定義できれば、距離の遠近でそれぞれのデータがどれくらい似ているかを判断でき、クラスタリングすることができます。

　k-means法は基本的・代表的なもので、クラスターが事前に与える数（k個）になるようにクラスタリングするアルゴリズムです。

リスト4-1

　まず、クラスタリングを行いたいデータを用意しましょう。次に、クラスター数を決めます。今回は3とします。このイラストでは、データを点で表し、データ間の距離は2点間の直線距離を用います。

リスト4-2

　クラスターの中心点として、3点をランダムに設置します。

リスト4-3

　各データについて、3つの中心点のうち最も近い点を計算します。

リスト4-4

　各データを決定したクラスターに分類します。これで三つのクラスターができました。

リスト4-5

　各クラスターに属するデータの重心を計算し、クラスターの中心点をそこに移動させます。

リスト4-6

　最も近いクラスターの中心点を再計算し、各データをクラスターに再分類しました。

リスト4-7

　各データのクラスターへの分類と、中心点の重心への移動を中心点が収束するまで（動かなくなるまで）繰り返します。

リスト4-8

　これは3回目の繰り返しが終わったあとの状態です。

リスト4-9

　4回目の繰り返しが終わったところです。これ以上やっても中心点は移動しないので、クラスタリング完了です。

　k-measn法では操作を繰り返すと中心点が必ずどこかに収束することが証明されています。設定するクラスター数が適切でないと、有意な結果が得られないこともあるので気をつけましょう。

ビジュアライズされたアルゴリズム

　紹介した三つのアルゴリズムを既に知っていた方、あるいは全然知らなかった方も、このように仕組みをイラストでしっかり表現すれば、一気に視覚的にイメージしやすくなったのではないでしょうか。

『アルゴリズム図鑑』にはほかのアルゴリズムも掲載していますので、気になる方はチェックしてみてください。

購入者限定の特典はこちら

アルゴリズム図鑑絵で見てわかる26のアルゴリズム

Amazon　SEshop　その他

アルゴリズム図鑑絵で見てわかる26のアルゴリズム

著者：石田保輝、宮崎修一
発売日：2017年6月5日（月）
価格：2,570円（税込）

本書のポイント

・基本的な26のアルゴリズムすべてイラストで解説
・誌面がフルカラーなので、図の動きがわかりやすい
・各アルゴリズムの考え方や計算効率、問題点もフォロー
・50万人が学んだ大人気アプリを書籍化

この記事は参考になりましたか？

印刷用を表示

ポスト

翔泳社新刊紹介連載記事一覧: 自分専用の便利なカスタムGPTの作り方がわかる！『ChatGPT2年生 GPTsのしくみ...

『エンジニアリングマネージャーお悩み相談室』発売　疲れ果てたEMの課題を解決【書籍プレゼン...

20年超えのロングセラーが最新版に『ITエンジニアのための【業務知識】がわかる本第6版...

もっと読む

この記事の著者: 渡部拓也（ワタナベタクヤ）

　翔泳社マーケティング課。MarkeZine、CodeZine、EnterpriseZine、Biz/Zine、ほかにて翔泳社の本の紹介記事や著者インタビュー、たまにそれ以外も執筆しています。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

【AD】本記事の内容は記事掲載開始時点のものです　企画・制作　株式会社翔泳社

この記事は参考になりましたか？

この記事をシェア

ポスト

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

アクセスランキング

アクセスランキング