米国在住で、Amazon Web Servicesに勤務する開発者であるJonathan Katz氏は、リレーショナル・データベース管理システム「PostgreSQL」にベクター・データベースの機能を追加する拡張機能「pgvector」の新版となる「pgvector 0.5.0」を8月28日(現地時間)に公開した。pgvectorはPostgreSQLライセンスで公開しているオープンソース・ソフトウェア。
新版では、多次元のベクター・データを対象とした新種のインデックス「Hierarchical Navigable Small Worlds(HNSW)」を追加した。HNSWとは、ベクター・データをノードとして表現し、ほかのベクター・データとの間を線でつないだ2次元のグラフを複数層作成し、指定したノードの最近傍となるノードを探すアルゴリズム。今回の新版に加わったインデックスはHNSWアルゴリズムを活用したインデックスとなる。
ベクター・データのインデックスには、インデックス作成前にまとまった量のベクター・データを与えなければならないものもあるが、HNSWインデックスはテーブルを作成したばかりで、データが入っていない状態でも設定できる。そしてHNSWアルゴリズムを実装したインデックスの中には、インデックスにあるベクター・データを更新、削除できないものもあるが、今回の新版が実装したインデックスはデータの更新、削除も可能になっているという。
そして、以前から実装している近似最近傍探索(ANN:Approximate Nearest Neighbor)アルゴリズムを利用したivfflatインデックスにも改良が加わった。このインデックスを構築する処理の一部を並列化し、処理にかかる時間を短縮した。新版では、このほかにも機能改良が加わっている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です