PostgreSQL+pgvector ベクトル検索テスト(Cosine距離 + AI要約)

2026年01月04日

類似検索(ベクトル)対応:pgvector

このpgvectorの記事を書いたのが昨年の8月ですから、月日のたつのは本当にはやいですね。

AIはテキストを文字列としてではなく、ちゃんと意味として認識しています。それは意味として多次元ベクトルの数値として保存して、かつ、その多次元ベクトルの近似値判定によって、意味が近いとか、遠いとかを判断できるようになっています。

これを利用するには、PostgreSQLをDBにして、pgvectorという拡張機能を利用したうえで、例えばOpenAI APIでベクトル数値に変換したベクトル値自体をvectorとしての型フィールドに保存しておけばSQLで判断できるようになるっていう仕組みです。

例えば、人生の経験として、似たような体験をしている人を検索するとか、言っていることは違うけど意味は近いとかってことを検索できるようになるんですよ。

[1]あらかじめ過去の経験・体験のテキストからOpenAI APIでベクトル値を取得して、そのベクトル値をvector型のフィールドに保存しておく。

[2] あるテキストを同様にベクトル値を取得したうえで、登録してあるベクトル値との近似値検索を行う。

閾値をどうするかというところは、実際にある程度のデータを処理したうえでチューニングしていく必要があるが、近い意味を正しく検索できるようになれば第一段階クリアである。

あと目的によっては判定ロジック、閾値やDB構造が変わってきます。

  • 同一エピソード判定(同じ出来事か)
  • 同カテゴリ判定(似た経験のグループか)
  • 学びや感情の一致(意味として近いかどうか)

こういったことをシステム内で実現したい場合には、すべて作り込む必要はなく、似たようなデータを検索したうえで、その先のロジック判定からつくればよいので、作り込む部分を大幅に削減することができます。

最新のお知らせ

thumb
2026年2月26日
なぜDDDは「オニオン」や「クリーン」とセットで語られるのか?現場で役立つ5つの本質的教訓

1. はじめに:私たちはなぜ「DDD難民」になってしまうのか...

thumb
2026年2月26日
UNIXとC言語の誕生

1969年に、デニスリッチーはケン・トンプソンと共に、ベル研究...

No Image
2026年2月25日
2026 AI企業のこれからを予測してみよう

2026年、AI企業は「技術の凄さ」を競う段階から、「社会のイン...

thumb
2026年2月24日
DeepSeek、Moonshot AI、MiniMaxの3社が偽アカウント2.4万超を作って、Claude1600万回以上不正使用

いや、本当にえぐいニュースですよね。巨額の資金と時間を...

thumb
2026年2月24日
プログラミング・パラダイムシフト

プログラム、プログラミングという世界は10年に1度くらいでパラ...

thumb
2026年2月23日
ヨハン・セバスチャン・バッハ の世界

ヨハン・セバスチャン・バッハ の世界 SUNOでクラシカル...

thumb
2026年2月17日
【SaaS全滅】時価総額160兆円が消失したSaaSapocalypseの全貌と市場構造の激変

SaaSapocalypse サース・アポカプリス さーす・あぽかぷりす...

No Image
2026年2月13日
ダーツについて調べてまとめてみました

久しぶりに知っている営業から電話があったので、キーワードを...

thumb
2026年2月12日
AIエージェントの「USB-C」:Model Context Protocol(MCP)が変える未来

AI活用の新標準:MCP解説 1. イントロダクション:...

thumb
2026年2月11日
2026年版:ローカルコンテナの中に、自分だけのAI環境を構築したい

ローカルコンテナ(Docker)を使って自分だけのAI環境を構...