Skip to content

Memory Server API

ポート: 48912(内部)

Memory Server は別プロセスとして実行され、すべての永続メモリ操作を処理します。直接の外部アクセスを意図していません — メインサーバーがメモリ関連のリクエストをプロキシします。

内部エンドポイント

Memory Server は以下のエンドポイントを提供します:

  • タイムスタンプとエンベディング付きの新しい会話ターンの保存
  • LLM プロンプト構築のための最近のコンテキストのクエリ
  • 意味的に類似した過去の会話の検索
  • 古い会話のサマリーへの圧縮
  • メモリレビュー設定の管理

ストレージバックエンド

テーブル用途
time_indexed_original完全な会話履歴
time_indexed_compressed要約された会話履歴
Embedding storeセマンティック検索用のベクトルエンベディング

使用モデル

タスクデフォルトモデル
エンベディングtext-embedding-v4
要約qwen-plus (SUMMARY_MODEL)
ルーティングqwen-plus (ROUTER_MODEL)
リランキングqwen-plus (RERANKER_MODEL)

通信

メインサーバーは HTTP リクエストと永続的な同期コネクタスレッド(cross_server.py)を介して Memory Server と通信します。

MIT ライセンスの下で公開。