Memory Server API
ポート: 48912(内部)
Memory Server は別プロセスとして実行され、すべての永続メモリ操作を処理します。直接の外部アクセスを意図していません — メインサーバーがメモリ関連のリクエストをプロキシします。
内部エンドポイント
Memory Server は以下のエンドポイントを提供します:
- タイムスタンプとエンベディング付きの新しい会話ターンの保存
- LLM プロンプト構築のための最近のコンテキストのクエリ
- 意味的に類似した過去の会話の検索
- 古い会話のサマリーへの圧縮
- メモリレビュー設定の管理
ストレージバックエンド
| テーブル | 用途 |
|---|---|
time_indexed_original | 完全な会話履歴 |
time_indexed_compressed | 要約された会話履歴 |
| Embedding store | セマンティック検索用のベクトルエンベディング |
使用モデル
| タスク | デフォルトモデル |
|---|---|
| エンベディング | text-embedding-v4 |
| 要約 | qwen-plus (SUMMARY_MODEL) |
| ルーティング | qwen-plus (ROUTER_MODEL) |
| リランキング | qwen-plus (RERANKER_MODEL) |
通信
メインサーバーは HTTP リクエストと永続的な同期コネクタスレッド(cross_server.py)を介して Memory Server と通信します。
