记忆服务器 API
端口: 48912(内部)
记忆服务器作为独立进程运行,处理所有持久化记忆操作。它不面向外部直接访问 — 主服务器代理记忆相关的请求。
内部端点
记忆服务器提供以下功能的端点:
- 存储带有时间戳和嵌入向量的新对话轮次
- 查询用于 LLM 提示词构建的近期上下文
- 搜索语义相似的历史对话
- 压缩旧对话为摘要
- 管理记忆回顾设置
存储后端
| 表 | 用途 |
|---|---|
time_indexed_original | 完整对话历史 |
time_indexed_compressed | 压缩后的对话历史 |
| Embedding store | 用于语义搜索的向量嵌入 |
使用的模型
| 任务 | 默认模型 |
|---|---|
| 嵌入 | text-embedding-v4 |
| 摘要 | qwen-plus (SUMMARY_MODEL) |
| 路由 | qwen-plus (ROUTER_MODEL) |
| 重排序 | qwen-plus (RERANKER_MODEL) |
通信方式
主服务器通过 HTTP 请求和持久化同步连接线程(cross_server.py)与记忆服务器通信。
