记忆服务器 API
端口: 48912(内部)
记忆服务器作为独立进程运行,处理所有持久化记忆操作。它不面向外部直接访问 — 主服务器代理记忆相关的请求。
内部端点
记忆服务器提供以下功能的端点:
- 存储带有时间戳和嵌入向量的新对话轮次
- 查询用于 LLM 提示词构建的近期上下文
- 搜索语义相似的历史对话
- 压缩旧对话为摘要
- 管理记忆回顾设置
存储后端
| 表 | 用途 |
|---|---|
time_indexed_original | 完整对话历史 |
time_indexed_compressed | 压缩后的对话历史 |
| Embedding store | 用于语义搜索的向量嵌入 |
使用的模型
| 任务 | 来源 |
|---|---|
| 嵌入 | data/embedding_models/<profile>/ 下打包的 ONNX 模型(见 memory/embeddings.py::EmbeddingService) |
| 事实抽取 / 信号检测 / 反思 / promotion 合并 / 事实去重 / recall 重排 | tier summary(get_model_api_config('summary')) |
| 历史复核 / persona 校正 | tier correction(get_model_api_config('correction')) |
| 负向 target 关键词判定 | tier emotion |
通信方式
主服务器通过 HTTP 请求和持久化同步连接线程(cross_server.py)与记忆服务器通信。
