Skip to content

记忆服务器 API

端口: 48912(内部)

记忆服务器作为独立进程运行,处理所有持久化记忆操作。它不面向外部直接访问 — 主服务器代理记忆相关的请求。

内部端点

记忆服务器提供以下功能的端点:

  • 存储带有时间戳和嵌入向量的新对话轮次
  • 查询用于 LLM 提示词构建的近期上下文
  • 搜索语义相似的历史对话
  • 压缩旧对话为摘要
  • 管理记忆回顾设置

存储后端

用途
time_indexed_original完整对话历史
time_indexed_compressed压缩后的对话历史
Embedding store用于语义搜索的向量嵌入

使用的模型

任务来源
嵌入data/embedding_models/<profile>/ 下打包的 ONNX 模型(见 memory/embeddings.py::EmbeddingService
事实抽取 / 信号检测 / 反思 / promotion 合并 / 事实去重 / recall 重排tier summaryget_model_api_config('summary')
历史复核 / persona 校正tier correctionget_model_api_config('correction')
负向 target 关键词判定tier emotion

通信方式

主服务器通过 HTTP 请求和持久化同步连接线程(cross_server.py)与记忆服务器通信。

基于 MIT 许可发布。