Skip to content

记忆服务器 API

端口: 48912(内部)

记忆服务器作为独立进程运行,处理所有持久化记忆操作。它不面向外部直接访问 — 主服务器代理记忆相关的请求。

内部端点

记忆服务器提供以下功能的端点:

  • 存储带有时间戳和嵌入向量的新对话轮次
  • 查询用于 LLM 提示词构建的近期上下文
  • 搜索语义相似的历史对话
  • 压缩旧对话为摘要
  • 管理记忆回顾设置

存储后端

用途
time_indexed_original完整对话历史
time_indexed_compressed压缩后的对话历史
Embedding store用于语义搜索的向量嵌入

使用的模型

任务默认模型
嵌入text-embedding-v4
摘要qwen-plus (SUMMARY_MODEL)
路由qwen-plus (ROUTER_MODEL)
重排序qwen-plus (RERANKER_MODEL)

通信方式

主服务器通过 HTTP 请求和持久化同步连接线程(cross_server.py)与记忆服务器通信。

基于 MIT 许可发布。