三服务器设计

主服务器（`main_server.py`，端口 48911）

主服务器是一个 FastAPI 应用，作为所有交互的用户侧入口。

启动流程

加载配置 —— 加载 config_manager，初始化角色数据
创建会话 —— 为每个已定义的角色创建 LLMSessionManager
挂载静态文件 —— 挂载 /static、/user_live2d、/user_vrm、/workshop
注册路由 —— 引入全部 10 个 API 路由
事件处理器 —— 初始化 Steamworks、启动 ZeroMQ 桥、预加载音频模块、检测语言
启动 Uvicorn —— 绑定 127.0.0.1:48911

处理内容

所有 REST API 端点（10 个路由）
用于实时聊天的 WebSocket 连接（/ws/{lanlan_name}）
TTS 合成（线程工作器）
音频重采样（24kHz -> 48kHz，通过 soxr）
静态文件服务（模型、CSS、JS、多语言文件）
HTML 页面渲染（Jinja2 模板）

记忆服务器（`memory_server.py`，端口 48912）

记忆服务器管理持久化的对话历史和语义召回。

存储层级

层级	用途	后端
近期记忆	每个角色最近 N 条消息	JSON 文件（`recent_*.json`）
时间索引原文	完整对话历史	SQLite 表
时间索引压缩	摘要历史	SQLite 表
语义记忆	基于嵌入向量的召回	向量存储

关键操作

存储：保存带时间戳的新对话轮次
查询：检索 LLM 提示词所需的近期上下文
搜索：跨所有历史的语义相似度搜索
压缩：定期摘要旧对话以节省上下文窗口空间
审阅：允许用户浏览和修正已存储的记忆

智能体服务器（`agent_server.py`，端口 48915）

智能体服务器处理由对话上下文触发的后台任务执行。

ZeroMQ 地址映射

套接字	地址	方向	用途
PUB/SUB	`tcp://127.0.0.1:48961`	主服务器 -> 智能体	会话事件
PUSH/PULL	`tcp://127.0.0.1:48962`	智能体 -> 主服务器	任务结果
PUSH/PULL	`tcp://127.0.0.1:48963`	主服务器 -> 智能体	分析请求

任务执行流水线

主服务器通过 ZeroMQ 发布任务
智能体服务器接收并创建任务计划（planner.py）
动作通过适配器执行：
- MCP Client —— Model Context Protocol 工具调用
- Computer Use —— 截图分析、鼠标/键盘操作
- Browser Use —— 网页浏览自动化
结果经过分析（analyzer.py）和去重（deduper.py）
最终结果通过 ZeroMQ 流式返回（task_result、proactive_message）