yangyl/codex-agent-manager

Fork 0

Files

Yoilun f66a097dc3 docs: add implementation plan

2026-05-25 15:39:51 +08:00

14 KiB

Raw Blame History

Codex 智能体管理台设计规格

日期：2026-05-25 状态：已批准，进入实施计划阶段目标目录：/Users/yoilun/Code/codex-agent-manager

1. 产品定位

Codex 智能体管理台是一个本机 localhost 工具，用来管理本机 Codex 智能体配置、查看不同项目里的智能体运行情况，并观察动态工作流的阶段、交接、审查循环和主智能体监管状态。

它不是固定流程播放器，也不是通用系统监控面板。它应像一个温和、清晰的本地工作台：能让用户放心查看、修改和追踪 Codex 智能体相关信息，同时对数据来源和置信度保持诚实。

2. 目标用户与核心问题

主要用户是本机 Codex 使用者，尤其是会使用多个角色智能体和多阶段工作流的用户。

需要解决的问题：

管理 .codex/agents/*.toml 中的智能体名称、描述和角色设定。
按项目查看哪些智能体最近运行过、可能正在运行、已结束或状态未知。
查看一次任务中主智能体如何派发子智能体，以及子智能体之间是否发生了代码实现、审查、修复循环。
判断主智能体是否仍在监管当前工作流。
在修改智能体配置时有 TOML 校验、差异预览、备份和确认写回，避免静默破坏 Codex 配置。

3. 范围

3.1 MVP 必做

独立项目：/Users/yoilun/Code/codex-agent-manager。
本机 Web 工具，通过 localhost 访问。
全中文界面，技术缩写如 PID、TOML、SQLite 保留英文。
读取 .codex/agents/*.toml，展示智能体文件、名称、描述、角色设定摘要和修改时间。
读取 .codex/config.toml 中的项目配置，展示项目路径、信任等级和目录存在性。
读取 .codex/state_5.sqlite 和 .codex/goals_1.sqlite 的只读状态，展示线程、子智能体关系、目标状态和更新时间。
使用本机进程表辅助判断 Codex 是否仍在运行。
解析项目内工作流文件：task_plan.md、progress.md、findings.md、docs/project.md。如果存在，显示阶段、审查循环、测试结果和门禁证据。
将运行状态显示为 运行中、最近活跃、空闲、未知、冲突，并显示数据来源和置信度。
将工作流显示为动态事件流和有向关系图，不写死固定流程。
支持智能体配置草稿编辑、TOML 校验、diff 预览、自动备份、用户确认后写回 .codex/agents/*.toml。
写回前显示目标文件路径、备份路径、变更数量和校验状态。

3.2 明确不做

不启动、停止或杀死 Codex 智能体。
不修改 Codex SQLite 数据库。
不读取或展示 .codex/auth.json。
不做云端同步、多用户权限或远程管理。
不把推断状态伪装成确定事实。
不将工作流固定为某个模板，例如“代码员 -> 审查员”。

4. 信息架构

主导航使用五个标签页：

项目视图：按项目查看智能体执行情况、最近活动、置信度和来源。
工作流视图：查看当前项目的阶段进度、智能体交接、审查/修复循环和主智能体监管状态。
智能体视图：集中查看和编辑智能体名称、描述、角色设定。
草稿：查看未写回草稿、TOML 校验结果、diff、备份记录和写回状态。
设置：配置 Codex 路径、状态数据源、备份目录和扫描规则。

全局搜索应支持项目名、路径、智能体名、描述关键词、线程 ID、PID 和阶段关键词。

5. 页面设计

5.1 项目视图

布局为三栏：

左侧：项目列表。显示项目名、路径短名、运行中智能体数量、最近活动时间、是否有草稿或状态不确定。
中间：项目内智能体状态矩阵。每行一个智能体，显示智能体名称、当前状态、目标状态、本机进程、来源、置信度、最近活动时间和快捷操作。
右侧：详情面板。显示选中智能体的角色摘要、运行证据、置信度解释、最近备份、草稿状态和进入编辑入口。

5.2 工作流视图

工作流视图必须基于动态数据渲染，而不是写死阶段。

核心组件：

阶段时间线：当项目内存在标准计划文件时，显示阶段名称、状态、验收标准和门禁结果。
智能体交接流：显示谁派发给谁、发生时间、角色、当前状态和来源。
交接图：基于 thread_spawn_edges 绘制主线程和子线程关系。
审查/修复循环：当从 progress.md 或事件顺序中识别到审查返回时，显示当前第几轮、最多几轮、问题摘要和复测结果。
监管面板：显示主智能体是否仍活跃、最近计划更新时间、当前门禁和证据文件状态。

如果没有标准计划文件，工作流视图仍显示通用事件流，例如：

主线程派生了哪些子智能体。
哪些子智能体仍打开。
哪些子智能体已关闭。
哪些关系和阶段属于推断，并标注置信度。

5.3 智能体视图

布局为双栏：

左侧：智能体列表，支持搜索、排序、按角色过滤，显示是否有草稿、是否被多个项目最近使用。
右侧：编辑工作区。

编辑工作区上方显示结构化表单：

名称
描述
角色设定
附加说明或范围备注

下方使用子标签：

预览：人类可读的智能体信息。
TOML：结构化 TOML 视图。
差异：草稿与当前文件的差异。
备份：历史备份、备份路径和恢复入口。

5.4 草稿

草稿页显示所有未写回变更：

智能体文件路径。
变更字段。
TOML 校验状态。
最近备份状态。
写回步骤：草稿 -> 已校验 -> 已备份 -> 已写回。
可批量放弃草稿，但批量写回应默认禁用，避免误操作。

5.5 设置

设置页包含：

Codex home 路径，默认 /Users/yoilun/.codex。
是否启用 SQLite 状态读取。
是否启用本机进程辅助判断。
备份目录策略，默认备份到原 TOML 文件旁边或项目定义的备份目录。
状态刷新间隔。
敏感文件黑名单，至少包含 auth.json。

6. 数据模型

6.1 AgentDefinition

id：由文件名或路径生成的稳定 ID。
filePath
name
description
developerInstructions
extraFields
modifiedAt
parseStatus
draftStatus

6.2 ProjectInfo

path
displayName
trustLevel
exists
lastActivityAt
activeAgentCount
hasDrafts
hasUncertainStatus

6.3 RuntimeThread

threadId
cwd
title
agentNickname
agentRole
agentPath
createdAt
updatedAt
archived
source

6.4 WorkflowEdge

parentThreadId
childThreadId
status
parentAgent
childAgent
inferredMeaning
confidence

6.5 WorkflowEvent

id
timestamp
projectPath
type
actor
target
summary
source
confidence

事件类型示例：

主智能体派发
子智能体启动
子智能体完成
阶段开始
阶段完成
审查开始
审查失败
修复请求
复测通过
用户门禁
状态冲突

6.6 StatusEvidence

status：running、recent、idle、unknown、conflict
labelZh：中文显示文本
confidence：high、medium、low
sources：sqlite_threads、sqlite_goals、process_table、plan_files、inferred
explanation
updatedAt

7. 状态与工作流推断规则

状态判断采用综合来源：

SQLite 线程仍显示近期更新，且存在相关 Codex 进程：运行中，高置信度。
SQLite 线程近期更新，但没有匹配进程：最近活跃，中置信度。
项目有历史线程但超过阈值未更新：空闲，中或高置信度。
缺少足够数据源：未知，低置信度。
SQLite、目标状态和进程表互相矛盾：冲突，显示冲突原因。

工作流推断规则：

thread_spawn_edges 是派发关系的主要结构化来源。
threads.agent_role、threads.agent_nickname、threads.cwd 用于识别角色和项目。
thread_goals.status 用于判断目标是否仍 active、blocked 或 complete。
标准计划文件用于更准确地识别阶段、门禁和审查循环。
没有计划文件时，只显示通用事件流和派生关系，不强行命名阶段。
所有非结构化推断都必须显示置信度。

8. 安全写回流程

写回仅允许目标文件位于 .codex/agents/*.toml。

流程：

用户在智能体视图中修改草稿。
后端解析并校验 TOML。
生成字段级 diff。
用户点击创建备份。
后端创建时间戳备份，例如 agent.toml.bak.20260525-153000。
用户确认写回。
后端使用原子写入策略更新 TOML。
UI 显示写回结果和备份路径。

失败处理：

TOML 无效时禁止写回。
备份失败时禁止写回。
写回失败时保留原文件和草稿。
不覆盖用户在校验后又改动过的文件；写回前比较 mtime 或文件哈希。

9. 架构

建议使用单体本机 Web 工具：

后端：Go。用于处理只读 SQLite、TOML 解析、路径安全、本机进程读取、备份和原子写回。
前端：Vue 3 + Vite，保持轻量，并匹配用户本机已有 Vue/Vite 项目经验。
通信：localhost HTTP API。
存储：不新建复杂数据库。草稿可先保存在项目工作目录下的本地 JSON 文件，或内存加文件备份。

后端模块建议：

codexhome：路径和安全边界。
agents：读取、解析、校验、diff、备份、写回 agent TOML。
projects：读取 .codex/config.toml 项目信任配置。
runtime：只读 SQLite 和进程状态。
workflow：聚合线程、目标、计划文件和推断事件。
server：HTTP API。

前端模块建议：

ProjectView
WorkflowView
AgentView
DraftsView
SettingsView
StatusBadge
ConfidenceBadge
HandoffTimeline
WorkflowGraph
DiffViewer
WritebackSteps

10. API 草案

GET /api/health
GET /api/agents
GET /api/agents/:id
POST /api/agents/:id/draft
POST /api/agents/:id/validate
GET /api/agents/:id/diff
POST /api/agents/:id/backup
POST /api/agents/:id/write
GET /api/projects
GET /api/projects/:projectId/runtime
GET /api/projects/:projectId/workflow
GET /api/workflows/:threadId
GET /api/settings
PUT /api/settings

所有写接口必须限制在允许路径内，并返回明确的错误码和中文错误信息。

11. 视觉方向

采用“温和的本地工作台 + 编辑器质感”：

背景使用温暖浅灰或淡墨色。
操作主色使用深青、墨绿或靛蓝。
草稿和警告使用琥珀色。
成功和运行中使用低饱和绿色。
状态数据可使用紧凑等宽字体，但整页不要全等宽。
控件圆角控制在 6-8px。
避免大面积黑底、荧光绿、硬表格边框和系统监控大屏风格。

12. 阶段计划与审查门禁

代码阶段必须参考 /Users/yoilun/Code/goal-subagents-workflow-prompt.md。

每个阶段都要创建新的 coding agent 和 testing/code review agent。testing/code review agent 只审查和测试，不直接修改代码。每阶段最多 3 轮修复循环。阶段通过后更新 task_plan.md、findings.md、progress.md 和必要的 docs/project.md，并关闭本阶段子智能体。

阶段 0：项目初始化与风险边界

目标：

创建项目结构和文件化计划。
确认 .codex 可读/可写边界。
明确禁止读取和禁止写入范围。

审查门禁：

不得读取 auth.json。
不得修改 .codex 文件。
必须列出数据源、风险和安全边界。

阶段 1：只读数据层

目标：

读取 agents TOML、config projects、SQLite threads、spawn edges、goals。
提供只读 API。

审查门禁：

SQLite 必须只读打开。
TOML 解析失败不能导致服务崩溃。
路径访问必须限制在允许目录。

阶段 2：运行状态与动态工作流模型

目标：

实现综合运行状态判断。
实现 workflow event 和 handoff graph 聚合。
支持计划文件存在和不存在两种情况。

审查门禁：

不允许写死固定流程。
推断状态必须带来源和置信度。
数据不足时必须显示未知，而不是编造状态。

阶段 3：中文 UI 只读工作台

目标：

实现项目视图、工作流视图、智能体视图的只读版本。
使用中文界面和温和工作台视觉风格。

审查门禁：

页面在空数据、坏 TOML、无项目、无计划文件时可用。
状态和置信度解释清晰。
不出现未实现的危险操作入口。

阶段 4：草稿、校验和差异预览

目标：

实现 agent 配置草稿编辑。
实现 TOML 校验、字段级 diff 和草稿列表。

审查门禁：

无效 TOML 必须阻止写回。
diff 必须明确显示目标文件和变更字段。
草稿不能覆盖原文件。

阶段 5：备份与确认写回

目标：

实现备份创建和确认写回。
使用原子写入和 mtime/hash 防并发覆盖。

审查门禁：

备份失败不得写回。
写回目标必须限制在 .codex/agents/*.toml。
写回失败必须保留原文件和草稿。

阶段 6：集成验证与文档

目标：

完成端到端验证、运行说明和恢复说明。
验证代码阶段工作流本身也能在工作流视图中展示。

审查门禁：

构建和测试通过。
文档说明运行方式、数据来源、安全边界、备份恢复。
最终审查确认没有静默修改 .codex 配置或 SQLite。

13. 验收标准

能启动本机管理台并访问中文 UI。
能列出本机 Codex 智能体和项目。
能按项目查看智能体运行状态、来源和置信度。
能看到动态工作流交接和阶段进度；流程变化时仍能显示事件流。
能编辑智能体草稿、校验 TOML、预览 diff、创建备份并确认写回。
所有危险操作都有明确确认和恢复路径。
每个实现阶段都有审查记录和测试证据。

14. 未决问题

工作流图初版使用列表/时间线还是引入图布局库，需要在 UI 实现阶段决定。
草稿持久化位置需要在阶段 0 定义，建议放在项目目录内，不放入 .codex。

14 KiB Raw Blame History Unescape Escape

Codex 智能体管理台设计规格

1. 产品定位

2. 目标用户与核心问题

3. 范围

3.1 MVP 必做

3.2 明确不做

4. 信息架构

5. 页面设计

5.1 项目视图

5.2 工作流视图

5.3 智能体视图

5.4 草稿

5.5 设置

6. 数据模型

6.1 AgentDefinition

6.2 ProjectInfo

6.3 RuntimeThread

6.4 WorkflowEdge

6.5 WorkflowEvent

6.6 StatusEvidence

7. 状态与工作流推断规则

8. 安全写回流程

9. 架构

10. API 草案

11. 视觉方向

12. 阶段计划与审查门禁

阶段 0：项目初始化与风险边界

阶段 1：只读数据层

阶段 2：运行状态与动态工作流模型

阶段 3：中文 UI 只读工作台

阶段 4：草稿、校验和差异预览

阶段 5：备份与确认写回

阶段 6：集成验证与文档

13. 验收标准

14. 未决问题

14 KiB

Raw Blame History