Fischer Agent Kit - AI Agent Development Framework
Go to file
Fischer 454a50b5a8
Deploy to Production / deploy (push) Failing after 7s Details
Test / backend-test (push) Has been cancelled Details
Test / frontend-unit (push) Has been cancelled Details
Test / api-e2e (push) Has been cancelled Details
Test / frontend-e2e (push) Has been cancelled Details
feat: Bitable P0 UX Polish + Agent Parity (#23)
Merged via LFG pipeline after final ce-code-review (Ready to merge) + ce-compound documentation.
2026-07-04 01:05:04 +08:00
.agents/skills feat: accumulated frontend enhancements, docs, and static assets 2026-06-14 16:35:01 +08:00
.codegraph feat: accumulated frontend enhancements, docs, and static assets 2026-06-14 16:35:01 +08:00
.compound-engineering docs: add brainstorm/plan decision artifacts + plan progress update 2026-07-02 21:27:20 +08:00
.cursor/rules feat: accumulated frontend enhancements, docs, and static assets 2026-06-14 16:35:01 +08:00
.gitea/workflows refactor: remove all emoji from source code (#20) 2026-07-03 02:46:40 +08:00
.github/workflows fix(calendar): 修复 agent 创建日历事件后 UI 不刷新 + 文档化三根因三部曲 2026-06-29 02:20:33 +08:00
.opencodereview fix(calendar): 日历能力缺失修复 + UI 布局优化 + 会话404处理 2026-06-28 14:24:58 +08:00
.trae/rules fix(review): document-processing code review fixes — validation, tests, formatting 2026-06-23 20:21:19 +08:00
configs refactor(experts): replace brand colors with neutral grayscale palette 2026-07-02 21:22:50 +08:00
docs docs(solutions): record bitable agent tool parity patterns + final review findings 2026-07-04 01:04:46 +08:00
scripts refactor: remove all emoji from source code (#20) 2026-07-03 02:46:40 +08:00
src/agentkit build(bitable): rebuild frontend index.html for JS hash alignment 2026-07-04 00:39:24 +08:00
src-tauri feat(client): add Tauri 2.x desktop client with sidecar process management 2026-06-14 10:06:12 +08:00
test-results fix(routing): U1-U6 路由优化 + 修复方案 + 代码审查修复 2026-06-20 19:31:49 +08:00
tests feat(bitable): U6 R15a BitableTool 4 new actions + DELETE /views endpoint 2026-07-03 23:13:46 +08:00
.dockerignore feat(deploy): add Dockerfile and .dockerignore for AgentKit Server 2026-06-05 23:18:44 +08:00
.env.example feat: 私董会讨论模式 + 回测集成 + WS持久化修复 2026-06-17 23:52:53 +08:00
.env.test feat(agentkit): v2 Phase 1 - ReAct/LLM Gateway/Skill/Server + review fixes 2026-06-05 23:32:16 +08:00
.gitignore docs: add brainstorm/plan decision artifacts + plan progress update 2026-07-02 21:27:20 +08:00
.pre-commit-config.yaml refactor: remove all emoji from source code (#20) 2026-07-03 02:46:40 +08:00
AGENTS.md docs: compound streaming-event-contract-residuals learning 2026-07-01 13:53:10 +08:00
CONCEPTS.md docs: compound streaming-event-contract-residuals learning 2026-07-01 13:53:10 +08:00
Dockerfile fix(review): apply P0/P2 findings from dual-agent review 2026-06-30 14:27:46 +08:00
README.md fix(portal-auth): 修复 dev mode JWT 验证误激活 + README 文档同步 2026-06-28 15:26:42 +08:00
agentkit.yaml fix: 私董会数据持久化修复 + emoji 移除计划 2026-07-02 01:07:12 +08:00
docker-compose.deploy.yaml feat: 私董会讨论模式 + 回测集成 + WS持久化修复 2026-06-17 23:52:53 +08:00
docker-compose.dev.yml fix(dev): isolate dev environment ports and fix env loading 2026-07-02 21:23:50 +08:00
docker-compose.test.yml feat(agentkit): v2 Phase 1 - ReAct/LLM Gateway/Skill/Server + review fixes 2026-06-05 23:32:16 +08:00
docker-compose.yaml fix(dev): isolate dev environment ports and fix env loading 2026-07-02 21:23:50 +08:00
ocr feat: accumulated frontend enhancements, docs, and static assets 2026-06-14 16:35:01 +08:00
pyproject.toml feat(mcp): U16 — langchain-mcp-adapters client replacement + transport deprecation 2026-06-25 22:04:37 +08:00
skills-lock.json feat(bitable): add bitable companion service with full P0-P2 fixes 2026-06-25 01:09:59 +08:00

README.md

Fischer AgentKit

企业级统一 AI Agent 门户平台 -- 面向企业用户与开发者,将 LLM、Tool、Prompt 组装为可执行的 Skill通过 ReAct 推理引擎自主完成任务支持记忆持久化、自进化、Pipeline 编排、专家团队协作和桌面客户端。

项目简介

AgentKit 是企业级统一 AI Agent 门户平台,目标用户覆盖企业用户开发者

  • 企业用户:通过 Web GUI / 桌面客户端开箱即用,零代码配置 Skill、专家团队、知识库直接获得多专家协作、文档生成、桌面操控等能力
  • 开发者:通过 Python 库 / CLI / HTTP API 深度集成,将 150 行 Agent 代码降为 10-20 行 YAML 配置,框架自动完成 ReAct 推理循环、模型路由降级、产出质量检查和标准化输出

AgentKit 将 LLM、Tool、Prompt 标准化为可组合模块,开发者只需编写 YAML 配置即可定义一个完整的 SkillPrompt + Tool + 质量门禁);企业用户通过门户界面即可编排专家团队、监控自进化、管理知识库与终端安全。

核心定位:

  • 门户平台 -- 统一入口聚合 Skill、专家团队、知识库、终端、自进化等能力企业用户开箱即用
  • 配置驱动 -- YAML 定义 Skill开发者无需写 Agent 子类
  • 生产就绪 -- 内置质量门禁、模型降级、用量统计、级联检测、状态持久化
  • 四种使用 -- Python 库引用、CLI 聊天、Web GUI、桌面客户端
  • 专家团队 -- Expert Team Mode多专家协作执行复杂任务前端以多角色对话流呈现
  • 企业架构 -- 客户端-服务端分离JWT 认证 + 三级 RBAC + LLM 网关代理 + 终端六层安全防护
  • 记忆持久化 -- SOUL/USER/MEMORY/DAILY 四层记忆,写入即生效
  • 自进化 -- 反思驱动 Soul 更新,经验积累与陷阱检测
  • 工具丰富 -- 内置 Shell、搜索、爬虫、记忆、桌面操控等工具支持 MCP 扩展
  • Pipeline 编排 -- 多 Agent 协同、Saga 补偿、动态流水线
  • 暗色主题 -- CSS 变量 + Ant Design 暗色算法,支持系统/手动切换
  • LLM 缓存 -- 语义相似度缓存,减少重复调用,降低成本

核心特性

1. ReAct 推理引擎

Think -> Act -> Observe 循环。LLM 自主决定是否调用工具、调用哪个工具、何时给出最终答案。支持 Function Calling 和文本解析两种工具调用模式,最大步数可配置。

2. LLM Gateway

统一 LLM 调用入口。Provider 注册、模型别名解析(如 default -> dashscope/qwen3-coder-plus、Fallback 降级策略、Token 用量和成本追踪。支持百炼 DashScope、OpenAI、DeepSeek 等 OpenAI 兼容 API。

3. Skill 系统

Skill = SkillConfig + 绑定 Tools。一个 Skill 代表一个可执行技能,包含 Prompt 模板、工具列表、意图配置和质量门禁。通过 YAML 配置即可定义,无需编写代码。

4. 意图路由

请求预处理(RequestPreprocessor,详见第 7 节)按前缀分流:@skill:xxx 显式选技能、琐碎输入走 DIRECT_CHAT、其余走 REACT。旧的 3 层 CostAwareRouter(含 RegexRules / HeuristicClassifier / SemanticRouter / Vickrey Auction)已被 RequestPreprocessor 替换;IntentRouterrouter/intent.py)存在但未接入 chat 流程。

5. 记忆系统

四层持久化记忆,写入即生效(无需重启):

层级 文件 说明
身份 SOUL.md Agent 身份、性格、做事准则、版本追踪
用户 USER.md 用户基本信息和偏好
笔记 MEMORY.md Agent 主动记录的重要信息
日志 DAILY/ 按日期归档的交互摘要
  • Section-based CRUD:每个记忆文件按 ## Section 组织,支持原子读写
  • 容量保护trim_to_budget 按 section 边界裁剪,保护"版本"和"更新历史"
  • 即时刷新MemoryTool 写入后自动触发 notify_change(),所有 Agent 的 system_prompt 实时更新
  • RAG 检索:向量嵌入 + 多源检索器,支持飞书/Confluence 适配器

6. 自进化系统

反思驱动的 Agent 自我改进:

  • Reflector -- 任务完成后自动反思,生成质量评分和改进建议
  • Soul Evolution -- 累积反思触发阈值后自动更新 SOUL.md版本追踪
  • 经验存储 -- 成功/失败经验持久化,陷阱检测避免重复错误
  • Prompt 优化 -- 遗传算法 + A/B 测试自动优化 Prompt
  • 路径优化 -- 分析工具调用路径,推荐更优执行策略

7. 请求预处理RequestPreprocessor

RequestPreprocessorchat/request_preprocessor.py)按前缀分流,零成本路由:

Layer 触发条件 延迟 Token 路由结果
0 @skill:xxx 前缀 ~0ms 0 显式技能选择(SKILL_REACT 或技能配置的模式)
1 琐碎输入正则(问候/身份/事实/数学/翻译) ~0ms 0 DIRECT_CHAT(由 _TOOL_CONTEXT_RE 守护)
默认 其他输入 ~0ms 0 REACTLLM 在 agent 循环中自主决定工具使用)

@board 前缀走 BoardRouter(多轮讨论),@team 前缀走 ExpertTeamRouter(流水线协作),均在 RequestPreprocessor 之前分流。

路由结果携带 ExecutionMode 枚举(DIRECT_CHAT / REACT / SKILL_REACT / REWOO / REFLEXION / PLAN_EXEC / TEAM_COLLAB),作为路由层与执行层的架构契约,杜绝硬编码。

8. LLM 响应缓存

语义相似度缓存,减少重复 LLM 调用:

  • CacheKey -- 基于 prompt + model + temperature 生成缓存键
  • 语义匹配 -- 相似 prompt 命中缓存,避免重复调用
  • TTL 管理 -- 缓存条目自动过期,支持手动失效

9. 级联检测与状态持久化

生产级故障防护:

  • CascadeDetector -- 检测 Agent 输出中的级联失败模式,及时熔断
  • CascadeStateStore -- 级联状态持久化,支持 InMemory 和 Redis 后端
  • session_ttl -- 可配置的会话 TTL自动清理过期状态
  • 优雅降级 -- Redis 不可用时自动降级到 InMemory保持服务可用

10. 产出质量管理

四维质量检查必填字段、最低字数、JSON Schema 校验、自定义验证器。检查不通过时自动重试(可配置 max_retries重试时携带质量反馈信息。

11. 标准化输出

Schema 验证 + 字段类型归一化str -> int/float/bool+ 元数据附加version、produced_at、quality_score。所有 Skill 产出统一为 StandardOutput 格式。

12. 内置工具集

开箱即用的工具插件,覆盖常见 Agent 需求:

工具 说明
ShellTool 执行 Shell 命令,白名单安全机制 + 用户确认
WebSearchTool DuckDuckGo / Bing 网页搜索
BaiduSearchTool 百度搜索
WebCrawlTool 网页抓取与内容提取
MemoryTool 短期/长期记忆管理
AskHumanTool 向用户提问获取信息
SchemaExtractTool 从文本提取结构化数据
SchemaGenerateTool 生成 JSON Schema
MCPTool MCP 协议工具扩展
ComputerUseTool 桌面操控(截图、点击、输入),支持云端和本地(pyautogui)模式
DocumentTool 文档处理:创建 Word/Excel/PDF填充 Word 模板读取多格式文档U1-U9

工具组合:SequentialChain(顺序链)、ParallelFanOut(并行扇出)、DynamicSelector(动态选择)。

13. Pipeline 编排

多 Agent 协同编排,支持复杂工作流:

  • PipelineEngine -- 阶段式流水线执行,支持自适应配置
  • SagaOrchestrator -- 分布式事务补偿,失败自动回滚
  • DynamicPipeline -- 运行时动态调整流水线结构
  • PipelineReflector -- 执行反思与重规划
  • HandoffManager -- Agent 间任务移交

14. Expert Team Mode

多专家协作执行复杂任务B+C 混合模式(结构化协作计划 + 去中心化执行),前端以多角色对话流呈现:

核心组件

组件 说明
ExpertConfig 专家配置,扩展自 AgentConfig新增 is_leadexpert_colorcapabilities
ExpertTemplate 可复用的专家模板,通过 ExpertTemplateRegistry 管理
Expert 专家实例,包装 ConfigDrivenAgent支持 send_messagerequest_assisthandoff
ExpertTeam 团队容器,管理专家生命周期、共享工作区、协作计划
TeamOrchestrator 计划执行引擎,支持串行/并行/竞争并行 + 结果合并
CollaborationPlan 协作计划,定义阶段依赖、并行类型、合并策略
ExpertTeamRouter 专家团队路由,@team 前缀触发,名称校验防注入
HandoffTransport 专家间通信抽象InProcessasyncio.Queue+ Redis Pub/Sub
SharedWorkspace 跨专家共享上下文,支持读写键值对

协作生命周期

FORMING -> PLANNING -> EXECUTING -> SYNTHESIZING -> COMPLETED
                                        |
                                    失败时回退到单 Agent 模式

协作计划阶段类型

类型 说明 合并策略
串行 按依赖顺序执行 最后阶段结果为最终结果
并行并行 多专家同时执行 SEQUENTIAL / BEST / MERGE
竞争并行 多专家竞争,选最优 BEST自动评分选择

前端对话 UI

  • ExpertTeamView:专家头像列表 + 计划阶段进度条
  • ExpertMessage:按专家角色渲染消息(头像、颜色、类型标签)
  • PlanVisualization:协作计划时间线可视化
  • WebSocket 事件:team_formedexpert_stepexpert_resultplan_updateteam_synthesisteam_dissolved

使用方式

from agentkit.experts import ExpertConfig, ExpertTeam, ExpertTeamRouter

# 定义专家
researcher = ExpertConfig(name="researcher", is_lead=True, expert_color="#1890ff", ...)
writer = ExpertConfig(name="writer", expert_color="#52c41a", ...)
reviewer = ExpertConfig(name="reviewer", expert_color="#faad14", ...)

# 组建团队
team = ExpertTeam()
await team.form([researcher, writer, reviewer])

# 执行协作计划
from agentkit.experts import CollaborationPlan, PlanPhase, ParallelType
plan = CollaborationPlan(
    id="plan-1", task="撰写深度分析报告", lead_expert="researcher",
    phases=[
        PlanPhase(id="p1", name="调研", assigned_expert="researcher", ...),
        PlanPhase(id="p2", name="撰写", assigned_expert="writer", depends_on=["p1"], ...),
        PlanPhase(id="p3", name="审校", assigned_expert="reviewer", depends_on=["p2"], ...),
    ],
)
team.update_plan(plan)
result = await orchestrator.execute_plan(plan)

用户也可在聊天中通过 @team:researcher,writer,reviewer 任务描述 前缀触发团队模式。

15. 企业级客户端-服务端架构

将 AgentKit 从纯本地运行架构演进为企业级客户端+服务端架构。客户端Tauri 桌面端)作为 AI 工作台本地执行 Agent/终端/文件操作,服务端作为企业平台提供 LLM 网关(统一 Key 管理)、用户权限、审计日志、知识库共享能力。

核心能力

能力 说明
JWT 认证 Access Token (15min) + Refresh Token (7d)HS256 签名
API Key 认证 服务间调用,常量时间比较(hmac.compare_digest
三级 RBAC member / operator / admin + 独立权限位
LLM 网关代理 客户端通过服务端间接调用 LLM不在本地存储 API Key
双模式终端 本地终端(客户端 sidecar PTY+ 服务端终端(服务端 PTY + 管理员审批)
六层终端安全 黑名单 → 内置安全 → 全局白名单 → 用户白名单 → 会话白名单 → 危险检测
终端审计日志 所有命令(执行/审批/拒绝/阻止)均记录,支持按用户/会话/模式过滤
配置同步 启动全量拉取 + 5 分钟轮询版本号 + 手动刷新
Shell 操作符防护 &&;、`

权限矩阵

权限 member operator admin
CHAT
KB_QUERY
KB_WRITE
WORKFLOW_EXECUTE
TERMINAL_LOCAL_USE
TERMINAL_SERVER_USE
TERMINAL_WHITELIST_MANAGE
USER_MANAGE
SYSTEM_CONFIG

认证流程

客户端登录 → /api/v1/auth/login (username + password)
           ← { access_token, refresh_token, user }
           
Token 过期 → RemoteLLMProvider 收到 401
           → 调用 refresh_callback → /api/v1/auth/refresh
           ← 新 access_token (refresh_token 不轮换)
           → 重试原始请求

终端安全决策流

命令输入
  ↓
1. 黑名单检查 → BLOCKED
  ↓
2. Shell 操作符检测 (&&/;/|/$()/`) → 标记为危险
  ↓
3. 内置安全白名单 (ls/cat/git status...) → SAFE
  ↓
4. 全局白名单 (管理员配置) → SAFE
  ↓
5. 用户白名单 (DB 持久化) → SAFE
  ↓
6. 会话白名单 (本次会话临时) → SAFE
  ↓
7. 危险检测 (_is_dangerous) → 需确认/审批
  ↓
本地终端: 用户确认 → 加入会话白名单 → 执行
服务端终端: 管理员审批 (5分钟超时) → 执行

使用方式

from agentkit.llm import RemoteLLMProvider

# 客户端通过服务端 LLM 网关调用(不在本地存储 API Key
provider = RemoteLLMProvider(
    server_url="https://api.example.com",
    auth_token_provider=lambda: get_jwt_token(),
    refresh_callback=refresh_tokens,  # 401 时自动刷新
)
response = await provider.chat(request)

16. 文档处理能力

Agent 内置文档生成与读取能力Agent 通过 DocumentTool 自主创建 Word/Excel/PDF 文档、填充 Word 模板、读取多格式文档,无需用户手动操作 Office 软件。

核心设计Agent 生成 MarkdownService 负责格式映射。Agent 不直接操作 Office XML而是输出 Markdown 内容,由 DocumentService 调度格式渲染器转换为最终文件。

架构

Agent (LLM)
  └─ DocumentTool (action=create|read)
       ├─ create → DocumentService → Renderer → 文件 + 元数据
       └─ read   → DocumentLoader → 提取文本

组件

组件 说明
DocumentService 统一业务逻辑层,管理文件存储、元数据持久化、渲染器调度
WordRenderer Markdown → .docx标题、段落、列表、表格、粗体/斜体)
ExcelRenderer Markdown 表格/JSON → .xlsx多 sheet、长 sheet 名截断)
PDFRenderer Markdown → .pdfCJK 字体自动检测、XML 转义)
TemplateRenderer Jinja2 沙箱填充 .docx 模板SSTI 防护)
DocumentLoader 读取 PDF/Word/Excel/Markdown/HTML/纯文本,统一为 Document 对象
DocumentTool Agent 工具封装action=create 创建action=read 读取

REST API

端点 方法 说明
/api/v1/documents/create POST 创建文档Word/Excel/PDF支持模板填充
/api/v1/documents/upload-template POST 上传 .docx 模板50MB 限制)
/api/v1/documents/conversation/{id} GET 列出对话关联的文档
/api/v1/documents/download/{doc_id} GET 下载文档

安全

  • 路径遍历防护:文件名 sanitize + Path.resolve() + relative_to() 双重校验
  • SSTI 防护jinja2.sandbox.SandboxedEnvironment,拦截 __class____globals__ 等危险属性
  • API 认证X-API-Key header 或 api_key query paramhmac.compare_digest 常量时间比较
  • 文件大小限制:模板上传 50MB 限制

前端集成

  • DocumentPanel:右侧可折叠面板,展示当前对话的文档列表
  • DocumentCard:文件卡片组件,显示格式图标、文件名、大小、下载按钮
  • documents Pinia store按对话 ID 管理文档列表WebSocket tool_result 事件自动更新

使用示例

from agentkit.tools.document_tool import DocumentTool
from agentkit.documents.service import DocumentService

# 初始化
service = DocumentService()
service.register_renderer("word", WordRenderer())
service.register_renderer("excel", ExcelRenderer())
service.register_renderer("pdf", PDFRenderer())
tool = DocumentTool(service=service)

# Agent 创建 Word 文档
result = await tool.execute(
    action="create",
    format="word",
    content="# 季度报告\n\n本季度营收增长 15%...",
    conversation_id="conv-001",
)
# → {success: True, document: {id, filename, download_url, ...}}

# Agent 读取 PDF 文档
result = await tool.execute(
    action="read",
    filename="/path/to/report.pdf",
    conversation_id="conv-001",
)
# → {success: True, content: "提取的文本...", metadata: {format: "pdf", page_count: 5}}

架构图

  ┌──────────────────────────────────────────────────────────────┐
  │                    桌面客户端 (Tauri 2.x)                      │
  │          splash → main窗口 → sidecar进程管理 → 系统托盘        │
  └──────────────────────────┬───────────────────────────────────┘
                             │
  ┌──────────────────────────┼───────────────────────────────────┐
  │                    前端 (Vue 3 + Ant Design Vue)              │
  │   ChatView · ExpertTeamView · ExpertMessage · PlanViz        │
  │   EvolutionView · WorkflowView · TerminalView · ComputerUse  │
  │   LoginView · SystemMonitorPanel · WhitelistManager          │
  └──────────────────────────┼───────────────────────────────────┘
                             │ WebSocket / SSE / HTTP (JWT)
  ┌──────────────────────────┼───────────────────────────────────┐
  │                    服务端 (FastAPI + Uvicorn)                  │
  │   ┌─────────────────────────────────────────────────────┐    │
  │   │  认证层: AuthMiddleware (JWT + API Key 双轨)         │    │
  │   │  RBAC: require_permission / require_terminal_auth    │    │
  │   └─────────────────────────────────────────────────────┘    │
  │   portal.py · chat.py · evolution.py · workflows.py          │
  │   auth.py · terminal_server.py · terminal_whitelist.py       │
  │   llm_gateway.py · config_sync.py · system.py · ...          │
  │   28个路由模块 · Agent Pool · Expert Team · Memory Store      │
  └──────────────────────────┼───────────────────────────────────┘
                             │
              ┌──────────────┼──────────────┐
              │       RequestPreprocessor    │
              │  @board → BoardRouter        │
              │  @team  → ExpertTeamRouter   │
              │  Layer 0: @skill:xxx 前缀     │
              │  Layer 1: 琐碎输入正则 (0ms)   │
              │  默认: REACT (LLM 自主决策)   │
              │  → ExecutionMode 枚举契约    │
              └──────┬───────────────┬───────┘
                     │               │
     DIRECT_CHAT     │               │ REACT / SKILL_REACT / TEAM_COLLAB
                     ▼               ▼
           ┌─────────────┐  ┌──────────────────┐  ┌──────────────────┐
           │  Direct LLM  │  │  ConfigDrivenAgent│  │   Expert Team    │
           │  (简单对话)   │  │  (ReAct Engine)   │  │  (多专家协作)     │
           └─────────────┘  └────────┬─────────┘  └────────┬─────────┘
                                     │                     │
                    ┌────────────────┼────────────────┐    │
                    │                │                │    │
                    ▼                ▼                ▼    ▼
            ┌──────────────┐ ┌──────────────┐ ┌──────────────┐
            │ LLM Gateway  │ │ Tool Registry│ │ Memory System│
            │ resolve→chat │ │ shell/search │ │ SOUL/USER    │
            │ fallback→track│ │ crawl/memory │ │ MEMORY/DAILY │
            └──────┬───────┘ └──────────────┘ └──────────────┘
                   │
         ┌─────────┼─────────┐
         ▼         ▼         ▼
    ┌─────────┐ ┌────────┐ ┌──────────┐
    │DashScope│ │ OpenAI │ │ DeepSeek │  ...
    └─────────┘ └────────┘ └──────────┘

  ┌──────────────────────────────────────────────────────────────┐
  │                    终端安全六层防护                            │
  │  黑名单 → Shell操作符检测 → 内置白名单 → 全局白名单            │
  │  → 用户白名单 → 会话白名单 → 危险检测 → 审批/确认             │
  │  本地终端: 用户确认  |  服务端终端: 管理员审批 (5min超时)      │
  └──────────────────────────────────────────────────────────────┘

模块分层

层级 模块 说明
API server/ cli/ 服务端路由 + 命令行入口
Service core/ chat/ skills/ experts/ Agent 引擎、路由、技能系统、专家团队
Data memory/ session/ bus/ 记忆持久化、会话管理、消息总线
Utility llm/ tools/ evolution/ quality/ mcp/ LLM 网关、工具、进化、质量、MCP

快速开始

安装

pip install fischer-agentkit

如需 MCP 支持:

pip install fischer-agentkit[mcp]

开发模式:

cd fischer-agentkit
pip install -e ".[dev]"

前置依赖

  • Python >= 3.11
  • Redis可选分布式模式需要
  • PostgreSQL + pgvector可选语义记忆需要

CLI 快速开始

安装后即可使用 agentkit 命令行工具:

# 查看版本
agentkit version

# 初始化项目(生成配置文件)
agentkit init

# 启动 Web GUI 聊天界面(推荐)
agentkit gui --port 8002

# 启动 CLI 聊天
agentkit chat

# 启动 ServerAPI 模式)
agentkit serve --host 0.0.0.0 --port 8001

# 健康检查
agentkit doctor

# 提交任务(远程模式)
agentkit task submit --skill content_generator --input '{"topic": "AI趋势"}' --server-url http://localhost:8001

# 异步提交任务
agentkit task submit --skill content_generator --input '{"topic": "AI趋势"}' --mode async --server-url http://localhost:8001

# 查看任务状态
agentkit task status <task_id> --server-url http://localhost:8001

# 列出任务
agentkit task list --server-url http://localhost:8001

# 取消任务
agentkit task cancel <task_id> --server-url http://localhost:8001

# 列出已注册 Skill
agentkit skill list --server-url http://localhost:8001

# 加载 Skill 配置
agentkit skill load ./my_skill.yaml

# 查看 Skill 详情
agentkit skill info content_generator --server-url http://localhost:8001

# 查看 LLM 用量
agentkit usage --server-url http://localhost:8001

# 配对业务系统(生成 API Key 给业务系统使用)
agentkit pair --name geo-backend
# 输出: API Key + 连接指令

# 查看已配对的客户端
agentkit pair --list

# 撤销配对
agentkit pair --revoke geo-backend

# 也可以用 python -m 方式运行
python -m agentkit version

业务系统配对

业务系统(如 GEO通过 agentkit pair 完成配对后,即可独立调用 AgentKit

# 1. 在 AgentKit 服务器上执行配对
agentkit pair --name geo-backend --skills-dir ./configs/skills

# 2. 将输出的 API Key 配置到业务系统
# GEO 的 .env 文件:
AGENTKIT_SERVER_URL=http://agentkit:8001
AGENTKIT_API_KEY=ak_live_xxxxxxxxxxxx

# 3. 业务系统即可调用 AgentKit API
# POST http://agentkit:8001/api/v1/tasks
# Header: X-API-Key: ak_live_xxxxxxxxxxxx

配置优先级: 客户端自定义配置pair 时指定)> init 默认配置 > 硬编码默认值

Docker 部署

# 初始化项目配置
agentkit init

# 编辑 .env 文件,填入 API Key
cp .env.example .env
# 编辑 .env ...

# 启动完整环境AgentKit + Redis + PostgreSQL
docker-compose up -d

# 查看日志
docker-compose logs -f agentkit

# 健康检查
docker-compose exec agentkit agentkit doctor

# 停止
docker-compose down

最小示例

import asyncio
from agentkit import LLMGateway, SkillConfig, Skill, ConfigDrivenAgent
from agentkit.llm.providers.openai import OpenAIProvider

async def main():
    # 1. 初始化 LLM Gateway
    gateway = LLMGateway()
    gateway.register_provider("dashscope", OpenAIProvider(
        api_key="sk-xxx",
        base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    ))

    # 2. 定义 Skill
    config = SkillConfig(
        name="content_generator",
        agent_type="content_generation",
        description="内容生成 Skill",
        task_mode="llm_generate",
        prompt={
            "identity": "你是一个专业的内容生成助手",
            "instructions": "根据用户需求生成高质量内容",
            "output_format": "以 JSON 格式输出",
        },
        llm={"model": "default", "temperature": 0.7},
        execution_mode="react",
        max_steps=5,
    )
    skill = Skill(config=config)

    # 3. 创建 Agent 并执行任务
    agent = ConfigDrivenAgent(config=config, llm_gateway=gateway)
    await agent.start()

    from agentkit.core.protocol import TaskMessage
    from datetime import datetime, timezone

    task = TaskMessage(
        task_id="task-001",
        agent_name="content_generator",
        task_type="content_generation",
        input_data={"topic": "AI 搜索引擎优化趋势"},
        priority=0,
        created_at=datetime.now(timezone.utc),
    )

    result = await agent.execute(task)
    print(result.output_data)

    await agent.stop()

asyncio.run(main())

部署方式

Import 模式

作为 Python 库直接引用,适合嵌入到现有项目中。

from agentkit import LLMGateway, SkillConfig, Skill, ConfigDrivenAgent

gateway = LLMGateway()
# ... 注册 provider、创建 skill、执行任务

Server 模式

FastAPI 独立部署,通过 HTTP API 调用。

# server.py
import uvicorn
from agentkit.server.app import create_app
from agentkit import LLMGateway
from agentkit.llm.providers.openai import OpenAIProvider

gateway = LLMGateway()
gateway.register_provider("dashscope", OpenAIProvider(
    api_key="sk-xxx",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
))

app = create_app(llm_gateway=gateway)

if __name__ == "__main__":
    uvicorn.run(app, host="0.0.0.0", port=8001)

启动:

python server.py

Docker 部署

# 启动完整环境AgentKit + Redis + PostgreSQL + pgvector
docker-compose up -d

# 查看日志
docker-compose logs -f agentkit

# 健康检查
docker-compose exec agentkit agentkit doctor

# 停止
docker-compose down

docker-compose.yaml 包含三个服务:

服务 镜像 端口 说明
agentkit 自建 (python:3.11-slim) 8001 AgentKit 服务端
redis redis:7-alpine 6379 消息总线 + 缓存
postgres pgvector/pgvector:pg15 5432 语义记忆向量存储

桌面客户端 (Tauri 2.x)

跨平台桌面应用Rust Shell + Vue 3 前端 + Python Sidecar。

前置条件Rust 工具链 + Node.js 18+ + Python 3.11+

# 1. 构建 Python sidecar
pip install pyinstaller
pyinstaller --onefile --name agentkit-server src/agentkit/__main__.py

# 2. 放置 sidecar带平台后缀
# macOS Apple Silicon:
cp dist/agentkit-server src-tauri/binaries/agentkit-server-aarch64-apple-darwin
# macOS Intel:
cp dist/agentkit-server src-tauri/binaries/agentkit-server-x86_64-apple-darwin
# Linux:
cp dist/agentkit-server src-tauri/binaries/agentkit-server-x86_64-unknown-linux-gnu
# Windows:
copy dist\agentkit-server.exe src-tauri\binaries\agentkit-server-x86_64-pc-windows-msvc.exe

# 3. 构建前端
cd src/agentkit/server/frontend
npm install
npm run build:frontend

# 4. 开发模式(热重载)
npm run tauri dev

# 5. 生产构建
npm run tauri build
# 产物:
#   macOS: src-tauri/target/release/bundle/dmg/Fischer AgentKit.dmg
#   macOS: src-tauri/target/release/bundle/macos/Fischer AgentKit.app
#   Windows: src-tauri/target/release/bundle/msi/
#   Linux: src-tauri/target/release/bundle/deb/

架构

Tauri Shell (Rust)
├── 窗口管理splash + main
├── 系统托盘(显示窗口 / 退出)
└── Sidecar 进程管理
    └── agentkit-serverPyInstaller 打包的 Python 服务端)
        └── Uvicorn + FastAPI (--port 0 动态分配)

Tauri 启动时以 --port 0 启动 sidecar解析 stdout 获取实际端口,前端通过该端口连接后端。

调用方式

Import 模式示例

import asyncio
from agentkit import (
    LLMGateway, SkillConfig, Skill, ConfigDrivenAgent,
    IntentRouter, QualityGate, OutputStandardizer,
)
from agentkit.llm.providers.openai import OpenAIProvider
from agentkit.core.protocol import TaskMessage
from datetime import datetime, timezone

async def main():
    # 初始化 Gateway
    gateway = LLMGateway()
    gateway.register_provider("dashscope", OpenAIProvider(
        api_key="sk-xxx", base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    ))

    # 定义多个 Skill
    content_config = SkillConfig(
        name="content_generator",
        agent_type="content_generation",
        task_mode="llm_generate",
        prompt={
            "identity": "你是内容生成助手",
            "instructions": "生成 SEO 优化内容",
            "output_format": "JSON: {content, word_count}",
        },
        llm={"model": "default"},
        intent={
            "keywords": ["生成", "内容", "写作"],
            "description": "内容生成与写作",
            "examples": ["帮我写一篇文章", "生成 SEO 内容"],
        },
        quality_gate={
            "required_fields": ["content"],
            "min_word_count": 100,
            "max_retries": 2,
        },
        execution_mode="react",
        max_steps=5,
    )

    optimizer_config = SkillConfig(
        name="geo_optimizer",
        agent_type="geo_optimization",
        task_mode="llm_generate",
        prompt={
            "identity": "你是 GEO 优化专家",
            "instructions": "优化内容以提升 AI 搜索可见性",
            "output_format": "JSON: {optimized_content, seo_score, changes}",
        },
        llm={"model": "default"},
        intent={
            "keywords": ["优化", "GEO", "SEO"],
            "description": "内容 GEO/SEO 优化",
            "examples": ["优化这篇文章", "提升搜索排名"],
        },
        quality_gate={
            "required_fields": ["optimized_content", "seo_score"],
            "max_retries": 1,
        },
        execution_mode="react",
    )

    # 注册 Skill
    from agentkit import SkillRegistry
    registry = SkillRegistry()
    registry.register(Skill(config=content_config))
    registry.register(Skill(config=optimizer_config))

    # 使用意图路由
    router = IntentRouter(llm_gateway=gateway)
    routing_result = await router.route(
        input_data={"query": "帮我生成一篇关于 AI 的文章"},
        skills=registry.list_skills(),
    )
    print(f"路由到: {routing_result.matched_skill} (method={routing_result.method}, confidence={routing_result.confidence})")

    # 创建 Agent 并执行
    matched_skill = registry.get(routing_result.matched_skill)
    agent = ConfigDrivenAgent(config=matched_skill.config, llm_gateway=gateway)
    await agent.start()

    task = TaskMessage(
        task_id="task-001",
        agent_name=agent.name,
        task_type=agent.agent_type,
        input_data={"query": "帮我生成一篇关于 AI 的文章"},
        priority=0,
        created_at=datetime.now(timezone.utc),
    )

    result = await agent.execute(task)

    # 质量检查
    quality_gate = QualityGate()
    quality_result = await quality_gate.validate(result.output_data or {}, matched_skill)
    print(f"质量检查: {'通过' if quality_result.passed else '未通过'}")

    # 标准化输出
    standardizer = OutputStandardizer()
    standard_output = await standardizer.standardize(
        raw_output=result.output_data or {},
        skill=matched_skill,
        quality_result=quality_result,
    )
    print(f"标准化输出: skill={standard_output.skill_name}, quality_score={standard_output.metadata.quality_score}")

    await agent.stop()

asyncio.run(main())

Server 模式示例

curl 调用

注册 Skill

curl -X POST http://localhost:8001/api/v1/skills \
  -H "Content-Type: application/json" \
  -d '{
    "config": {
      "name": "content_generator",
      "agent_type": "content_generation",
      "task_mode": "llm_generate",
      "description": "内容生成 Skill",
      "prompt": {
        "identity": "你是内容生成助手",
        "instructions": "生成高质量内容",
        "output_format": "JSON: {content, word_count}"
      },
      "llm": {"model": "default"},
      "intent": {
        "keywords": ["生成", "内容"],
        "description": "内容生成"
      },
      "quality_gate": {
        "required_fields": ["content"],
        "min_word_count": 100,
        "max_retries": 2
      },
      "execution_mode": "react"
    }
  }'

提交任务(指定 Skill

curl -X POST http://localhost:8001/api/v1/tasks \
  -H "Content-Type: application/json" \
  -d '{
    "skill_name": "content_generator",
    "input_data": {"topic": "AI 搜索引擎优化趋势"}
  }'

提交任务(意图路由自动匹配):

curl -X POST http://localhost:8001/api/v1/tasks \
  -H "Content-Type: application/json" \
  -d '{
    "input_data": {"query": "帮我生成一篇文章"}
  }'

创建 Agent

curl -X POST http://localhost:8001/api/v1/agents \
  -H "Content-Type: application/json" \
  -d '{"skill_name": "content_generator"}'

查询 LLM 用量:

curl http://localhost:8001/api/v1/llm/usage

健康检查:

curl http://localhost:8001/api/v1/health

Python SDK 调用

import asyncio
from agentkit.server.client import AgentKitClient

async def main():
    async with AgentKitClient("http://localhost:8001") as client:
        # 注册 Skill
        await client.register_skill({
            "name": "content_generator",
            "agent_type": "content_generation",
            "task_mode": "llm_generate",
            "prompt": {
                "identity": "你是内容生成助手",
                "instructions": "生成高质量内容",
                "output_format": "JSON: {content, word_count}",
            },
            "llm": {"model": "default"},
            "intent": {"keywords": ["生成", "内容"], "description": "内容生成"},
            "quality_gate": {"required_fields": ["content"], "max_retries": 2},
            "execution_mode": "react",
        })

        # 提交任务
        result = await client.submit_task(
            input_data={"topic": "AI 搜索引擎优化趋势"},
            skill_name="content_generator",
        )
        print(result)

        # 查询用量
        usage = await client.get_usage()
        print(usage)

asyncio.run(main())

Skill 配置 YAML 示例

name: content_generator
agent_type: content_generation
version: "1.0.0"
description: "AI 内容生成 Skill支持选题推荐和文章生成"
task_mode: llm_generate
supported_tasks:
  - generate_topics
  - generate_article
max_concurrency: 2

input_schema:
  type: object
  required:
    - target_keyword
  properties:
    target_keyword:
      type: string
      description: 目标关键词
    brand_name:
      type: string
      description: 品牌名称
    word_count:
      type: integer
      description: 目标字数
      default: 2000

output_schema:
  type: object
  properties:
    topics:
      type: array
      description: 选题列表
    content:
      type: string
      description: 生成的文章内容
    word_count:
      type: integer

prompt:
  identity: "你是一个专业的内容生成助手,擅长为品牌创作高质量的 SEO/GEO 优化内容"
  context: "品牌需要通过优质内容提升在 AI 搜索引擎中的可见性"
  instructions: |
    根据用户提供的关键词和品牌信息,生成符合要求的内容。
    - generate_topics: 生成选题列表
    - generate_article: 生成完整文章    
  constraints: |
    - 内容必须原创
    - 关键词密度适中
    - 文章结构清晰    
  output_format: "JSON: generate_topics 返回 {topics: [{title, reason, keywords}]}generate_article 返回 {content, word_count}"

llm:
  model: "default"
  temperature: 0.7
  max_tokens: 4000

tools:
  - retrieve_knowledge

intent:
  keywords:
    - 生成
    - 内容
    - 写作
    - 文章
  description: "内容生成与写作"
  examples:
    - "帮我写一篇文章"
    - "生成 SEO 内容"
    - "推荐选题"

quality_gate:
  required_fields:
    - content
  min_word_count: 100
  max_retries: 2
  custom_validator: null

execution_mode: react
max_steps: 5

加载 YAML 配置:

from agentkit import SkillConfig, Skill

config = SkillConfig.from_yaml("configs/content_generator.yaml")
skill = Skill(config=config)

LLM 配置 YAML 示例

providers:
  dashscope:
    api_key: "${DASHSCOPE_API_KEY}"
    base_url: "https://dashscope.aliyuncs.com/compatible-mode/v1"
    models:
      qwen3-coder-plus:
        max_tokens: 64000
        cost_per_1k_input: 0.00014
        cost_per_1k_output: 0.00028
  openai:
    api_key: "${OPENAI_API_KEY}"
    base_url: "https://api.openai.com/v1"
    models:
      gpt-4o:
        cost_per_1k_input: 0.005
        cost_per_1k_output: 0.015

model_aliases:
  default: "dashscope/qwen3-coder-plus"
  fast: "dashscope/qwen3-coder-plus"
  powerful: "openai/gpt-4o"

fallbacks:
  dashscope/qwen3-coder-plus:
    - "openai/gpt-4o"

加载 LLM 配置:

from agentkit.llm.config import LLMConfig
from agentkit import LLMGateway

llm_config = LLMConfig.from_yaml("configs/llm.yaml")
gateway = LLMGateway(config=llm_config)

意图路由使用示例

from agentkit import IntentRouter, SkillRegistry, LLMGateway

gateway = LLMGateway()
# ... 注册 provider

registry = SkillRegistry()
# ... 注册多个 skill

router = IntentRouter(llm_gateway=gateway)

# 关键词匹配(零成本)
result = await router.route(
    input_data={"query": "帮我生成一篇文章"},
    skills=registry.list_skills(),
)
# result.matched_skill = "content_generator"
# result.method = "keyword"
# result.confidence = 1.0

# LLM 分类(关键词未命中时自动触发)
result = await router.route(
    input_data={"query": "我想提升品牌在 AI 搜索中的表现"},
    skills=registry.list_skills(),
)
# result.matched_skill = "geo_optimizer"
# result.method = "llm"
# result.confidence = 0.85

质量检查使用示例

from agentkit import QualityGate, Skill, SkillConfig

# 定义带质量门禁的 Skill
config = SkillConfig(
    name="content_generator",
    agent_type="content_generation",
    task_mode="llm_generate",
    prompt={"identity": "内容生成助手", "output_format": "JSON"},
    quality_gate={
        "required_fields": ["content", "word_count"],
        "min_word_count": 200,
        "max_retries": 3,
        "custom_validator": "myapp.validators.content_quality_check",
    },
)
skill = Skill(config=config)

# 执行质量检查
gate = QualityGate()
result = await gate.validate(
    output={"content": "这是一篇短文", "word_count": 5},
    skill=skill,
)

print(result.passed)      # False字数不足
print(result.can_retry)   # Truemax_retries > 0
for check in result.checks:
    print(f"  {check.name}: {'PASS' if check.passed else 'FAIL'} {check.message or ''}")

自定义验证器:

# myapp/validators.py
async def content_quality_check(output: dict) -> bool:
    """自定义质量验证器"""
    content = output.get("content", "")
    # 检查内容不含违禁词
    forbidden = ["抄袭", "复制粘贴"]
    return not any(word in content for word in forbidden)

模块详解

core/react -- ReAct 推理引擎

ReActEngine 实现 Think -> Act -> Observe 循环:

  1. Think: 将对话历史和工具 schema 发送给 LLM
  2. Act: 如果 LLM 返回 tool_calls执行对应工具
  3. Observe: 将工具结果追加到对话历史,回到 Think

支持两种工具调用模式:

  • Function Calling: LLM 原生返回 tool_calls(推荐)
  • 文本解析: 从 LLM 文本中提取 Action: tool_name(args)```tool ``` 代码块

停止条件LLM 不返回 tool_calls或达到 max_steps。

危险工具确认流:非白名单命令触发 needs_confirmation,用户确认后以 _skip_dangerous_check=True 重新执行,避免无限循环。

chat/request_preprocessor -- 请求预处理

按前缀分流的零成本路由:

Layer 触发条件 延迟 Token 路由结果
0 @skill:xxx 前缀 ~0ms 0 显式技能选择(SKILL_REACT 或技能配置的模式)
1 琐碎输入正则 ~0ms 0 DIRECT_CHAT(由 _TOOL_CONTEXT_RE 守护)
默认 其他输入 ~0ms 0 REACTLLM 自主决策)

路由结果包含 ExecutionMode 枚举(DIRECT_CHAT / REACT / SKILL_REACT / REWOO / REFLEXION / PLAN_EXEC / TEAM_COLLAB),作为路由层与执行层的架构契约。@team:expert1,expert2 前缀直接路由到 TEAM_COLLAB 模式(由 ExpertTeamRouter 处理),@board 前缀走 BoardRouter(多轮讨论)。

旧的 3 层 CostAwareRouter(含 RegexRules / HeuristicClassifier / SemanticRouter / Vickrey Auction)已被 RequestPreprocessor 替换;IntentRouterrouter/intent.py)存在但未接入 chat 流程;AuctionHouseVickrey 拍卖)位于 marketplace/auction.py(属于 marketplace 子系统,非路由)。

llm/gateway -- LLM Gateway

统一 LLM 调用入口,核心能力:

  • Provider 注册: gateway.register_provider("openai", provider)
  • 模型别名: "default" -> "dashscope/qwen3-coder-plus"
  • Fallback 降级: 主模型失败时自动切换到备选模型
  • 用量追踪: 按 agent_name、model 统计 Token 用量和成本
  • 模型解析: "provider/model" 格式自动路由到对应 Provider
  • 响应缓存: 语义相似度缓存,减少重复调用(llm/cache.py
  • 用量存储: InMemory/Redis 双后端,支持分布式用量统计(llm/providers/usage_store.py

skills -- Skill 系统

Skill = SkillConfig + 绑定 Tools。SkillConfig 扩展自 AgentConfig新增

  • intent: 意图配置(关键词、描述、示例),供 IntentRouter 使用
  • quality_gate: 质量门禁配置,供 QualityGate 使用
  • execution_mode: 执行模式react / direct / custom
  • max_steps: ReAct 最大步数

SkillRegistry 管理 Skill 的注册、发现、更新。

experts -- Expert Team Mode

多专家协作执行复杂任务B+C 混合模式:

  • ExpertConfig -- 扩展自 AgentConfig新增 is_leadexpert_colorcapabilities 字段
  • ExpertTemplate -- 可复用专家模板,通过 ExpertTemplateRegistry 管理,支持 YAML 定义
  • Expert -- 专家实例,包装 ConfigDrivenAgent支持 send_messagerequest_assisthandoff 操作
  • ExpertTeam -- 团队容器管理专家生命周期、SharedWorkspace、CollaborationPlan
  • TeamOrchestrator -- 计划执行引擎,支持串行/并行/竞争并行,每阶段独立重试,失败级联标记,最终回退到单 Agent
  • CollaborationPlan -- 协作计划PlanPhase 定义依赖关系、并行类型、合并策略,_phase_index O(1) 查找,迭代 DFS 检测循环依赖
  • ExpertTeamRouter -- @team:NAME 前缀路由,名称正则校验防注入(^[a-zA-Z0-9_-]{1,64}$),最多 10 个专家
  • HandoffTransport -- 专家间通信抽象InProcessHandoffTransportasyncio.Queue + sentinel 关闭)+ RedisHandoffTransportPub/Sub + 连接重置)
  • SharedWorkspace -- 跨专家共享上下文,支持读写键值对

团队生命周期FORMING -> PLANNING -> EXECUTING -> SYNTHESIZING -> COMPLETED。失败时自动回退到单 Agent 模式lead 或首个活跃专家)。

router/intent -- 意图路由(未接入 chat 流程)

IntentRouter 存在但未接入 chat 流程;当前 chat 请求由 RequestPreprocessor(详见 chat/request_preprocessor 模块详解)处理。本模块保留供未来扩展。

quality/gate -- 产出质量管理

四维质量检查:

维度 配置字段 说明
必填字段 required_fields 检查 output 中是否包含指定字段且非 None
最低字数 min_word_count 检查 output["content"] 的词数是否达标
Schema 校验 output_schema 使用 jsonschema 校验 output 结构
自定义验证 custom_validator 点分路径导入的验证函数,支持同步/异步

检查不通过时,如果 max_retries > 0BaseAgent.execute() 会自动重试,将质量反馈信息注入 quality_feedback 字段。

quality/cascade -- 级联检测与状态持久化

生产级故障防护:

  • CascadeDetector -- 检测 Agent 输出中的级联失败模式(连续失败、质量退化),及时熔断
  • CascadeStateStore -- 级联状态持久化InMemory/Redis 双后端,支持 session_ttl 配置
  • AlignmentGuard -- 消息质量管控,集成在 MemoryBus 中
  • 优雅降级 -- Redis 不可用时自动降级到 InMemory保持服务可用
  • close() 方法 -- 显式关闭 Redis 连接池,避免资源泄漏

quality/output -- 标准化输出

OutputStandardizer 将原始产出转换为 StandardOutput

  1. Schema 验证(如 output_schema 存在)
  2. 字段类型归一化str -> int/float/bool根据 schema 定义)
  3. 附加元数据version、produced_at、quality_score

quality_score = 通过的检查数 / 总检查数。

core/base -- BaseAgent

所有 Agent 的基类,定义标准生命周期:

  • execute(task) 为 final 方法包含完整的计时、try/except、TaskResult 构建
  • 子类只需实现 handle_task(task) -> dict
  • 生命周期钩子:on_task_start / on_task_complete / on_task_failed
  • 支持 Tool 插件、Memory 系统、LLM Gateway、Quality Gate 注入
  • 分布式模式:通过 Redis 实现心跳、任务监听、Agent Handoff

core/config_driven -- ConfigDrivenAgent

配置驱动的 Agent从 YAML/Dict 自动组装:

  • llm_generate: 渲染 Prompt -> 调用 LLM -> 解析 JSON 输出
  • tool_call: 调用注册的 Tool 并返回结果
  • custom: 自定义 handler 函数(点分路径动态导入)

v2 增强:接受 SkillConfig 时自动创建 Skill 并启用 ReAct 模式Quality Gate 自动集成。

core/agent_pool -- AgentPool

运行时 Agent 实例池,管理 Agent 的创建、获取、删除。支持从已注册的 Skill 创建 Agent。

memory -- 记忆系统

四层持久化记忆,基于 Markdown section 的 CRUD 操作:

  • MemoryFile -- 单个记忆文件SOUL/USER/MEMORY/DAILY支持 read_section/write_section/add_section/remove_section
  • MemoryStore -- 管理所有记忆文件,build_system_prompt() 将记忆注入 system_prompt
  • 即时刷新 -- notify_change() 回调机制MemoryTool 写入后自动刷新所有 Agent 的 system_prompt
  • 容量保护 -- trim_to_budget 按 section 边界裁剪,protected_sections 确保版本/更新历史不被裁剪
  • 原子写入 -- _update_soul 在内存中构建完整内容后一次性写入,避免先删后加导致数据丢失
  • RAG -- 向量嵌入 + 多源检索器,支持飞书/Confluence 适配器

记忆注入格式:

<agent-identity>
## 身份
我是AK一个专业的 AI 助手。
</agent-identity>

<user-profile>
## 基本信息
- 姓名:张三
</user-profile>

<agent-notes>
## 重要事项
...
</agent-notes>

<recent-activity>
## 2026-06-14
...
</recent-activity>

[base_prompt 行为指令]

evolution -- 自进化系统

反思驱动的 Agent 自我改进:

  • Reflector -- 任务完成后自动反思,生成 quality_score 和 suggestions
  • evolve_soul -- 累积反思达到阈值后触发 SOUL.md 更新,汇总所有反思建议(去重取 top 5
  • ExperienceStore -- 成功/失败经验持久化
  • PitfallDetector -- 陷阱检测,避免重复错误
  • PromptOptimizer -- 遗传算法优化 Prompt
  • PathOptimizer -- 分析工具调用路径,推荐更优策略
  • ABTester -- A/B 测试验证优化效果

bus -- 消息总线

进程内/跨进程消息传递:

  • MemoryBus -- 进程内同步消息总线,集成 CascadeDetector 和 AlignmentGuard 进行消息质量管控
  • RedisBus -- 基于 Redis Pub/Sub 的分布式消息总线,支持多实例部署

server -- FastAPI Server

独立部署模式,提供 RESTful API 和 Web GUI

路径 方法 说明
/ GET Web GUI 聊天界面
/ws/chat WebSocket GUI 实时聊天通道
/api/v1/agents POST 创建 Agent指定 skill_name 或 config
/api/v1/agents GET 列出所有 Agent
/api/v1/agents/{name} GET 获取 Agent 详情
/api/v1/agents/{name} DELETE 删除 Agent
/api/v1/tasks POST 提交任务(支持意图路由)
/api/v1/skills POST 注册 Skill
/api/v1/skills GET 列出所有 Skill
/api/v1/llm/usage GET 查询 LLM 用量
/api/v1/health GET 健康检查
/api/v1/auth/login POST 用户登录(用户名+密码 → JWT
/api/v1/auth/refresh POST 刷新 access_token
/api/v1/auth/logout POST 登出(吊销 refresh_token
/api/v1/auth/me GET 获取当前用户信息
/api/v1/llm/chat POST LLM 网关代理JWT 认证)
/api/v1/llm/chat/stream POST LLM 网关流式代理SSE
/api/v1/terminal/ws WS 本地终端 WebSocketJWT via ?token=
/api/v1/terminal/server/ws WS 服务端终端 WebSocket管理员审批
/api/v1/terminal/approvals GET 列出待审批命令(管理员)
/api/v1/terminal/approvals/{id}/approve POST 审批通过(管理员)
/api/v1/terminal/approvals/{id}/reject POST 审批拒绝(管理员)
/api/v1/terminal/whitelist/global GET/POST/DELETE 全局白名单管理(管理员)
/api/v1/terminal/whitelist/user GET/POST/DELETE 用户白名单管理
/api/v1/terminal/blocklist GET/POST/DELETE 黑名单管理(管理员)
/api/v1/terminal/audit-logs GET 审计日志查询(管理员,支持 terminal_mode 过滤)
/api/v1/system/resources GET 系统资源监控(需 SYSTEM_CONFIG 权限)
/api/v1/config/version GET 配置版本号(内容哈希)
/api/v1/config/all GET 全量配置(技能+工作流+Agent

Web GUI

通过 agentkit gui 启动8 个页面视图:

视图 说明
ChatView 实时对话WebSocket 流式传输,代码高亮,工具调用卡片,@-mention 技能推荐Expert Team 协作视图
EvolutionView 自进化仪表盘,任务/经验/指标/优化面板
WorkflowView 工作流编辑器Vue Flow 可视化编排
TerminalView 终端模拟器PTY 会话
KnowledgeBaseView 知识库管理,文档上传/搜索/源配置
SkillsView 技能市场,技能卡片/详情
SettingsView 系统设置
ComputerUseView 计算机使用,桌面操控

暗色主题:支持亮色/暗色/跟随系统三种模式CSS 变量 + Ant Design 暗色算法,通过导航栏灯泡图标切换,偏好持久化到 localStorage。

桌面客户端 (Tauri 2.x)

跨平台桌面应用,架构:

  • Rust Shell -- 窗口管理splash + main、系统托盘、单实例锁
  • Sidecar 管理 -- 以 --port 0 启动 Python 后端,解析 stdout 获取动态端口
  • 前端 -- Vue 3 SPA通过动态端口连接后端

orchestrator -- Pipeline 编排

多 Agent 协同编排模块:

  • PipelineEngine -- 按 Stage 定义顺序执行,支持自适应配置和反思重规划
  • SagaOrchestrator -- 分布式事务补偿,失败步骤自动执行补偿操作
  • DynamicPipeline -- 运行时根据条件动态调整流水线结构
  • HandoffManager -- Agent 间任务移交,支持上下文传递
  • PipelineStateMemory/Redis/PG -- 流水线状态持久化支持内存、Redis、PostgreSQL 后端

配置参考

SkillConfig

继承自 AgentConfig新增 v2 字段。

字段 类型 默认值 说明
name str (必填) Skill 名称,全局唯一标识
agent_type str (必填) Agent 类型
version str "1.0.0" 版本号
description str "" 描述
task_mode str "llm_generate" 任务模式:llm_generate / tool_call / custom
supported_tasks list[str] [agent_type] 支持的任务类型列表
max_concurrency int 1 最大并发数
input_schema dict None 输入 JSON Schema
output_schema dict None 输出 JSON Schema
prompt dict None Prompt 配置,包含 identity/context/instructions/constraints/output_format/examples
llm dict None LLM 配置,包含 model/temperature/max_tokens
tools list[str] [] 绑定的工具名称列表
memory dict None 记忆系统配置
custom_handler str None 自定义 handler 点分路径custom 模式必填)
intent dict None 意图配置(见 IntentConfig
quality_gate dict None 质量门禁配置(见 QualityGateConfig
execution_mode str "react" 执行模式:react / direct / custom
max_steps int 5 ReAct 最大步数

IntentConfig

字段 类型 默认值 说明
keywords list[str] [] 关键词列表,用于 Level 1 关键词匹配
description str "" Skill 描述,用于 Level 2 LLM 分类
examples list[str] [] 示例输入,辅助 LLM 分类

QualityGateConfig

字段 类型 默认值 说明
required_fields list[str] [] 必填字段列表
min_word_count int 0 最低字数要求0 表示不检查)
max_retries int 0 质量检查不通过时的最大重试次数
custom_validator str None 自定义验证器的点分路径,如 myapp.validators.check

LLMConfig

字段 类型 默认值 说明
providers dict[str, ProviderConfig] {} Provider 配置key 为 provider 名称
model_aliases dict[str, str] {} 模型别名映射,如 default: "dashscope/qwen3-coder-plus"
fallbacks dict[str, list[str]] {} 降级策略,如 dashscope/qwen3-coder-plus: ["openai/gpt-4o"]

ProviderConfig

字段 类型 默认值 说明
api_key str "" API Key
base_url str "" API Base URL
models dict[str, dict] {} 模型配置key 为模型名value 包含 cost_per_1k_input/cost_per_1k_output

与 GEO 项目集成

Mode A: HTTP API 集成

GEO 后端通过 HTTP 调用 AgentKit Server无需引入 Python 依赖。

+-------------------+       HTTP        +-------------------+
|   GEO Backend     |  -------------->  |  AgentKit Server  |
|   (FastAPI)       |  /api/v1/tasks   |  (FastAPI)        |
+-------------------+                   +-------------------+

集成步骤:

  1. 启动 AgentKit Server独立进程或 Docker 容器)
# agentkit_server.py
import uvicorn
from agentkit.server.app import create_app
from agentkit import LLMGateway
from agentkit.llm.providers.openai import OpenAIProvider

gateway = LLMGateway()
gateway.register_provider("dashscope", OpenAIProvider(
    api_key="sk-xxx",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
))

app = create_app(llm_gateway=gateway)
uvicorn.run(app, host="0.0.0.0", port=8001)
  1. 在 GEO 后端调用
# geo/backend/app/services/agentkit_client.py
import httpx

class AgentKitClient:
    def __init__(self, base_url: str = "http://localhost:8001"):
        self._client = httpx.AsyncClient(base_url=base_url)

    async def submit_task(self, skill_name: str, input_data: dict) -> dict:
        response = await self._client.post(
            "/api/v1/tasks",
            json={"skill_name": skill_name, "input_data": input_data},
        )
        response.raise_for_status()
        return response.json()

    async def register_skill(self, config: dict) -> dict:
        response = await self._client.post(
            "/api/v1/skills",
            json={"config": config},
        )
        response.raise_for_status()
        return response.json()
  1. 在 GEO 业务逻辑中使用
# geo/backend/app/services/content_service.py
from app.services.agentkit_client import AgentKitClient

agentkit = AgentKitClient()

async def generate_content(keyword: str, brand: str) -> dict:
    result = await agentkit.submit_task(
        skill_name="content_generator",
        input_data={"target_keyword": keyword, "brand_name": brand},
    )
    return result["data"]

开发指南

项目结构

fischer-agentkit/
├── src/agentkit/          # Python 后端
│   ├── bus/               # 消息总线MemoryBus + RedisBus
│   ├── chat/              # 聊天路由RequestPreprocessor + ExecutionMode
│   ├── cli/               # CLI 命令Typer
│   ├── client/            # 客户端 SDKConfigSync + RemoteLLMProvider 集成)
│   ├── core/              # 核心引擎ReAct/Reflexion/ReWOO/ConfigDriven + HandoffTransport
│   ├── evaluation/        # 评估系统RAGAS
│   ├── evolution/         # 自进化(反思/优化/陷阱检测/A/B测试
│   ├── experts/           # 专家团队Expert/Team/Orchestrator/Plan/Router/Config/Registry
│   ├── llm/               # LLM 网关6 Provider + 缓存 + 用量追踪 + RemoteLLMProvider
│   ├── marketplace/       # 多Agent市场拍卖/财富)
│   ├── mcp/               # MCP 协议
│   ├── memory/            # 记忆系统SOUL/USER/MEMORY/DAILY + RAG
│   ├── orchestrator/      # Pipeline 编排Saga/动态流水线)
│   ├── org/               # 组织发现
│   ├── prompts/           # Prompt 模板
│   ├── quality/           # 质量保障(对齐/级联检测/门控)
│   ├── router/            # 意图路由
│   ├── server/            # FastAPI 服务端 + Vue 3 前端
│   │   ├── auth/          # 认证子系统JWT + RBAC + 终端安全六层防护)
│   │   ├── routes/        # 22 个路由模块(含 auth/terminal_server/llm_gateway/config_sync
│   │   └── frontend/      # Vue 3 SPA含 LoginView/SystemMonitorPanel/WhitelistManager
│   ├── session/           # 会话管理
│   ├── skills/            # 技能系统
│   ├── telemetry/         # 遥测追踪
│   ├── tools/             # 工具插件21个含桌面操控
│   └── utils/             # 工具函数
├── src-tauri/             # Tauri 桌面客户端Rust
│   ├── src/               # main.rs + lib.rs + sidecar.rs + tray.rs
│   └── binaries/          # Sidecar 二进制(平台相关)
├── configs/               # 配置文件(技能/LLM/GEO
├── tests/                 # 测试unit + integration
├── docs/                  # 文档brainstorms + plans
├── Dockerfile             # Docker 镜像构建
├── docker-compose.yaml    # 生产编排
└── pyproject.toml         # Python 项目配置

常用开发命令

# 后端
pip install -e ".[dev]"           # 安装开发依赖
agentkit gui --port 8002          # 启动 Web GUI
agentkit serve --port 8001        # 启动 API 服务器
pytest                            # 运行全部测试
pytest -m "not integration"       # 仅单元测试
pytest --cov=agentkit             # 覆盖率
ruff check src/ && ruff format src/  # 代码检查和格式化

# 前端
cd src/agentkit/server/frontend
npm install                       # 安装依赖
npm run dev                       # Vite 开发服务器
npm run build:frontend            # 生产构建
npm run typecheck                 # TypeScript 类型检查

# 桌面客户端
cd src/agentkit/server/frontend
npm run tauri dev                  # Tauri 开发模式
npm run tauri build                # Tauri 生产构建

# Docker
docker-compose up -d              # 启动完整环境
docker-compose logs -f agentkit   # 查看日志

添加新 Skill

  1. 创建 YAML 配置文件
# configs/my_skill.yaml
name: my_skill
agent_type: my_task
task_mode: llm_generate
description: "我的自定义 Skill"
prompt:
  identity: "你是 xxx 助手"
  instructions: "执行 xxx 任务"
  output_format: "JSON: {result}"
llm:
  model: "deepseek"
  temperature: 0.7
intent:
  keywords: ["xxx", "yyy"]
  description: "xxx 任务"
quality_gate:
  required_fields: ["result"]
  max_retries: 2
execution_mode: react
max_steps: 5
  1. 加载并使用
from agentkit import SkillConfig, Skill, SkillRegistry

config = SkillConfig.from_yaml("configs/my_skill.yaml")
skill = Skill(config=config)
registry.register(skill)

添加新 Tool

  1. 创建 Tool 类
# myapp/tools/search.py
from agentkit.tools.base import Tool

class SearchTool(Tool):
    def __init__(self):
        super().__init__(
            name="search",
            description="搜索知识库",
            input_schema={
                "type": "object",
                "properties": {
                    "query": {"type": "string", "description": "搜索关键词"},
                    "top_k": {"type": "integer", "description": "返回数量", "default": 5},
                },
                "required": ["query"],
            },
        )

    async def execute(self, *, query: str, top_k: int = 5) -> dict:
        # 实现搜索逻辑
        results = await do_search(query, top_k)
        return {"results": results}
  1. 注册到 ToolRegistry
from agentkit.tools.registry import ToolRegistry

registry = ToolRegistry()
registry.register(SearchTool())
  1. 在 Skill 配置中引用
tools:
  - search

ShellTool 安全机制ShellTool 内置白名单(lscatcurl 等安全命令直接执行),非白名单命令会触发用户确认。在 GUI 中以确认卡片形式展示,用户点击"确认执行"后才运行。

代码风格

项目使用 Ruff 进行代码检查和格式化:

ruff check src/
ruff format src/

配置见 pyproject.toml 中的 [tool.ruff],目标 Python 3.11,行宽 100。