# 测试策略 **本文引用的文件** - [tests/conftest.py](file://tests/conftest.py) - [tests/test_auth.py](file://tests/test_auth.py) - [tests/test_business_flow.py](file://tests/test_business_flow.py) - [tests/test_citation_engine.py](file://tests/test_citation_engine.py) - [tests/test_citations.py](file://tests/test_citations.py) - [tests/test_content_agents.py](file://tests/test_content_agents.py) - [tests/test_llm_provider.py](file://tests/test_llm_provider.py) - [tests/test_pipeline_engine.py](file://tests/test_pipeline_engine.py) - [tests/test_platform_rules.py](file://tests/test_platform_rules.py) - [tests/test_prompt_template.py](file://tests/test_prompt_template.py) - [tests/test_queries.py](file://tests/test_queries.py) - [tests/test_rag_service.py](file://tests/test_rag_service.py) - [tests/test_scheduler.py](file://tests/test_scheduler.py) - [backend/tests/test_integration/test_full_flow.py](file://backend/tests/test_integration/test_full_flow.py) - [backend/app/main.py](file://backend/app/main.py) - [backend/app/api/deps.py](file://backend/app/api/deps.py) - [backend/app/services/auth.py](file://backend/app/services/auth.py) - [backend/app/workers/citation_engine.py](file://backend/app/workers/citation_engine.py) - [backend/app/workers/scheduler.py](file://backend/app/workers/scheduler.py) - [backend/app/api/auth.py](file://backend/app/api/auth.py) - [backend/app/api/citations.py](file://backend/app/api/citations.py) - [backend/app/api/queries.py](file://backend/app/api/queries.py) - [backend/app/database.py](file://backend/app/database.py) - [backend/app/config.py](file://backend/app/config.py) - [backend/app/agent_framework/agents/content_generator_agent.py](file://backend/app/agent_framework/agents/content_generator_agent.py) - [backend/app/agent_framework/agents/deai_agent.py](file://backend/app/agent_framework/agents/deai_agent.py) - [backend/app/agent_framework/agents/geo_optimizer_agent.py](file://backend/app/agent_framework/agents/geo_optimizer_agent.py) - [backend/app/agent_framework/pipeline/engine.py](file://backend/app/agent_framework/pipeline/engine.py) - [backend/app/agent_framework/pipeline/loader.py](file://backend/app/agent_framework/pipeline/loader.py) - [backend/app/services/llm/factory.py](file://backend/app/services/llm/factory.py) ## 更新摘要 **变更内容** - 新增代理框架测试章节,涵盖ContentGeneratorAgent、DeAIAgent、GEOOptimizerAgent的单元测试策略 - 新增LLM提供者测试章节,包括LLMFactory工厂模式测试、OpenAIProvider和DeepSeekProvider测试 - 新增管道引擎测试章节,涵盖PipelineLoader和PipelineEngine的单元测试策略 - 新增端到端工作流测试章节,涵盖完整业务流程的集成测试 - 完善测试最佳实践,增加代理框架测试、LLM提供者测试、管道引擎测试和端到端工作流测试的最佳实践指导 - 更新测试策略以反映新增的测试覆盖范围和架构扩展 ## 目录 1. [引言](#引言) 2. [项目结构](#项目结构) 3. [核心组件](#核心组件) 4. [架构总览](#架构总览) 5. [详细组件分析](#详细组件分析) 6. [代理框架测试策略](#代理框架测试策略) 7. [LLM提供者测试策略](#llm提供者测试策略) 8. [管道引擎测试策略](#管道引擎测试策略) 9. [端到端工作流测试策略](#端到端工作流测试策略) 10. [业务流程测试策略](#业务流程测试策略) 11. [调度器测试策略](#调度器测试策略) 12. [依赖分析](#依赖分析) 13. [性能考虑](#性能考虑) 14. [故障排查指南](#故障排查指南) 15. [结论](#结论) 16. [附录](#附录) ## 引言 本测试策略文档面向GEO项目的Pytest测试体系,覆盖单元测试、集成测试、业务流程测试和端到端工作流测试的设计与实施要点。内容包括:测试夹具与模拟对象的组织方式、测试数据管理策略、认证模块、引用引擎、查询处理、代理框架、LLM提供者、管道引擎、业务流程和调度器等关键功能的测试用例设计思路;同时给出测试最佳实践,包括覆盖率目标、持续集成配置建议以及测试环境管理方案,并提供调试技巧与性能测试方法。 ## 项目结构 测试目录位于仓库根目录下的tests,采用按功能模块划分的组织方式,配合Pytest的conftest集中式夹具与模拟对象,确保测试隔离与可重复性。后端应用以FastAPI为核心,API层通过依赖注入获取当前用户与数据库会话,服务层封装业务逻辑,工作器(worker)负责异步任务与平台适配。新增的代理框架、LLM提供者和管道引擎测试进一步完善了测试体系。 ```mermaid graph TB subgraph "测试层" C["tests/conftest.py"] TA["tests/test_auth.py"] TQ["tests/test_queries.py"] TC["tests/test_citations.py"] TCE["tests/test_citation_engine.py"] TB["tests/test_business_flow.py"] TS["tests/test_scheduler.py"] TCA["tests/test_content_agents.py"] TLP["tests/test_llm_provider.py"] TPE["tests/test_pipeline_engine.py"] TF["backend/tests/test_integration/test_full_flow.py"] end subgraph "后端应用" M["backend/app/main.py"] D["backend/app/api/deps.py"] DB["backend/app/database.py"] CFG["backend/app/config.py"] AUTH_API["backend/app/api/auth.py"] QUERIES_API["backend/app/api/queries.py"] CITATIONS_API["backend/app/api/citations.py"] CE["backend/app/workers/citation_engine.py"] QS["backend/app/workers/scheduler.py"] CGA["backend/app/agent_framework/agents/content_generator_agent.py"] DEAI["backend/app/agent_framework/agents/deai_agent.py"] GEO["backend/app/agent_framework/agents/geo_optimizer_agent.py"] PL["backend/app/agent_framework/pipeline/engine.py"] LOADER["backend/app/agent_framework/pipeline/loader.py"] FACTORY["backend/app/services/llm/factory.py"] end C --> TA C --> TQ C --> TC C --> TCE C --> TB C --> TS C --> TCA C --> TLP C --> TPE TF --> AUTH_API TF --> QUERIES_API TF --> CITATIONS_API TCA --> CGA TCA --> DEAI TCA --> GEO TLP --> FACTORY TPE --> PL TPE --> LOADER TA --> AUTH_API TQ --> QUERIES_API TC --> CITATIONS_API TCE --> CE TS --> QS AUTH_API --> D QUERIES_API --> D CITATIONS_API --> D D --> DB DB --> CFG M --> AUTH_API M --> QUERIES_API M --> CITATIONS_API ``` **图表来源** - [tests/conftest.py:1-123](file://tests/conftest.py#L1-L123) - [backend/app/main.py:1-56](file://backend/app/main.py#L1-L56) - [backend/app/api/deps.py:1-43](file://backend/app/api/deps.py#L1-L43) - [backend/app/api/auth.py:1-43](file://backend/app/api/auth.py#L1-L43) - [backend/app/api/queries.py:1-86](file://backend/app/api/queries.py#L1-L86) - [backend/app/api/citations.py:1-78](file://backend/app/api/citations.py#L1-L78) - [backend/app/workers/citation_engine.py:1-309](file://backend/app/workers/citation_engine.py#L1-L309) - [backend/app/workers/scheduler.py:1-182](file://backend/app/workers/scheduler.py#L1-L182) - [backend/app/database.py:1-29](file://backend/app/database.py#L1-L29) - [backend/app/config.py:1-23](file://backend/app/config.py#L1-L23) - [backend/app/agent_framework/agents/content_generator_agent.py:1-299](file://backend/app/agent_framework/agents/content_generator_agent.py#L1-L299) - [backend/app/agent_framework/agents/deai_agent.py:1-156](file://backend/app/agent_framework/agents/deai_agent.py#L1-L156) - [backend/app/agent_framework/agents/geo_optimizer_agent.py:1-198](file://backend/app/agent_framework/agents/geo_optimizer_agent.py#L1-L198) - [backend/app/agent_framework/pipeline/engine.py:1-536](file://backend/app/agent_framework/pipeline/engine.py#L1-L536) - [backend/app/agent_framework/pipeline/loader.py:1-283](file://backend/app/agent_framework/pipeline/loader.py#L1-L283) - [backend/app/services/llm/factory.py:1-66](file://backend/app/services/llm/factory.py#L1-L66) **章节来源** - [tests/conftest.py:1-123](file://tests/conftest.py#L1-L123) - [backend/app/main.py:1-56](file://backend/app/main.py#L1-L56) ## 核心组件 - 测试夹具与模拟 - 会话级调度器模拟:在测试启动时替换查询调度器,避免真实后台任务影响测试稳定性。 - 用户与令牌:提供模拟用户对象、JWT访问令牌及请求头,便于认证相关接口测试。 - 异步HTTP客户端:基于ASGI传输创建异步HTTP客户端,用于端到端API测试。 - 依赖覆盖:通过依赖注入覆盖当前用户解析逻辑,简化认证流程。 - 内存数据库:使用SQLite内存数据库进行集成测试,确保测试隔离性。 - FakeLLMProvider:自定义FakeLLMProvider类,模拟LLM调用返回预设响应,避免真实网络请求。 - AsyncMock:广泛使用AsyncMock替代真实异步操作,确保测试的确定性和可重复性。 - 测试数据管理 - 使用pytest fixture生成模拟模型对象(如查询、引用记录),保证测试数据一致性与可读性。 - 通过patch对服务层函数进行桩替,隔离外部依赖,提升测试确定性。 - 直接操作数据库模型进行复杂场景测试,如权限隔离和统计计算。 - 代理框架测试中使用TaskMessage构建测试任务,模拟Agent执行流程。 - 测试运行与并发 - 使用pytest-asyncio标记异步测试,确保事件循环正确初始化与清理。 - 支持并行执行多个测试文件,提高测试执行效率。 - 管道引擎测试中使用dry-run模式,通过dispatcher=None实现无真实任务分发的测试。 **章节来源** - [tests/conftest.py:19-123](file://tests/conftest.py#L19-L123) - [tests/test_content_agents.py:26-54](file://tests/test_content_agents.py#L26-L54) - [tests/test_pipeline_engine.py:148-166](file://tests/test_pipeline_engine.py#L148-L166) ## 架构总览 下图展示了测试与被测系统的交互关系:测试通过异步HTTP客户端直接调用FastAPI路由,路由依赖当前用户与数据库会话,服务层完成业务逻辑,工作器负责平台查询与品牌匹配。新增的代理框架测试通过FakeLLMProvider模拟LLM调用,管道引擎测试通过dry-run模式验证Pipeline执行流程。 ```mermaid sequenceDiagram participant T as "测试用例" participant AC as "异步HTTP客户端" participant APP as "FastAPI应用" participant R_AUTH as "认证路由" participant R_QUERIES as "查询路由" participant R_CIT as "引用路由" participant DEPS as "依赖注入(get_current_user)" participant SVC as "服务层" participant DB as "数据库" T->>AC : 发起HTTP请求 AC->>APP : ASGI传输调用 APP->>DEPS : 解析当前用户 DEPS->>DB : 查询用户 DB-->>DEPS : 返回用户 APP->>R_AUTH : 认证相关端点 APP->>R_QUERIES : 查询相关端点 APP->>R_CIT : 引用相关端点 R_AUTH->>SVC : 调用服务 R_QUERIES->>SVC : 调用服务 R_CIT->>SVC : 调用服务 SVC->>DB : 数据持久化/查询 DB-->>SVC : 返回结果 SVC-->>APP : 返回响应 APP-->>AC : 序列化响应 AC-->>T : 断言结果 ``` **图表来源** - [tests/conftest.py:117-123](file://tests/conftest.py#L117-L123) - [backend/app/main.py:38-42](file://backend/app/main.py#L38-L42) - [backend/app/api/deps.py:16-43](file://backend/app/api/deps.py#L16-L43) - [backend/app/api/auth.py:13-43](file://backend/app/api/auth.py#L13-L43) - [backend/app/api/queries.py:15-86](file://backend/app/api/queries.py#L15-L86) - [backend/app/api/citations.py:25-78](file://backend/app/api/citations.py#L25-L78) - [backend/app/database.py:23-29](file://backend/app/database.py#L23-L29) ## 详细组件分析 ### 认证模块测试策略 - 测试目标 - 注册成功与重复邮箱错误处理 - 登录成功与密码错误场景 - 当前用户信息获取(已认证与未认证) - 关键测试点 - 使用patch对注册与登录服务函数进行桩替,控制返回值与异常 - 通过依赖覆盖与令牌头验证路由鉴权中间件行为 - 用例设计要点 - 成功路径断言状态码与响应体字段 - 失败路径断言HTTP状态码与错误详情 - 未认证路径断言401并检查依赖覆盖清理 ```mermaid sequenceDiagram participant T as "测试用例" participant AC as "异步HTTP客户端" participant AUTH as "认证路由" participant SVC as "认证服务" participant DEPS as "依赖注入(get_current_user)" T->>AC : POST /api/v1/auth/register AC->>AUTH : 路由处理 AUTH->>SVC : 注册服务 SVC-->>AUTH : 返回用户或抛出异常 AUTH-->>AC : 201/400 AC-->>T : 断言 T->>AC : POST /api/v1/auth/login AC->>AUTH : 路由处理 AUTH->>SVC : 登录服务 SVC-->>AUTH : 返回用户或None AUTH-->>AC : 200/401 AC-->>T : 断言 T->>AC : GET /api/v1/auth/me AC->>AUTH : 路由处理 AUTH->>DEPS : 解析当前用户 DEPS-->>AUTH : 返回用户或抛出401 AUTH-->>AC : 200/401 AC-->>T : 断言 ``` **图表来源** - [tests/test_auth.py:25-104](file://tests/test_auth.py#L25-L104) - [backend/app/api/auth.py:13-43](file://backend/app/api/auth.py#L13-L43) - [backend/app/services/auth.py:37-69](file://backend/app/services/auth.py#L37-L69) - [backend/app/api/deps.py:16-43](file://backend/app/api/deps.py#L16-L43) **章节来源** - [tests/test_auth.py:1-104](file://tests/test_auth.py#L1-L104) - [backend/app/api/auth.py:1-43](file://backend/app/api/auth.py#L1-L43) - [backend/app/services/auth.py:1-69](file://backend/app/services/auth.py#L1-L69) - [backend/app/api/deps.py:1-43](file://backend/app/api/deps.py#L1-L43) ### 引擎与查询处理测试策略 - 测试目标 - 品牌匹配器:精确、别名、模糊匹配与无匹配场景 - 竞争品牌检测器:在文本中识别除目标品牌外的竞争品牌 - 引擎执行流程:单平台查询、任务状态更新、记录创建与异常处理 - 关键测试点 - 单元测试直接构造BrandMatcher与CompetitorDetector,断言匹配结果与置信度、位置等字段 - 集成测试通过patch平台适配器返回AI响应,验证引擎整合后的综合输出 - 用例设计要点 - 文本分段与位置提取:验证引用出现在第几段及上下文截取 - 平台适配器替换:确保引擎执行单平台流程时能捕获异常并写入失败记录 ```mermaid classDiagram class BrandMatcher { +match(text) dict -_extract_candidates(text) list -_extract_position_and_context(text, keyword) tuple } class CompetitorDetector { +detect(text, target_brand) list } class CitationEngine { +execute_query(query, db) list +execute_single_platform(keyword, platform, target_brand, brand_aliases) dict -_get_or_create_task(db, query_id, platform) QueryTask -_calculate_next_query_at(frequency) datetime +close() void } BrandMatcher <.. CitationEngine : "使用" CompetitorDetector <.. CitationEngine : "使用" ``` **图表来源** - [backend/app/workers/citation_engine.py:19-120](file://backend/app/workers/citation_engine.py#L19-L120) - [backend/app/workers/citation_engine.py:122-146](file://backend/app/workers/citation_engine.py#L122-L146) - [backend/app/workers/citation_engine.py:148-309](file://backend/app/workers/citation_engine.py#L148-L309) **章节来源** - [tests/test_citation_engine.py:1-127](file://tests/test_citation_engine.py#L1-L127) - [backend/app/workers/citation_engine.py:1-309](file://backend/app/workers/citation_engine.py#L1-L309) ### 引用数据与报告测试策略 - 测试目标 - 引用列表查询与统计聚合 - 立即运行查询任务 - CSV导出格式与响应头校验 - 关键测试点 - 通过patch服务函数返回预设数据,断言分页、总数与字段 - 校验CSV内容类型、附件头与关键字段存在性 - 用例设计要点 - 统计聚合断言整体指标与按平台细分 - 导出接口断言响应头与正文内容 ```mermaid sequenceDiagram participant T as "测试用例" participant AC as "异步HTTP客户端" participant CIT as "引用路由" participant REP as "报告路由" participant SVC as "服务层" T->>AC : GET /api/v1/citations/?skip=&limit= AC->>CIT : 路由处理 CIT->>SVC : 获取引用列表 SVC-->>CIT : 返回(items,total) CIT-->>AC : 200 + JSON AC-->>T : 断言 T->>AC : GET /api/v1/citations/stats AC->>CIT : 路由处理 CIT->>SVC : 获取统计 SVC-->>CIT : 返回统计聚合 CIT-->>AC : 200 + JSON AC-->>T : 断言 T->>AC : GET /api/v1/reports/export/csv?query_id= AC->>REP : 路由处理 REP->>SVC : 导出CSV SVC-->>REP : 返回CSV字符串 REP-->>AC : 200 + text/csv + attachment AC-->>T : 断言 ``` **图表来源** - [tests/test_citations.py:23-93](file://tests/test_citations.py#L23-L93) - [backend/app/api/citations.py:25-78](file://backend/app/api/citations.py#L25-L78) **章节来源** - [tests/test_citations.py:1-93](file://tests/test_citations.py#L1-L93) - [backend/app/api/citations.py:1-78](file://backend/app/api/citations.py#L1-L78) ### 查询管理测试策略 - 测试目标 - 创建查询(含配额限制场景) - 列表查询与分页 - 更新查询(字段变更) - 删除查询 - 查询不存在与跨用户访问控制 - 关键测试点 - 通过patch服务函数返回模拟查询对象或抛出权限异常 - 断言HTTP状态码与响应体字段 - 用例设计要点 - 权限异常断言403与错误详情 - 跨用户访问断言404(模拟查询归属判定) ```mermaid sequenceDiagram participant T as "测试用例" participant AC as "异步HTTP客户端" participant Q as "查询路由" participant SVC as "服务层" T->>AC : POST /api/v1/queries/ AC->>Q : 路由处理 Q->>SVC : 创建查询 SVC-->>Q : 返回查询或抛出权限异常 Q-->>AC : 201/403 AC-->>T : 断言 T->>AC : GET /api/v1/queries/?skip=&limit= AC->>Q : 路由处理 Q->>SVC : 获取查询列表 SVC-->>Q : 返回(items,total) Q-->>AC : 200 + JSON AC-->>T : 断言 T->>AC : PUT /api/v1/queries/{id} AC->>Q : 路由处理 Q->>SVC : 更新查询 SVC-->>Q : 返回更新后的查询或None Q-->>AC : 200/404 AC-->>T : 断言 T->>AC : DELETE /api/v1/queries/{id} AC->>Q : 路由处理 Q->>SVC : 删除查询 SVC-->>Q : 返回True/False Q-->>AC : 204/404 AC-->>T : 断言 ``` **图表来源** - [tests/test_queries.py:29-154](file://tests/test_queries.py#L29-L154) - [backend/app/api/queries.py:15-86](file://backend/app/api/queries.py#L15-L86) **章节来源** - [tests/test_queries.py:1-154](file://tests/test_queries.py#L1-L154) - [backend/app/api/queries.py:1-86](file://backend/app/api/queries.py#L1-L86) ## 代理框架测试策略 ### 测试目标 代理框架测试专注于验证GEO平台的智能代理执行逻辑,包括内容生成代理、去AI化代理和GEO优化代理的功能完整性、错误处理能力和与LLM提供者的集成测试。 ### 关键测试场景 - **ContentGeneratorAgent测试**:选题生成、文章生成、RAG知识检索、JSON解析、错误处理 - **DeAIAgent测试**:内容去AI化处理、温度参数验证、输入验证 - **GEOOptimizerAgent测试**:SEO/GEO优化、JSON降级处理、关键词注入 - **FakeLLMProvider测试**:模拟LLM调用、流式响应、错误模拟 ### 测试实现策略 - **FakeLLMProvider**:自定义FakeLLMProvider类,模拟LLM调用返回预设响应,避免真实网络请求 - **AsyncMock**:广泛使用AsyncMock替代Redis、数据库和RAG服务调用 - **patch技术**:通过patch替换LLMFactory.get_default和RAGService,隔离外部依赖 - **TaskMessage构建**:使用_test_make_task辅助函数创建测试任务消息 ```mermaid classDiagram class ContentGeneratorAgent { +execute(task) TaskResult +_generate_topics(task) dict +_generate_article(task) dict +_retrieve_knowledge(kb_ids, query) str +_extract_json(text) str } class DeAIAgent { +execute(task) TaskResult +_process(task) dict } class GEOOptimizerAgent { +execute(task) TaskResult +_optimize(task) dict +_extract_json(text) str } class FakeLLMProvider { +chat(messages, **kwargs) LLMResponse +chat_stream(messages, **kwargs) AsyncGenerator +provider_name str +model_name str +max_context_length int } ContentGeneratorAgent --> FakeLLMProvider : "使用" DeAIAgent --> FakeLLMProvider : "使用" GEOOptimizerAgent --> FakeLLMProvider : "使用" ``` **图表来源** - [tests/test_content_agents.py:26-54](file://tests/test_content_agents.py#L26-L54) - [tests/test_content_agents.py:75-116](file://tests/test_content_agents.py#L75-L116) - [tests/test_content_agents.py:200-236](file://tests/test_content_agents.py#L200-L236) - [tests/test_content_agents.py:268-320](file://tests/test_content_agents.py#L268-L320) ### 测试用例设计要点 - **内容生成测试**:验证topics字段解析、article内容生成、word count计算、usage统计 - **RAG集成测试**:通过AsyncSessionLocal mock验证知识检索上下文注入 - **错误处理测试**:模拟LLMError验证failed状态返回和错误消息处理 - **温度参数测试**:验证DeAIAgent的temperature=0.9配置 - **JSON解析测试**:测试```json```包裹和普通文本两种输出格式 **章节来源** - [tests/test_content_agents.py:1-358](file://tests/test_content_agents.py#L1-L358) - [backend/app/agent_framework/agents/content_generator_agent.py:1-299](file://backend/app/agent_framework/agents/content_generator_agent.py#L1-L299) - [backend/app/agent_framework/agents/deai_agent.py:1-156](file://backend/app/agent_framework/agents/deai_agent.py#L1-L156) - [backend/app/agent_framework/agents/geo_optimizer_agent.py:1-198](file://backend/app/agent_framework/agents/geo_optimizer_agent.py#L1-L198) ## LLM提供者测试策略 ### 测试目标 LLM提供者测试专注于验证GEO平台的LLM抽象层,包括工厂模式、OpenAIProvider和DeepSeekProvider的功能完整性、错误处理和流式响应处理。 ### 关键测试场景 - **LLMFactory测试**:工厂创建、默认提供者选择、未知提供者处理、提供者列表 - **OpenAIProvider测试**:聊天响应、重试机制、错误处理、SSE流解析 - **DeepSeekProvider测试**:基础功能验证、与OpenAIProvider对比 - **LLMResponse测试**:响应结构验证、usage统计 ### 测试实现策略 - **环境变量设置**:通过monkeypatch设置OPENAI_API_KEY和DEEPSEEK_API_KEY - **httpx模拟**:使用MagicMock模拟HTTP响应,测试各种状态码场景 - **AsyncMock**:模拟异步HTTP客户端和SSE流响应 - **重试机制测试**:通过patch asyncio.sleep避免真实等待时间 ```mermaid classDiagram class LLMFactory { +create(provider, model) LLMProvider +get_default() LLMProvider +list_providers() list[str] +register(name, provider_cls) void } class OpenAIProvider { +chat(messages) LLMResponse +chat_stream(messages) AsyncGenerator +provider_name str +model_name str +max_context_length int } class DeepSeekProvider { +chat(messages) LLMResponse +chat_stream(messages) AsyncGenerator +provider_name str +model_name str +max_context_length int } class LLMProvider { <> +chat(messages) LLMResponse +chat_stream(messages) AsyncGenerator +provider_name str +model_name str +max_context_length int } LLMFactory --> LLMProvider : "创建" LLMProvider <|-- OpenAIProvider LLMProvider <|-- DeepSeekProvider ``` **图表来源** - [tests/test_llm_provider.py:24-67](file://tests/test_llm_provider.py#L24-L67) - [tests/test_llm_provider.py:94-153](file://tests/test_llm_provider.py#L94-L153) - [tests/test_llm_provider.py:200-204](file://tests/test_llm_provider.py#L200-L204) - [backend/app/services/llm/factory.py:8-66](file://backend/app/services/llm/factory.py#L8-L66) ### 测试用例设计要点 - **工厂模式测试**:验证create方法、默认提供者、未知提供者异常处理 - **HTTP响应测试**:模拟200、429、401等不同状态码的处理逻辑 - **重试机制测试**:验证429速率限制的重试行为和401不可重试的处理 - **流式响应测试**:验证SSE流的逐token解析和完成信号处理 - **响应结构测试**:验证LLMResponse的字段完整性和默认值 **章节来源** - [tests/test_llm_provider.py:1-205](file://tests/test_llm_provider.py#L1-L205) - [backend/app/services/llm/factory.py:1-66](file://backend/app/services/llm/factory.py#L1-L66) ## 管道引擎测试策略 ### 测试目标 管道引擎测试专注于验证GEO平台的Pipeline编排能力,包括YAML加载、DAG验证、拓扑排序、变量解析和dry-run执行模式。 ### 关键测试场景 - **PipelineLoader测试**:YAML加载、DAG验证、拓扑排序、变量解析 - **PipelineEngine测试**:dry-run模式、阶段执行、超时处理、重试机制 - **变量解析测试**:简单变量替换、嵌套路径解析、上下文传递 - **依赖关系测试**:有环图检测、无环图验证、执行顺序保证 ### 测试实现策略 - **YAML模板**:使用textwrap.dedent创建测试用YAML配置 - **dry-run模式**:通过dispatcher=None实现无真实任务分发的测试 - **AsyncMock**:模拟Agent执行和任务状态查询 - **拓扑排序**:验证依赖关系的正确执行顺序 ```mermaid classDiagram class PipelineLoader { +load(pipeline_name) Pipeline +load_from_yaml(yaml_content, pipeline_name) Pipeline +validate_dag(stages) bool +resolve_variables(template, context) Any } class PipelineEngine { +execute(pipeline, context) PipelineResult +_execute_stage(stage, exec_context, stages_context) StageResult +_topological_sort(stages) list[PipelineStage] +_resolve_stage_inputs(inputs, context) dict +_should_skip(stage, failed_stages, skipped_stages) bool +_evaluate_condition(condition, exec_context, stages_context) bool +_extract_outputs(stage, output_data) dict } class Pipeline { +name str +version str +description str +variables dict +stages list[PipelineStage] } class PipelineStage { +name str +agent str +action str +depends_on list[str] +inputs dict +outputs list[str] +timeout_seconds int +retry_count int +condition str +continue_on_failure bool } PipelineLoader --> Pipeline : "创建" PipelineEngine --> Pipeline : "执行" Pipeline --> PipelineStage : "包含" ``` **图表来源** - [tests/test_pipeline_engine.py:55-98](file://tests/test_pipeline_engine.py#L55-L98) - [tests/test_pipeline_engine.py:148-223](file://tests/test_pipeline_engine.py#L148-L223) - [backend/app/agent_framework/pipeline/loader.py:41-134](file://backend/app/agent_framework/pipeline/loader.py#L41-L134) - [backend/app/agent_framework/pipeline/engine.py:31-176](file://backend/app/agent_framework/pipeline/engine.py#L31-L176) ### 测试用例设计要点 - **YAML加载测试**:验证正常YAML的解析和Pipeline对象创建 - **DAG验证测试**:测试有环图的异常处理和无环图的验证通过 - **变量解析测试**:验证${var}和${stages.step1.outputs.result}等变量引用 - **dry-run模式测试**:验证无dispatcher时的模拟执行和结果收集 - **超时和重试测试**:验证阶段级别的超时控制和重试机制 **章节来源** - [tests/test_pipeline_engine.py:1-255](file://tests/test_pipeline_engine.py#L1-L255) - [backend/app/agent_framework/pipeline/loader.py:1-283](file://backend/app/agent_framework/pipeline/loader.py#L1-L283) - [backend/app/agent_framework/pipeline/engine.py:1-536](file://backend/app/agent_framework/pipeline/engine.py#L1-L536) ## 端到端工作流测试策略 ### 测试目标 端到端工作流测试专注于验证GEO平台的完整业务流程,包括品牌查询、竞争品牌管理、引用数据收集、评分计算和CSV导出的完整链路。 ### 关键测试场景 - **完整品牌查询流程**:品牌创建、竞争品牌添加、查询创建、引用数据模拟、评分计算、历史记录、统计聚合 - **CSV导出流程**:品牌创建、查询创建、引用数据创建、CSV导出、内容验证 - **错误处理流程**:不存在的品牌ID处理、404错误验证 ### 测试实现策略 - **异步数据库**:使用SQLite内存数据库和async_sessionmaker - **依赖覆盖**:通过app.dependency_overrides覆盖get_db和get_current_user - **测试数据构建**:直接操作模型类创建测试数据 - **HTTP客户端**:使用AsyncClient和ASGITransport进行端到端测试 ```mermaid sequenceDiagram participant T as "端到端测试" participant AC as "AsyncClient" participant API as "FastAPI路由" participant DB as "异步数据库" T->>AC : POST /api/v1/brands/ AC->>API : 品牌创建 API->>DB : 插入品牌记录 API-->>AC : 201 + 品牌数据 T->>AC : POST /api/v1/brands/{brand_id}/competitors/ AC->>API : 添加竞争品牌 API->>DB : 插入竞争品牌记录 API-->>AC : 201 + 竞争品牌数据 T->>AC : POST /api/v1/queries/ AC->>API : 创建查询 API->>DB : 插入查询记录 API-->>AC : 201 + 查询数据 T->>AC : POST /api/v1/citations/ AC->>API : 创建引用记录 API->>DB : 插入引用记录 API-->>AC : 201 + 引用数据 T->>AC : GET /api/v1/brands/{brand_id}/score/ AC->>API : 获取品牌评分 API->>DB : 查询引用统计 API-->>AC : 200 + 评分数据 ``` **图表来源** - [backend/tests/test_integration/test_full_flow.py:94-223](file://backend/tests/test_integration/test_full_flow.py#L94-L223) - [backend/tests/test_integration/test_full_flow.py:228-298](file://backend/tests/test_integration/test_full_flow.py#L228-L298) ### 测试用例设计要点 - **数据隔离**:使用独立的异步数据库连接和会话 - **依赖注入**:通过dependency_overrides确保测试环境的一致性 - **流程完整性**:覆盖从品牌创建到最终评分的完整业务流程 - **数据验证**:验证统计计算的准确性,如提及率、引用率等指标 - **CSV内容验证**:验证导出文件的格式和关键字段存在性 **章节来源** - [backend/tests/test_integration/test_full_flow.py:1-322](file://backend/tests/test_integration/test_full_flow.py#L1-L322) ## 业务流程测试策略 ### 测试目标 业务流程测试旨在验证GEO应用的核心业务场景,包括用户完整注册登录流程、查询词生命周期管理、权限隔离机制、配额限制控制、统计计算准确性以及CSV导出功能。 ### 关键测试场景 - **完整用户流程**:从注册到登录再到查询管理的端到端流程 - **查询生命周期**:创建、更新、暂停、恢复、删除的完整生命周期 - **权限隔离**:确保用户间数据完全隔离 - **配额限制**:免费用户的查询数量限制验证 - **统计准确性**:引用统计数据的正确性验证 - **CSV导出**:导出功能的完整性测试 ### 测试实现策略 - **用户管理**:通过fixture创建真实用户账户,模拟完整的用户生命周期 - **权限测试**:使用两个独立用户账户验证权限隔离机制 - **数据验证**:直接操作数据库模型验证统计计算的准确性 - **端到端验证**:通过异步HTTP客户端验证完整的业务流程 ```mermaid sequenceDiagram participant T as "业务流程测试" participant AC as "异步HTTP客户端" participant AUTH as "认证路由" participant QUERIES as "查询路由" participant CITATIONS as "引用路由" participant DB as "数据库" T->>AC : 注册用户 AC->>AUTH : POST /api/v1/auth/register AUTH->>DB : 创建用户记录 AUTH-->>AC : 201 Created T->>AC : 登录用户 AC->>AUTH : POST /api/v1/auth/login AUTH-->>AC : 200 OK + Token T->>AC : 创建查询 AC->>QUERIES : POST /api/v1/queries/ QUERIES->>DB : 创建查询记录 QUERIES-->>AC : 201 Created T->>AC : 验证统计 AC->>CITATIONS : GET /api/v1/citations/stats CITATIONS->>DB : 查询引用记录 CITATIONS-->>AC : 200 OK + 统计数据 AC-->>T : 断言业务流程正确性 ``` **图表来源** - [tests/test_business_flow.py:83-126](file://tests/test_business_flow.py#L83-L126) - [tests/test_business_flow.py:131-186](file://tests/test_business_flow.py#L131-L186) - [tests/test_business_flow.py:192-222](file://tests/test_business_flow.py#L192-L222) - [tests/test_business_flow.py:228-296](file://tests/test_business_flow.py#L228-L296) ### 测试用例设计要点 - **用户隔离**:使用独立fixture创建多个用户,确保权限测试的准确性 - **数据完整性**:通过直接操作数据库模型验证统计计算的正确性 - **流程完整性**:覆盖业务流程的所有关键节点和异常场景 - **边界条件**:测试配额限制、权限边界等关键边界条件 **章节来源** - [tests/test_business_flow.py:1-441](file://tests/test_business_flow.py#L1-L441) ## 调度器测试策略 ### 测试目标 调度器测试专注于验证查询调度器的定时任务执行能力,包括调度器的启动/关闭、查询任务筛选机制、频率计算逻辑以及遗留任务处理功能。 ### 关键测试场景 - **调度器生命周期**:启动、正常运行和优雅关闭 - **查询筛选机制**:仅执行活跃且到期的查询任务 - **频率计算**:daily和weekly频率的next_query_at计算 - **遗留任务处理**:处理超过1分钟未执行的pending任务 - **异常处理**:查询执行失败时的异常处理和日志记录 ### 测试实现策略 - **调度器控制**:通过patch替换真实的APScheduler,使用AsyncMock控制调度器行为 - **数据库隔离**:使用独立的测试会话,确保调度器测试不影响其他测试 - **时间控制**:通过精确的时间戳控制查询的到期状态 - **频率验证**:使用datetime.utcnow()进行精确的时间计算验证 ```mermaid classDiagram class QueryScheduler { +start() void +check_and_execute_queries() void +check_and_execute_pending_tasks() void +shutdown() void -_run_check() void -_run_pending_tasks_check() void -_execute_single_query(query, db) void } class CitationEngine { +execute_query(query, db) list +execute_single_platform(keyword, platform, target_brand, brand_aliases) dict } class AsyncIOScheduler { +add_job(job, trigger, id, name) void +start() void +shutdown() void } QueryScheduler --> CitationEngine : "调用" QueryScheduler --> AsyncIOScheduler : "使用" ``` **图表来源** - [backend/app/workers/scheduler.py:27-182](file://backend/app/workers/scheduler.py#L27-L182) ### 测试用例设计要点 - **调度器生命周期**:验证调度器启动时添加的定时任务和名称 - **查询筛选**:通过创建不同状态和到期时间的查询验证筛选逻辑 - **频率计算**:使用绝对误差容差验证next_query_at的计算精度 - **遗留任务处理**:验证pending任务的兜底处理机制 - **异常处理**:确保查询执行失败时不会中断整个调度流程 **章节来源** - [tests/test_scheduler.py:1-123](file://tests/test_scheduler.py#L1-L123) - [backend/app/workers/scheduler.py:1-182](file://backend/app/workers/scheduler.py#L1-L182) ## 依赖分析 - 测试与被测模块耦合 - 测试通过ASGI传输直接调用路由,避免引入额外适配层 - 通过依赖覆盖与patch解耦服务层与数据库、第三方平台 - 业务流程测试直接操作数据库模型,确保测试数据的准确性 - 代理框架测试通过FakeLLMProvider和AsyncMock解耦LLM调用 - LLM提供者测试通过httpx模拟和AsyncMock解耦HTTP请求 - 管道引擎测试通过dry-run模式解耦真实任务分发 - 外部依赖与集成点 - 数据库:通过异步引擎与会话管理,测试中可使用内存数据库或独立测试库 - JWT:通过服务层令牌生成与校验,测试中直接构造令牌头 - 平台适配器:通过patch替换,避免真实网络请求 - 调度器:通过patch替换真实的APScheduler,使用AsyncMock控制调度行为 - LLM提供者:通过LLMFactory统一管理,测试中可通过patch替换具体实现 - 循环依赖与风险 - 当前结构清晰,无明显循环依赖;注意在测试中避免对真实调度器的依赖 ```mermaid graph LR T_AUTH["测试: 认证"] --> A_AUTH["路由: 认证"] T_QUERIES["测试: 查询"] --> A_QUERIES["路由: 查询"] T_CIT["测试: 引用"] --> A_CIT["路由: 引用"] T_BUSINESS["测试: 业务流程"] --> A_QUERIES T_BUSINESS --> A_CIT T_SCHED["测试: 调度器"] --> QS["调度器: QueryScheduler"] T_AGENTS["测试: 代理框架"] --> CGA["代理: ContentGeneratorAgent"] T_AGENTS --> DEAI["代理: DeAIAgent"] T_AGENTS --> GEO["代理: GEOOptimizerAgent"] T_LLM["测试: LLM提供者"] --> FACTORY["工厂: LLMFactory"] T_PIPE["测试: 管道引擎"] --> ENGINE["引擎: PipelineEngine"] T_FULL["测试: 端到端"] --> A_AUTH T_FULL --> A_QUERIES T_FULL --> A_CIT A_AUTH --> S_AUTH["服务: 认证"] A_QUERIES --> S_QUERY["服务: 查询"] A_CIT --> S_CIT["服务: 引用"] S_AUTH --> DB["数据库"] S_QUERY --> DB S_CIT --> DB QS --> CE["引擎: CitationEngine"] QS --> DB CGA --> LLM["LLM提供者"] DEAI --> LLM GEO --> LLM ENGINE --> LOADER["加载器: PipelineLoader"] DB --> CFG["配置"] ``` **图表来源** - [tests/test_auth.py:1-104](file://tests/test_auth.py#L1-L104) - [tests/test_business_flow.py:1-441](file://tests/test_business_flow.py#L1-L441) - [tests/test_scheduler.py:1-123](file://tests/test_scheduler.py#L1-L123) - [tests/test_content_agents.py:1-358](file://tests/test_content_agents.py#L1-L358) - [tests/test_llm_provider.py:1-205](file://tests/test_llm_provider.py#L1-L205) - [tests/test_pipeline_engine.py:1-255](file://tests/test_pipeline_engine.py#L1-L255) - [backend/tests/test_integration/test_full_flow.py:1-322](file://backend/tests/test_integration/test_full_flow.py#L1-L322) - [backend/app/api/auth.py:1-43](file://backend/app/api/auth.py#L1-L43) - [backend/app/api/queries.py:1-86](file://backend/app/api/queries.py#L1-L86) - [backend/app/api/citations.py:1-78](file://backend/app/api/citations.py#L1-L78) - [backend/app/workers/scheduler.py:1-182](file://backend/app/workers/scheduler.py#L1-L182) - [backend/app/agent_framework/agents/content_generator_agent.py:1-299](file://backend/app/agent_framework/agents/content_generator_agent.py#L1-L299) - [backend/app/agent_framework/agents/deai_agent.py:1-156](file://backend/app/agent_framework/agents/deai_agent.py#L1-L156) - [backend/app/agent_framework/agents/geo_optimizer_agent.py:1-198](file://backend/app/agent_framework/agents/geo_optimizer_agent.py#L1-L198) - [backend/app/services/llm/factory.py:1-66](file://backend/app/services/llm/factory.py#L1-L66) - [backend/app/agent_framework/pipeline/engine.py:1-536](file://backend/app/agent_framework/pipeline/engine.py#L1-L536) - [backend/app/agent_framework/pipeline/loader.py:1-283](file://backend/app/agent_framework/pipeline/loader.py#L1-L283) - [backend/app/database.py:1-29](file://backend/app/database.py#L1-L29) - [backend/app/config.py:1-23](file://backend/app/config.py#L1-L23) **章节来源** - [backend/app/database.py:1-29](file://backend/app/database.py#L1-L29) - [backend/app/config.py:1-23](file://backend/app/config.py#L1-L23) ## 性能考虑 - 测试并发与资源 - 使用pytest-asyncio并行执行异步测试,减少总耗时 - 通过会话级调度器模拟避免真实后台任务带来的不稳定因素 - 业务流程测试使用内存数据库,避免磁盘I/O开销 - 代理框架测试使用FakeLLMProvider,避免真实LLM调用的网络延迟 - LLM提供者测试使用httpx模拟,避免真实HTTP请求的网络开销 - 管道引擎测试使用dry-run模式,避免真实任务分发的系统开销 - 数据库与缓存 - 建议使用独立测试数据库实例,避免与开发/生产数据冲突 - 对高频查询场景,可在测试中模拟数据库延迟,评估路由与服务层的超时与重试策略 - 调度器测试使用AsyncMock,避免真实的定时任务执行 - 代理框架测试使用AsyncMock,避免真实Redis和数据库调用 - 接口响应与序列化 - 对大列表与统计聚合接口,关注JSON序列化开销与分页参数边界 - 业务流程测试中直接操作数据库模型,避免不必要的API调用 - 端到端测试中合理使用AsyncClient,避免过多的HTTP请求 - 平台适配器性能 - 通过patch模拟不同响应时延与错误率,评估引擎的容错与降级策略 - 调度器测试中使用精确的时间控制,避免真实的等待时间 - LLM提供者测试中使用AsyncMock,避免真实网络请求的等待时间 ## 故障排查指南 - 常见问题定位 - 认证失败:检查令牌生成与头设置、依赖覆盖是否生效 - 404查询:确认查询ID与用户归属,检查服务层查询逻辑 - 403配额:检查服务层权限异常抛出与HTTP状态映射 - 调度器异常:检查APScheduler的启动状态和job配置 - 业务流程失败:检查数据库事务和fixture的使用 - 代理执行失败:检查FakeLLMProvider的mock配置和report_progress的patch - LLM提供者异常:检查API密钥设置和httpx模拟配置 - 管道执行失败:检查YAML配置和依赖关系验证 - 端到端测试失败:检查数据库连接和依赖覆盖配置 - 调试技巧 - 在conftest中临时打印依赖解析过程,定位get_current_user解析失败原因 - 使用pytest的-v与-s选项查看详细输出,结合patch的side_effect观察异常传播 - 对数据库相关测试,开启SQLAlchemy echo以查看生成的SQL - 调度器测试中使用AsyncMock的assert_called_once()验证调度器行为 - 代理框架测试中检查report_progress的调用次数和参数 - LLM提供者测试中验证httpx.post的调用参数和返回值 - 管道引擎测试中检查拓扑排序和变量解析的中间结果 - 性能与稳定性 - 对于长时间运行的异步测试,确保事件循环正确关闭 - 对需要真实网络请求的场景,优先使用patch模拟,必要时增加超时与重试 - 业务流程测试中合理使用fixture,避免重复创建昂贵的对象 - 代理框架测试中使用AsyncMock,确保异步操作的正确模拟 ## 结论 本测试策略以Pytest为核心,结合会话级调度器模拟、依赖覆盖与patch技术,实现了对认证、查询、引用、引擎模块、业务流程、调度器、代理框架、LLM提供者、管道引擎和端到端工作流的全面覆盖。通过明确的夹具与测试数据管理,确保测试的可维护性与可重复性。新增的代理框架测试、LLM提供者测试、管道引擎测试和端到端工作流测试进一步完善了测试体系,涵盖了智能代理执行、LLM抽象层、Pipeline编排和完整业务流程的关键功能。建议在CI中启用并行执行与覆盖率统计,并为数据库、LLM提供者、代理框架和管道引擎建立稳定的模拟层,持续提升测试效率与质量。 ## 附录 - 测试覆盖率要求建议 - 语句覆盖率:≥80% - 分支覆盖率:≥70% - 行覆盖率:≥80% - 函数/方法覆盖率:≥90% - 业务流程覆盖率:≥95% - 调度器覆盖率:≥90% - 代理框架覆盖率:≥90% - LLM提供者覆盖率:≥90% - 管道引擎覆盖率:≥90% - 端到端工作流覆盖率:≥95% - 持续集成配置建议 - 使用GitHub Actions或GitLab CI,包含Python版本矩阵、依赖安装、数据库准备、pytest执行与覆盖率上传 - 将测试与lint、类型检查并行,确保主干分支质量 - 为业务流程测试、调度器测试、代理框架测试、LLM提供者测试、管道引擎测试和端到端工作流测试单独配置执行时间限制 - 为LLM提供者测试配置环境变量,确保API密钥正确设置 - 测试环境管理 - 使用独立测试数据库与Redis实例,避免污染 - 通过环境变量切换测试配置,确保敏感信息不泄露 - 业务流程测试使用内存数据库,调度器测试使用AsyncMock - 代理框架测试使用FakeLLMProvider和AsyncMock - LLM提供者测试使用httpx模拟和环境变量 - 管道引擎测试使用dry-run模式 - 端到端测试使用AsyncClient和依赖覆盖 - 性能测试方法 - 使用pytest-benchmark或locust对高频路由进行基准测试 - 对引擎执行流程进行压力测试,评估平台适配器与数据库写入瓶颈 - 调度器测试中使用时间控制和AsyncMock,避免真实的定时等待 - 业务流程测试中评估端到端流程的响应时间和吞吐量 - 代理框架测试中评估LLM调用的性能和错误处理 - LLM提供者测试中评估HTTP请求的性能和重试机制 - 管道引擎测试中评估Pipeline执行的性能和超时处理 - 端到端测试中评估完整业务流程的性能和稳定性