geo/.qoder/repowiki/zh/content/API接口文档/API接口文档.md

45 KiB
Raw Permalink Blame History

API接口文档

**本文档中引用的文件** - [backend/app/main.py](file://backend/app/main.py) - [backend/app/api/auth.py](file://backend/app/api/auth.py) - [backend/app/api/queries.py](file://backend/app/api/queries.py) - [backend/app/api/citations.py](file://backend/app/api/citations.py) - [backend/app/api/reports.py](file://backend/app/api/reports.py) - [backend/app/api/subscriptions.py](file://backend/app/api/subscriptions.py) - [backend/app/api/admin.py](file://backend/app/api/admin.py) - [backend/app/api/agents.py](file://backend/app/api/agents.py) - [backend/app/api/analytics.py](file://backend/app/api/analytics.py) - [backend/app/api/lifecycle.py](file://backend/app/api/lifecycle.py) - [backend/app/api/knowledge.py](file://backend/app/api/knowledge.py) - [backend/app/api/deps.py](file://backend/app/api/deps.py) - [backend/app/middleware/rate_limit.py](file://backend/app/middleware/rate_limit.py) - [backend/app/schemas/auth.py](file://backend/app/schemas/auth.py) - [backend/app/schemas/query.py](file://backend/app/schemas/query.py) - [backend/app/schemas/citation.py](file://backend/app/schemas/citation.py) - [backend/app/schemas/subscription.py](file://backend/app/schemas/subscription.py) - [backend/app/schemas/analytics.py](file://backend/app/schemas/analytics.py) - [backend/app/schemas/lifecycle.py](file://backend/app/schemas/lifecycle.py) - [backend/app/schemas/knowledge.py](file://backend/app/schemas/knowledge.py) - [backend/app/services/auth.py](file://backend/app/services/auth.py) - [backend/app/services/query.py](file://backend/app/services/query.py) - [backend/app/services/citation.py](file://backend/app/services/citation.py) - [backend/app/services/subscription.py](file://backend/app/services/subscription.py) - [backend/app/services/admin.py](file://backend/app/services/admin.py) - [backend/app/services/analytics/insights.py](file://backend/app/services/analytics/insights.py) - [backend/app/services/analytics/tracker.py](file://backend/app/services/analytics/tracker.py) - [backend/app/services/knowledge/rag_service.py](file://backend/app/services/knowledge/rag_service.py) - [backend/app/services/knowledge/chunker.py](file://backend/app/services/knowledge/chunker.py) - [backend/app/services/knowledge/embedder.py](file://backend/app/services/knowledge/embedder.py) - [backend/app/services/knowledge/retriever.py](file://backend/app/services/knowledge/retriever.py) - [backend/app/config.py](file://backend/app/config.py) - [backend/app/models/user.py](file://backend/app/models/user.py) - [backend/app/models/query.py](file://backend/app/models/query.py) - [backend/app/models/citation_record.py](file://backend/app/models/citation_record.py) - [backend/app/models/query_task.py](file://backend/app/models/query_task.py) - [backend/app/models/subscription.py](file://backend/app/models/subscription.py) - [backend/app/models/agent.py](file://backend/app/models/agent.py) - [backend/app/models/lifecycle.py](file://backend/app/models/lifecycle.py) - [backend/app/models/knowledge.py](file://backend/app/models/knowledge.py)

更新摘要

所做更改

  • 新增代理管理API模块支持AI Agent的注册、配置管理、任务分发与监控
  • 新增分析监控API模块提供内容发布追踪、效果指标管理、洞察生成与排行榜功能
  • 新增生命周期管理API模块支持品牌项目全生命周期管理与阶段进度跟踪
  • 新增知识库API模块提供知识库CRUD、文档管理、向量化检索与RAG服务
  • 更新架构图以反映新增的四个核心API模块
  • 完善错误处理和状态码说明,新增各模块特有的错误场景

目录

  1. 简介
  2. 项目结构
  3. 核心组件
  4. 架构概览
  5. 详细组件分析
  6. 依赖分析
  7. 性能考虑
  8. 故障排除指南
  9. 结论

简介

本文件为GEO平台的完整API接口文档涵盖认证、查询管理、引用数据、报告导出、订阅管理、管理员管理、代理管理、分析监控、生命周期管理和知识库等核心功能模块。文档详细记录了所有RESTful API端点的HTTP方法、URL模式、请求参数与响应格式并说明了JWT令牌管理、用户注册登录、权限验证机制、任务创建与执行、数据查询与统计分析、CSV和PDF格式报告导出流程以及订阅管理、系统管理、AI代理调度、内容分析追踪、项目生命周期管理和智能知识检索功能。

项目结构

后端采用FastAPI框架按功能模块组织API路由认证(/api/v1/auth)、查询词(/api/v1/queries)、引用数据(/api/v1/citations)、报告(/api/v1/reports)、订阅管理(/api/v1/subscriptions)、管理员(/api/v1/admin)、代理管理(/api/v1/agents)、分析监控(/api/v1/analytics)、生命周期管理(/api/v1/lifecycle)、知识库(/api/v1/knowledge)。应用启动时初始化数据库模型并启动查询调度器同时启用CORS允许前端localhost:3000访问集成限流中间件和请求日志中间件。

graph TB
A["应用入口<br/>backend/app/main.py"] --> B["认证路由<br/>backend/app/api/auth.py"]
A --> C["查询路由<br/>backend/app/api/queries.py"]
A --> D["引用数据路由<br/>backend/app/api/citations.py"]
A --> E["报告路由<br/>backend/app/api/reports.py"]
A --> F["订阅管理路由<br/>backend/app/api/subscriptions.py"]
A --> G["管理员路由<br/>backend/app/api/admin.py"]
A --> H["代理管理路由<br/>backend/app/api/agents.py"]
A --> I["分析监控路由<br/>backend/app/api/analytics.py"]
A --> J["生命周期管理路由<br/>backend/app/api/lifecycle.py"]
A --> K["知识库路由<br/>backend/app/api/knowledge.py"]
A --> L["依赖注入与认证中间件<br/>backend/app/api/deps.py"]
A --> M["限流中间件<br/>backend/app/middleware/rate_limit.py"]
A --> N["配置中心<br/>backend/app/config.py"]
A --> O["数据库模型<br/>backend/app/models/*.py"]
A --> P["业务服务层<br/>backend/app/services/*.py"]
A --> Q["数据传输对象<br/>backend/app/schemas/*.py"]

图表来源

章节来源

核心组件

  • 应用入口与生命周期管理定义应用标题、版本、CORS策略注册各模块路由启动/关闭查询调度器,配置安全响应头、限流中间件和请求日志中间件。
  • 认证组件提供注册、登录、当前用户信息查询、忘记密码、重置密码、邮箱验证、密码修改、资料更新等完整认证功能基于OAuth2密码流与JWT进行身份验证。
  • 查询管理:支持查询词的增删改查、分页列表、频率与下次查询时间计算。
  • 引用数据:支持引用记录查询、统计分析(总查询数、引用率、平台分布、趋势)、立即执行查询任务。
  • 报告导出支持CSV和PDF格式导出指定查询的引用记录。
  • 订阅管理:提供套餐查询、订阅创建、取消订阅、历史记录查看等功能,支持多层级权限控制。
  • 管理员管理:提供系统统计、用户管理、权限控制、计划更新等后台管理功能。
  • 代理管理支持AI Agent的注册、配置管理、任务分发与监控提供任务创建、状态查询、日志查看和取消功能。
  • 分析监控:提供内容发布追踪、效果指标管理、洞察生成与排行榜功能,支持组织级别的数据分析。
  • 生命周期管理:支持品牌项目的全生命周期管理,包括项目快速启动、阶段进度跟踪、时间线事件和统计分析。
  • 知识库管理提供知识库CRUD、文档管理、向量化检索与RAG服务支持多种文档源和智能搜索。
  • 数据模型与服务:用户、查询、引用记录、查询任务、订阅、代理、分析、生命周期、知识库等模型及对应的服务逻辑。

章节来源

架构概览

下图展示了客户端与后端各模块之间的交互关系,包括认证流程、查询管理、引用数据处理、报告导出、订阅管理、管理员管理、代理调度、分析监控、生命周期管理和知识库检索。

graph TB
subgraph "客户端"
FE["前端应用<br/>localhost:3000"]
ENDUSER["终端用户"]
end
subgraph "后端服务"
AUTH["认证模块<br/>/api/v1/auth"]
QUERIES["查询模块<br/>/api/v1/queries"]
CITATIONS["引用数据模块<br/>/api/v1/citations"]
REPORTS["报告模块<br/>/api/v1/reports"]
SUBSCRIPTIONS["订阅管理模块<br/>/api/v1/subscriptions"]
ADMIN["管理员模块<br/>/api/v1/admin"]
AGENTS["代理管理模块<br/>/api/v1/agents"]
ANALYTICS["分析监控模块<br/>/api/v1/analytics"]
LIFECYCLE["生命周期管理模块<br/>/api/v1/lifecycle"]
KNOWLEDGE["知识库模块<br/>/api/v1/knowledge"]
DEPS["依赖注入与认证中间件"]
RATELIMIT["限流中间件"]
LOGGING["请求日志中间件"]
MODELS["数据模型层"]
SERVICES["业务服务层"]
CONFIG["配置中心"]
end
FE --> AUTH
FE --> QUERIES
FE --> CITATIONS
FE --> REPORTS
FE --> SUBSCRIPTIONS
FE --> ADMIN
FE --> AGENTS
FE --> ANALYTICS
FE --> LIFECYCLE
FE --> KNOWLEDGE
ENDUSER --> AGENTS
ENDUSER --> ANALYTICS
ENDUSER --> LIFECYCLE
ENDUSER --> KNOWLEDGE
AUTH --> DEPS
QUERIES --> DEPS
CITATIONS --> DEPS
REPORTS --> DEPS
SUBSCRIPTIONS --> DEPS
ADMIN --> DEPS
AGENTS --> DEPS
ANALYTICS --> DEPS
LIFECYCLE --> DEPS
KNOWLEDGE --> DEPS
AUTH --> RATELIMIT
QUERIES --> RATELIMIT
CITATIONS --> RATELIMIT
REPORTS --> RATELIMIT
SUBSCRIPTIONS --> RATELIMIT
ADMIN --> RATELIMIT
AGENTS --> RATELIMIT
ANALYTICS --> RATELIMIT
LIFECYCLE --> RATELIMIT
KNOWLEDGE --> RATELIMIT
AUTH --> LOGGING
QUERIES --> LOGGING
CITATIONS --> LOGGING
REPORTS --> LOGGING
SUBSCRIPTIONS --> LOGGING
ADMIN --> LOGGING
AGENTS --> LOGGING
ANALYTICS --> LOGGING
LIFECYCLE --> LOGGING
KNOWLEDGE --> LOGGING
AUTH --> SERVICES
QUERIES --> SERVICES
CITATIONS --> SERVICES
REPORTS --> SERVICES
SUBSCRIPTIONS --> SERVICES
ADMIN --> SERVICES
AGENTS --> SERVICES
ANALYTICS --> SERVICES
LIFECYCLE --> SERVICES
KNOWLEDGE --> SERVICES
SERVICES --> MODELS
MODELS --> CONFIG

图表来源

详细组件分析

认证接口

  • 接口前缀:/api/v1/auth
  • 路由与功能:
    • POST /register用户注册返回用户信息
    • POST /login用户登录返回JWT访问令牌与用户信息
    • GET /me获取当前登录用户信息
    • POST /forgot-password发送密码重置链接
    • POST /reset-password重置密码
    • POST /verify-email邮箱验证
    • POST /resend-verification重新发送验证码
    • PUT /change-password修改密码
    • PUT /profile更新用户资料
  • 认证机制:
    • 使用OAuth2密码流令牌类型为bearer
    • 通过依赖注入获取当前用户校验JWT有效性
    • 用户名/密码验证通过后签发JWT包含用户ID作为sub字段
    • 支持邮箱验证和密码重置功能
  • 请求参数与响应格式:
    • 注册:邮箱、密码、姓名
    • 登录:邮箱、密码
    • 忘记密码:邮箱
    • 重置密码:令牌、新密码
    • 邮箱验证:邮箱、验证码
    • 修改密码:旧密码、新密码
    • 更新资料:姓名、头像等
    • 当前用户用户ID、邮箱、姓名、计划、最大查询数、激活状态、创建时间
    • 访问令牌:访问令牌字符串、令牌类型、用户信息
  • 错误处理:
    • 注册邮箱已存在时返回400
    • 登录凭据无效时返回401
    • 获取当前用户凭据无效或用户不存在时返回401
    • 忘记密码邮箱不存在时返回400
    • 重置密码无效令牌或已过期时返回400
    • 验证码无效或已过期时返回400
sequenceDiagram
participant Client as "客户端"
participant AuthAPI as "认证API"
participant AuthService as "认证服务"
participant DB as "数据库"
Client->>AuthAPI : POST /api/v1/auth/register
AuthAPI->>AuthService : 注册用户
AuthService->>DB : 检查邮箱唯一性
DB-->>AuthService : 结果
AuthService->>DB : 创建用户并存储密码哈希
DB-->>AuthService : 新用户
AuthService-->>AuthAPI : 用户信息
AuthAPI-->>Client : 201 用户信息
Client->>AuthAPI : POST /api/v1/auth/login
AuthAPI->>AuthService : 验证用户名/密码
AuthService->>DB : 查询用户
DB-->>AuthService : 用户
AuthService->>AuthService : 校验密码
AuthService->>AuthService : 生成JWT
AuthService-->>AuthAPI : 访问令牌与用户信息
AuthAPI-->>Client : 200 访问令牌

图表来源

章节来源

查询管理接口

  • 接口前缀:/api/v1/queries
  • 路由与功能:
    • GET /:分页列出当前用户的查询词
    • POST /:创建新的查询词
    • GET /{query_id}:获取单个查询词详情
    • PUT /{query_id}:更新查询词
    • DELETE /{query_id}:删除查询词
  • 权限与限制:
    • 基于当前用户上下文进行资源所有权校验
    • 创建查询时检查用户最大查询数限制
  • 请求参数与响应格式:
    • 查询创建:关键词、目标品牌、品牌别名、平台列表、频率
    • 查询更新:可选字段包括关键词、目标品牌、品牌别名、平台列表、频率、状态
    • 查询详情:包含创建/更新时间、状态、下次查询时间等
    • 列表响应items与total总数
  • 错误处理:
    • 未找到查询时返回404
    • 超出查询配额返回403
    • 参数校验失败返回422Pydantic验证
flowchart TD
Start(["创建查询"]) --> CheckCount["检查用户查询数量"]
CheckCount --> CountOK{"是否超过上限?"}
CountOK --> |是| Raise403["抛出403 错误"]
CountOK --> |否| CalcNext["根据频率计算下次查询时间"]
CalcNext --> CreateQuery["创建查询记录"]
CreateQuery --> Commit["提交事务"]
Commit --> Return["返回新查询"]
Raise403 --> End(["结束"])
Return --> End

图表来源

章节来源

引用数据接口

  • 接口前缀:/api/v1/citations
  • 路由与功能:
    • GET /分页查询引用记录支持按查询ID、平台、时间范围过滤
    • GET /stats统计分析返回总查询数、引用率、平均位置、按平台分布、30天趋势
    • POST /{query_id}/run-now立即触发查询任务返回任务ID与状态
  • 数据模型:
    • 引用记录包含平台、是否引用、引用位置、引用文本、竞争品牌列表、查询时间等
  • 统计逻辑:
    • 总查询数与引用数来自关联查询统计
    • 引用率=引用数/总查询数
    • 平均位置仅对有位置的引用记录计算
    • 按平台统计查询数、引用数、引用率与平均位置
    • 趋势按周聚合过去30天的引用数
  • 错误处理:
    • 查询所有权校验失败返回404
    • 查询非活跃或未配置平台时返回404
    • 参数校验失败返回422
sequenceDiagram
participant Client as "客户端"
participant CitAPI as "引用数据API"
participant CitService as "引用数据服务"
participant DB as "数据库"
Client->>CitAPI : POST /api/v1/citations/{query_id}/run-now
CitAPI->>CitService : 触发查询任务
CitService->>DB : 校验查询所有权与状态
DB-->>CitService : 查询结果
CitService->>DB : 为每个平台创建任务
DB-->>CitService : 任务集合
CitService-->>CitAPI : 返回首个任务
CitAPI-->>Client : 202 任务信息

图表来源

章节来源

报告导出接口

  • 接口前缀:/api/v1/reports
  • 路由与功能:
    • GET /export/csv导出指定查询的引用记录为CSV文件
    • GET /export/pdf导出指定查询的引用记录为PDF报告
  • 输出格式:
    • CSV文本CSV包含列头查询关键词、目标品牌、查询日期、查询平台、是否引用、引用位置、引用文本、匹配置信度、匹配类型、竞争品牌
    • PDF完整的品牌曝光度分析报告包含封面、汇总统计、平台分布、详细数据表格等
    • 文件名为geo-report-YYYYMMDD.csv或geo-report-YYYYMMDD.pdf
  • 错误处理:
    • 不支持的格式返回400
    • 查询所有权校验失败返回404
sequenceDiagram
participant Client as "客户端"
participant ReportAPI as "报告API"
participant ReportService as "报告服务"
participant DB as "数据库"
Client->>ReportAPI : GET /api/v1/reports/export/pdf?query_id={id}
ReportAPI->>ReportService : 导出PDF
ReportService->>DB : 校验查询所有权并查询记录
DB-->>ReportService : 引用记录列表
ReportService->>ReportService : 生成PDF内容
ReportService-->>ReportAPI : PDF字节流
ReportAPI-->>Client : 200 PDF文件下载

图表来源

章节来源

订阅管理接口

  • 接口前缀:/api/v1/subscriptions
  • 路由与功能:
    • GET /plans获取所有可用套餐详情
    • GET /current获取当前订阅信息
    • POST /subscribe创建新订阅
    • POST /cancel取消当前订阅
    • GET /history获取订阅历史记录
  • 套餐与功能:
    • free免费版5个查询配额基础查询监控、CSV导出
    • starter入门版99元/月20个查询配额PDF报告、定时查询
    • pro专业版299元/月100个查询配额竞品分析、API访问
    • enterprise企业版999元/月500个查询配额专属支持
  • 权限与限制:
    • 需要登录用户权限
    • 取消订阅会自动降级到免费版
  • 请求参数与响应格式:
    • 套餐详情套餐ID、名称、价格、最大查询数、功能列表
    • 订阅创建套餐ID
    • 订阅响应订阅ID、套餐、状态、开始/结束日期、金额、支付方式
    • 订阅历史:订阅记录列表与总数
  • 错误处理:
    • 无效套餐ID返回400
    • 无订阅记录返回404
    • 参数校验失败返回422
flowchart TD
Start(["订阅创建"]) --> ValidatePlan["验证套餐ID"]
ValidatePlan --> PlanValid{"套餐是否存在?"}
PlanValid --> |否| Raise400["抛出400 错误"]
PlanValid --> |是| CreateSub["创建订阅记录"]
CreateSub --> UpdateUser["更新用户套餐与配额"]
UpdateUser --> Commit["提交事务"]
Commit --> Return["返回订阅信息"]
Raise400 --> End(["结束"])
Return --> End

图表来源

章节来源

管理员接口

  • 接口前缀:/api/v1/admin
  • 路由与功能:
    • GET /stats获取系统统计信息
    • GET /users分页获取用户列表支持搜索
    • GET /users/{user_id}:获取用户详细信息
    • POST /users/{user_id}/toggle-active切换用户激活状态
    • PUT /users/{user_id}/update-plan更新用户套餐
  • 权限控制:
    • 需要管理员权限is_admin=true
    • 非管理员访问返回403
  • 请求参数与响应格式:
    • 系统统计:总用户数、总查询数、总引用数、引用率、今日活跃用户数
    • 用户列表:用户信息列表与总数
    • 用户详情:用户基本信息、查询历史、最近引用记录
    • 用户状态用户ID、激活状态、操作消息
    • 套餐更新用户ID、新套餐、最大查询数、操作消息
  • 错误处理:
    • 非管理员权限返回403
    • 用户不存在返回404
    • 缺少必要参数返回400
sequenceDiagram
participant Admin as "管理员客户端"
participant AdminAPI as "管理员API"
participant AdminService as "管理员服务"
participant DB as "数据库"
Admin->>AdminAPI : GET /api/v1/admin/users?skip=0&limit=20
AdminAPI->>AdminService : 验证管理员权限
AdminService->>DB : 检查用户权限
DB-->>AdminService : 管理员信息
AdminService->>DB : 查询用户列表
DB-->>AdminService : 用户数据
AdminService-->>AdminAPI : 用户列表与总数
AdminAPI-->>Admin : 200 用户列表

图表来源

章节来源

代理管理接口

  • 接口前缀:/api/v1/agents
  • 路由与功能:
    • GET /列出所有Agent支持按类型和状态筛选
    • GET /{agent_name}获取Agent详情
    • GET /{agent_name}/config获取Agent配置
    • PUT /{agent_name}/config更新Agent配置
    • GET /tasks/列出任务支持按Agent、状态、类型筛选
    • POST /tasks/创建任务分发给Agent支持优先级、回调URL、超时设置
    • GET /tasks/{task_id}:获取任务状态
    • POST /tasks/{task_id}/cancel取消任务
    • GET /tasks/{task_id}/logs获取任务日志
  • 权限与限制:
    • 需要登录用户权限
    • 任务分发需要有效的Agent名称和配置
  • 请求参数与响应格式:
    • Agent列表items数组与total总数
    • Agent详情包含名称、类型、状态、描述、版本、端点、能力等
    • 配置更新:返回更新的键列表和成功消息
    • 任务创建返回任务ID、初始状态和成功消息
    • 任务状态:包含状态、错误消息、开始/完成时间等
    • 任务日志:包含日志级别、消息、元数据和时间戳
  • 错误处理:
    • Agent不存在返回404
    • 任务不存在返回404
    • 任务分发错误返回400
    • 参数校验失败返回422
sequenceDiagram
participant Client as "客户端"
participant AgentsAPI as "代理管理API"
participant Dispatcher as "任务调度器"
participant Registry as "Agent注册表"
participant DB as "数据库"
Client->>AgentsAPI : POST /api/v1/agents/tasks/
AgentsAPI->>Dispatcher : 创建任务消息
Dispatcher->>Registry : 查找可用Agent
Registry-->>Dispatcher : Agent信息
Dispatcher->>DB : 存储任务记录
DB-->>Dispatcher : 任务ID
Dispatcher-->>AgentsAPI : 任务ID与状态
AgentsAPI-->>Client : 201 任务信息

图表来源

章节来源

分析监控接口

  • 接口前缀:/api/v1/analytics
  • 路由与功能:
    • POST /publish记录内容发布支持内容标题、ID、平台、URL、状态、发布时间
    • PUT /metrics/{publish_id}更新内容效果指标追加快照支持浏览量、点赞数、评论数、分享数、书签数、AI引用数、搜索展示量、搜索点击量、平均阅读时长、阅读完成率
    • GET /overview获取全局效果概览包含发布总数、总浏览量、总互动数、总AI引用数、平均参与率、平台分布
    • GET /content/{publish_id}:获取单条内容详细表现
    • GET /top获取表现最好内容排行支持按浏览量、点赞数、评论数、分享数、AI引用数、阅读完成率排序
    • GET /insights获取洞察列表支持限制数量和类型筛选
    • POST /insights/generate触发AI生成洞察建议
    • POST /insights/{insight_id}/apply标记洞察已应用
  • 权限与限制:
    • 需要用户关联组织权限
    • 发布记录必须属于当前组织
  • 请求参数与响应格式:
    • 发布记录包含组织ID、内容标题、内容ID、平台、URL、状态、发布时间、创建时间
    • 指标更新:返回更新后的指标快照
    • 全局概览:包含统计指标和平台分布
    • 内容表现:包含最新指标和历史指标列表
    • 洞察列表包含洞察ID、类型、标题、描述、建议、严重程度、应用状态
  • 错误处理:
    • 用户未关联组织返回403
    • 发布记录不存在或无权限返回404
    • 参数校验失败返回422
sequenceDiagram
participant Client as "客户端"
participant AnalyticsAPI as "分析监控API"
participant Tracker as "分析追踪器"
participant Generator as "洞察生成器"
participant DB as "数据库"
Client->>AnalyticsAPI : POST /api/v1/analytics/publish
AnalyticsAPI->>Tracker : 记录发布
Tracker->>DB : 存储发布记录
DB-->>Tracker : 发布ID
Tracker-->>AnalyticsAPI : 发布记录
AnalyticsAPI-->>Client : 201 发布记录
Client->>AnalyticsAPI : POST /api/v1/analytics/insights/generate
AnalyticsAPI->>Generator : 生成洞察
Generator->>DB : 查询数据分析
DB-->>Generator : 分析结果
Generator-->>AnalyticsAPI : 洞察建议
AnalyticsAPI-->>Client : 洞察列表

图表来源

章节来源

生命周期管理接口

  • 接口前缀:/api/v1/lifecycle
  • 路由与功能:
    • GET /projects/stats获取项目统计信息包含项目总数、活跃项目数、阶段分布、完成率
    • GET /projects/{project_id}/timeline获取项目时间线事件包含创建事件和各阶段开始/完成事件
    • POST /projects/quick-start项目快速启动创建品牌基建阶段的项目
    • GET /projects/{project_id}/stages获取项目阶段列表
    • PUT /projects/{project_id}/stages/{stage_number}:更新项目阶段状态,支持开始时间、完成时间、备注、指标
  • 权限与限制:
    • 需要用户关联组织权限
    • 项目必须属于当前组织
  • 请求参数与响应格式:
    • 项目统计:包含总数、活跃数、阶段分布、完成率
    • 时间线事件:包含事件类型、描述、时间戳、阶段编号
    • 项目创建:返回创建的项目和成功消息
    • 阶段更新:返回更新后的阶段详情
  • 错误处理:
    • 用户未关联组织返回404
    • 项目不存在返回404
    • 阶段不存在返回404
sequenceDiagram
participant Client as "客户端"
participant LifecycleAPI as "生命周期API"
participant DB as "数据库"
Client->>LifecycleAPI : POST /api/v1/lifecycle/projects/quick-start
LifecycleAPI->>DB : 创建组织如不存在
DB-->>LifecycleAPI : 组织ID
LifecycleAPI->>DB : 创建项目
DB-->>LifecycleAPI : 项目ID
LifecycleAPI->>DB : 创建5个阶段
DB-->>LifecycleAPI : 阶段列表
LifecycleAPI-->>Client : 201 项目详情

图表来源

章节来源

知识库接口

  • 接口前缀:/api/v1/knowledge
  • 路由与功能:
    • POST /bases创建知识库支持名称、类型、描述
    • GET /bases列出知识库支持按类型筛选
    • GET /bases/{kb_id}:获取知识库详情
    • DELETE /bases/{kb_id}:删除知识库(级联删除文档和块)
    • POST /bases/{kb_id}/documents上传文档支持文本、URL、Markdown源
    • GET /bases/{kb_id}/documents列出文档
    • DELETE /bases/{kb_id}/documents/{doc_id}:删除文档(级联删除块)
    • GET /bases/{kb_id}/documents/{doc_id}/chunks预览文档块
    • POST /search知识库搜索支持查询、知识库ID列表、返回数量
  • 权限与限制:
    • 需要用户关联组织权限
    • 文档上传需要有效的知识库ID
  • 请求参数与响应格式:
    • 知识库创建返回知识库ID、名称、类型、描述、文档数量、状态、创建时间
    • 文档上传返回文档ID、标题、源类型、URL、块数量、状态、错误消息、创建时间
    • 搜索结果包含块ID、内容、分数、文档ID、标题、元数据
  • 错误处理:
    • 用户未关联组织返回400
    • 知识库不存在返回404
    • 文档不存在返回404
    • URL内容获取失败返回400
sequenceDiagram
participant Client as "客户端"
participant KnowledgeAPI as "知识库API"
participant RAGService as "RAG服务"
participant DB as "数据库"
Client->>KnowledgeAPI : POST /api/v1/knowledge/search
KnowledgeAPI->>RAGService : 执行向量搜索
RAGService->>DB : 查询相似文档
DB-->>RAGService : 匹配结果
RAGService-->>KnowledgeAPI : 搜索结果
KnowledgeAPI->>DB : 记录搜索日志
DB-->>KnowledgeAPI : 日志ID
KnowledgeAPI-->>Client : 200 搜索结果

图表来源

章节来源

限流中间件

  • 功能特性:
    • 基于内存的简易限流中间件无需Redis依赖
    • 多层级限流策略:认证接口、查询执行、全局限流
    • 健康检查和文档页面不限流
  • 限流规则:
    • 认证接口(/api/v1/auth/login, /api/v1/auth/register, /api/v1/auth/forgot-password每分钟5次
    • 查询执行(/run-now每小时10次
    • 全局每分钟100次
  • 实现机制:
    • 使用时间窗口算法,自动清理过期请求记录
    • 基于客户端IP地址进行限流
    • 返回429状态码和友好提示信息
  • 特殊处理:
    • /health、/docs、/openapi 路径不限流
    • 每个规则独立计数,互不影响
flowchart TD
Start(["请求进入"]) --> HealthCheck{"健康检查/文档?"}
HealthCheck --> |是| PassThrough["直接通过"]
HealthCheck --> |否| CheckAuth{"认证接口?"}
CheckAuth --> |是| AuthKey["auth:{client_ip}"]
AuthKey --> CheckAuthRate{"认证限流?"}
CheckAuthRate --> |超限| Return429["返回429 Too Many Requests"]
CheckAuthRate --> |正常| CheckQueryRun{"查询执行?"}
CheckQueryRun --> |是| QueryKey["query_run:{client_ip}"]
QueryKey --> CheckQueryRate{"查询限流?"}
CheckQueryRate --> |超限| Return429
CheckQueryRate --> |正常| GlobalKey["global:{client_ip}"]
CheckGlobal{"全局限流?"}
CheckGlobal --> |超限| Return429
CheckGlobal --> |正常| Next["继续处理"]
PassThrough --> Next

图表来源

章节来源

依赖分析

  • 中间件与认证:
    • OAuth2密码流令牌URL为/api/v1/auth/login
    • 依赖注入从Header中解析Authorization: Bearer token
    • 通过JWT解码校验用户身份查询数据库获取用户实体
    • 管理员权限通过is_admin字段验证
  • 数据模型关系:
    • User与Query一对多级联删除
    • User与Subscription一对多级联删除
    • Query与CitationRecord、QueryTask一对多级联删除
    • CitationRecord外键关联Query
    • AgentRegistry与AgentConfig、AgentTask、AgentTaskLog一对多级联删除
    • LifecycleProject与ProjectStage一对多级联删除
    • KnowledgeBase与KnowledgeDocument、KnowledgeChunk一对多级联删除
  • 服务层职责:
    • 认证服务密码哈希、JWT签发与校验、用户注册与登录、密码重置、邮箱验证
    • 查询服务:分页查询、创建/更新/删除、频率与下次查询时间计算
    • 引用服务引用记录查询、统计分析、立即执行任务、CSV和PDF导出
    • 订阅服务:套餐管理、订阅创建与取消、历史记录查询
    • 管理员服务:系统统计、用户管理、权限控制、计划更新
    • 代理服务Agent注册表管理、任务调度、配置管理、日志记录
    • 分析服务:发布追踪、指标管理、洞察生成、排行榜计算
    • 生命周期服务:项目管理、阶段跟踪、统计分析
    • 知识库服务文档管理、向量化处理、RAG检索、搜索日志
classDiagram
class User {
+UUID id
+string email
+string password_hash
+string name
+string plan
+int max_queries
+boolean is_active
+boolean email_verified
+boolean is_admin
+datetime created_at
+datetime updated_at
}
class Query {
+UUID id
+UUID user_id
+string keyword
+string target_brand
+list brand_aliases
+list platforms
+string frequency
+string status
+datetime last_queried_at
+datetime next_query_at
+datetime created_at
+datetime updated_at
}
class CitationRecord {
+UUID id
+UUID query_id
+string platform
+boolean cited
+int citation_position
+string citation_text
+list competitor_brands
+string raw_response
+string match_type
+float confidence
+datetime queried_at
}
class QueryTask {
+UUID id
+UUID agent_id
+string task_type
+string status
+int priority
+dict input_data
+dict output_data
+string error_message
+UUID organization_id
+UUID project_id
+datetime scheduled_at
+datetime started_at
+datetime completed_at
+datetime created_at
}
class Subscription {
+UUID id
+UUID user_id
+string plan
+string status
+date start_date
+date end_date
+float amount
+string payment_method
+datetime created_at
}
class AgentRegistry {
+UUID id
+string name
+string display_name
+string agent_type
+string description
+string version
+string endpoint
+string status
+dict capabilities
+datetime last_heartbeat
+datetime created_at
+datetime updated_at
}
class AgentTask {
+UUID id
+UUID agent_id
+string task_type
+string status
+int priority
+dict input_data
+dict output_data
+string error_message
+UUID organization_id
+UUID project_id
+datetime scheduled_at
+datetime started_at
+datetime completed_at
+datetime created_at
}
class LifecycleProject {
+UUID id
+UUID organization_id
+string brand_name
+list brand_aliases
+int current_stage
+string status
+UUID created_by
+datetime created_at
+datetime updated_at
}
class ProjectStage {
+UUID id
+UUID project_id
+int stage_number
+string status
+datetime started_at
+datetime completed_at
+string notes
+dict metrics
}
class KnowledgeBase {
+UUID id
+UUID organization_id
+string name
+string type
+string description
+int document_count
+string status
+UUID created_by
+datetime created_at
+datetime updated_at
}
class KnowledgeDocument {
+UUID id
+UUID knowledge_base_id
+string title
+string source_type
+string source_url
+string content
+string content_hash
+int chunk_count
+string status
+string error_message
+dict extra_metadata
+datetime created_at
+datetime updated_at
}
class KnowledgeChunk {
+UUID id
+UUID document_id
+string content
+Vector embedding
+int chunk_index
+int token_count
+dict extra_metadata
+datetime created_at
}
User "1" --> "many" Query : "拥有"
User "1" --> "many" Subscription : "订阅"
User "1" --> "many" AgentTask : "创建"
Query "1" --> "many" CitationRecord : "产生"
Query "1" --> "many" QueryTask : "触发任务"
CitationRecord "many" --> "1" Query : "属于"
Subscription "many" --> "1" User : "属于"
AgentRegistry "1" --> "many" AgentTask : "执行"
AgentTask "many" --> "1" AgentRegistry : "属于"
LifecycleProject "1" --> "many" ProjectStage : "包含"
KnowledgeBase "1" --> "many" KnowledgeDocument : "包含"
KnowledgeDocument "1" --> "many" KnowledgeChunk : "包含"

图表来源

章节来源

性能考虑

  • 分页查询列表接口默认每页20条支持skip/limit参数避免一次性加载大量数据。
  • 索引优化查询与引用记录表建立复合索引提升按用户ID、状态、时间等条件的查询性能。
  • 异步数据库使用异步SQLAlchemy提高并发处理能力。
  • 缓存策略可在服务层引入Redis缓存热点统计数据降低重复计算成本。
  • 批量操作:任务创建采用批量插入,减少事务开销。
  • 限流保护:多层级限流中间件防止恶意请求和滥用,保护系统稳定性。
  • PDF生成PDF导出使用FPDF库支持中文字体加载提供完整的品牌曝光度分析报告。
  • 向量检索知识库模块使用pgvector扩展进行高效相似性搜索支持大规模文档向量化处理。
  • 代理调度Agent任务采用Redis队列进行异步处理支持高并发任务分发与监控。
  • 分析追踪:分析模块使用专门的追踪器和洞察生成器,优化大数据量的统计分析性能。

故障排除指南

  • 认证相关
    • 401 未授权检查Authorization头是否正确携带Bearer token确认JWT签名与过期时间有效。
    • 401 凭据无效:检查用户名/密码是否正确;确认用户存在且被激活。
    • 400 邮箱已注册:检查邮箱是否已被其他用户使用。
    • 400 无效令牌:检查密码重置令牌是否正确且未过期。
  • 查询管理
    • 403 超出配额检查用户计划与max_queries限制清理或升级计划以增加配额。
    • 404 未找到确认query_id归属当前用户检查路径参数是否正确。
  • 引用数据
    • 404 查询不可用确认查询状态为active且配置了至少一个平台。
    • 统计为空当按查询ID过滤但无匹配记录时返回零值统计。
  • 报告导出
    • 400 不支持的格式确保format参数为csv或pdf。
    • 404 查询不存在确认query_id归属当前用户。
  • 订阅管理
    • 400 无效套餐检查套餐ID是否存在于可用套餐列表中。
    • 404 无订阅记录:确认当前用户是否有有效的订阅记录。
  • 管理员功能
    • 403 非管理员权限确认当前用户具有管理员权限is_admin=true
    • 404 用户不存在确认用户ID是否有效。
  • 代理管理
    • 404 Agent不存在确认Agent名称是否正确。
    • 404 任务不存在确认任务ID格式和权限。
    • 400 任务分发错误检查Agent配置和可用性。
    • 422 参数校验失败:检查请求体格式和字段约束。
  • 分析监控
    • 403 用户未关联组织:确认用户已加入有效组织。
    • 404 发布记录不存在或无权限检查发布ID和组织权限。
    • 422 指标更新失败:检查数值范围和字段类型。
  • 生命周期管理
    • 404 用户未关联组织:确认用户已创建或加入组织。
    • 404 项目不存在检查项目ID和组织归属。
    • 404 阶段不存在:检查阶段编号和项目归属。
  • 知识库管理
    • 400 用户未关联组织:确认用户已加入组织。
    • 404 知识库不存在检查知识库ID和组织权限。
    • 404 文档不存在检查文档ID和知识库归属。
    • 400 URL内容获取失败检查URL可访问性和内容格式。
  • 限流保护
    • 429 请求过于频繁:检查是否超过限流阈值,等待冷却时间后重试。
    • 429 查询执行过于频繁确认查询执行频率是否超过每小时10次限制。

章节来源

结论

GEO平台API采用清晰的模块化设计围绕用户、查询、引用、报告、订阅、管理、代理、分析、生命周期和知识库十大领域构建RESTful接口。通过JWT认证与严格的资源所有权校验保障了数据安全通过统计分析与CSV/PDF导出满足了业务洞察与合规需求通过订阅管理、管理员功能、AI代理调度、内容分析追踪、项目生命周期管理和智能知识检索提供了完整的商业运营支持通过多层级限流中间件确保了系统的稳定性和安全性。新增的四个核心API模块显著增强了平台的智能化水平包括AI代理的自动化任务处理能力、深度的内容分析与优化建议、完整的项目生命周期管理以及强大的智能知识检索功能。建议在生产环境中进一步完善错误日志、监控指标与缓存策略持续优化查询性能与用户体验。