# 知识库 ## 概述 GEO平台的知识库系统基于RAG(Retrieval-Augmented Generation)架构,为内容生成提供领域知识支持。 ## 系统架构 ``` 文档上传 → 文本分块 → 向量化 → RAG检索 → LLM增强生成 ``` ## 核心功能 ### 文档管理 - 支持多种文档格式(PDF、TXT、Markdown、DOCX) - 文档版本管理 - 分类和标签 ### 文本分块 - 智能分块策略 - 重叠窗口机制 - 元数据保留 ### 向量化 - 支持多种嵌入模型 - 向量数据库存储 - 相似度检索 ## API接口 知识库相关API位于 `backend/app/api/knowledge.py` ### 主要端点 | 方法 | 路径 | 说明 | |------|------|------| | GET | /api/v1/knowledge/bases | 获取知识库列表 | | POST | /api/v1/knowledge/bases | 创建知识库 | | POST | /api/v1/knowledge/bases/{id}/documents | 上传文档 | | GET | /api/v1/knowledge/search | 搜索知识 | ## 配置 环境变量: - `KNOWLEDGE_EMBEDDING_MODEL` - 嵌入模型 - `KNOWLEDGE_VECTOR_DB` - 向量数据库类型