1.0 KiB
1.0 KiB
知识库
概述
GEO平台的知识库系统基于RAG(Retrieval-Augmented Generation)架构,为内容生成提供领域知识支持。
系统架构
文档上传 → 文本分块 → 向量化 → RAG检索 → LLM增强生成
核心功能
文档管理
- 支持多种文档格式(PDF、TXT、Markdown、DOCX)
- 文档版本管理
- 分类和标签
文本分块
- 智能分块策略
- 重叠窗口机制
- 元数据保留
向量化
- 支持多种嵌入模型
- 向量数据库存储
- 相似度检索
API接口
知识库相关API位于 backend/app/api/knowledge.py
主要端点
| 方法 | 路径 | 说明 |
|---|---|---|
| GET | /api/v1/knowledge/bases | 获取知识库列表 |
| POST | /api/v1/knowledge/bases | 创建知识库 |
| POST | /api/v1/knowledge/bases/{id}/documents | 上传文档 |
| GET | /api/v1/knowledge/search | 搜索知识 |
配置
环境变量:
KNOWLEDGE_EMBEDDING_MODEL- 嵌入模型KNOWLEDGE_VECTOR_DB- 向量数据库类型