51 lines
1.0 KiB
Markdown
51 lines
1.0 KiB
Markdown
# 知识库
|
||
|
||
## 概述
|
||
|
||
GEO平台的知识库系统基于RAG(Retrieval-Augmented Generation)架构,为内容生成提供领域知识支持。
|
||
|
||
## 系统架构
|
||
|
||
```
|
||
文档上传 → 文本分块 → 向量化 → RAG检索 → LLM增强生成
|
||
```
|
||
|
||
## 核心功能
|
||
|
||
### 文档管理
|
||
|
||
- 支持多种文档格式(PDF、TXT、Markdown、DOCX)
|
||
- 文档版本管理
|
||
- 分类和标签
|
||
|
||
### 文本分块
|
||
|
||
- 智能分块策略
|
||
- 重叠窗口机制
|
||
- 元数据保留
|
||
|
||
### 向量化
|
||
|
||
- 支持多种嵌入模型
|
||
- 向量数据库存储
|
||
- 相似度检索
|
||
|
||
## API接口
|
||
|
||
知识库相关API位于 `backend/app/api/knowledge.py`
|
||
|
||
### 主要端点
|
||
|
||
| 方法 | 路径 | 说明 |
|
||
|------|------|------|
|
||
| GET | /api/v1/knowledge/bases | 获取知识库列表 |
|
||
| POST | /api/v1/knowledge/bases | 创建知识库 |
|
||
| POST | /api/v1/knowledge/bases/{id}/documents | 上传文档 |
|
||
| GET | /api/v1/knowledge/search | 搜索知识 |
|
||
|
||
## 配置
|
||
|
||
环境变量:
|
||
- `KNOWLEDGE_EMBEDDING_MODEL` - 嵌入模型
|
||
- `KNOWLEDGE_VECTOR_DB` - 向量数据库类型
|