DeepSeek+ragflow构建企业知识库:高级应用篇
2025-03-04 19:14 126
0
0
免费使用
画布
|
大纲
# DeepSeek+ragflow构建企业知识库:高级应用篇
## 常见误解
### 使用本地知识库后,大模型是否能自学习
#### 解释:不能自学习
### 使用了知识库一定能检索到
#### 向量的不确定性
##### 示例:广东与广西在向量认知中的相似性
#### 向量过程部分内容丢失
##### 滑动窗口叠加解决部分问题
### 不管使用dify还是ragflow都能达到预期效果
#### 需要根据文档调整参数
#### 数据格式不统一
### 用了知识库可以解决一切问题
#### 知识库解决的是上下文长度限制问题
#### 大模型擅长的任务(如总结)
## ragflow中的团队与权限管理
### 用户角色
#### Invite:邀请状态
#### Nomal:被邀请人同意后的状态
#### 团队负责人可删除成员
### 加入团队的操作
#### 自己的团队:owner角色
#### 别人邀请:同意或拒绝操作
#### 同意后:退出操作
### 权限设置示例
#### 公司、部门、小组、个人知识库的不同权限范围
## 知识库详解
### 文档语言支持
#### 中文、英文、越南语、巴西葡萄牙语
### 权限设置
#### 个人、团队权限差异
### 嵌入模型选择
#### bge-m3-large和bce-embedding-base_v1的效果对比
### 解析方法(chunk)
#### General分块
##### 支持DOCX、EXCEL等格式
#### Q&A分块
##### 支持excel、csv/txt格式
#### Resume分块
##### 支持DOCX、PDF、TXT格式
#### Manual分块
##### 仅支持PDF
#### Table分块
##### 支持EXCEL和CSV/TXT格式
#### Paper分块
##### 仅支持PDF文件
#### Book分块
##### 支持DOCX、PDF、TXT
#### Laws分块
##### 支持DOCX、PDF、TXT
#### Presentation分块
##### 支持PDF、PPTX
#### One分块
##### 支持DOCX、EXCEL、PDF、TXT
#### Tag分块
##### 支持EXCEL和CSV/TXT文件格式
## 实战演练
### 网盘链接资料演示
### 知识库设置说明
#### 数据集上传及解析方法选择
#### 布局识别和OCR功能
### 建立三个知识库
#### 知识库1:演示稿解析方法
#### 知识库2:通用解析方法
#### 知识库3:演示稿+自动关键词创建
## 总结
### 知识检索测试中开启知识图谱效果最佳
### 聊天效果方面通用解析更符合需求
### 注意事项
#### 失败后不要清空chunk
#### Docker崩溃处理
#### 数据映射配置建议
## 类别标签
作者其他创作