Commit Graph

20 Commits

Author SHA1 Message Date
zstar 86256b3399 feat(knowledgebase): 添加知识库头像功能
- 在知识库详情中增加头像字段
- 实现知识库头像的上传和显示功能
- 优化知识库编辑界面,支持头像修改
- 调整后端 API 和数据库以支持头像存储
2025-06-13 18:28:49 +08:00
zstar d99c9e5c42 fix: 移除文档时删除es中的记录,修复移除文档后知识残留的问题 2025-06-13 00:22:46 +08:00
zstar 59d5ca5c95 refactor(management): 后台解析时,添加日志记录
- 在管理端应用中添加日志记录功能,用于记录解析过程中的信息和错误
- 优化代码格式和结构,提高可读性和可维护性
- 在.docker-compose.yml中添加日志目录挂载
- 清理无用的环境变量加载代码
2025-06-10 12:29:26 +08:00
zstar 04439e6640 fix(knowledgebase): 修复私人知识库访问权限问题
- 修改文档解析逻辑,使用知识库创建者作为 tenant_id
2025-06-02 01:48:11 +08:00
zstar d847d1ddad refactor(tokenizer): 实现解析分词,和原版分词同步
- 新增 RagTokenizer 类,实现中英文混合文本的分词功能
- 优化文档解析过程中的分词操作,提高处理效率和准确性
- 移除知识图谱相关无用代码,简化文档结构
- 添加 tokenizer 依赖到 requirements.txt
2025-06-01 20:46:29 +08:00
zstar 42cf80c082 fix: 修复知识库检索问题 2025-05-16 21:42:19 +08:00
zstar 8ce493003b
feat(文档解析): 适配硅基流动平台并优化Embedding配置处理 (#97) (#97) 2025-05-16 13:48:16 +08:00
zstar d0d7a24297
feat:知识库精细化管理 (#96)
* feat(知识库管理): 新增知识库创建人选择功能 (#96)

* "feat(知识库管理): 新增知识库权限修改功能并扩展操作列宽度 (#97)"

* feat(文档解析): 添加embedding向量维度校验,确保维度为1024并提示使用bge-m3模型
2025-05-15 16:01:39 +08:00
zstar c787ae7eac
feat(知识库管理): 添加文档和文件列表排序功能并优化表格交互 (#90) 2025-05-14 15:36:22 +08:00
zstar e9efc51179
feat(知识库管理): 添加知识库列表排序功能并优化表格交互 (#88)
* feat(知识库管理): 添加知识库列表排序功能并优化表格交互
2025-05-14 14:17:15 +08:00
zstar 63c6838701
feat(用户管理): 添加重置用户密码功能 (#53)
在用户管理页面中新增重置用户密码的功能,包括前端对话框、表单验证、API调用以及后端服务层的密码重置逻辑。同时,更新了用户管理页面的操作列,增加了重置密码按钮,并调整了相关UI样式。
2025-04-25 17:20:49 +08:00
zstar 51f4381a65
refactor: 优化 Embedding URL 拼接逻辑,以兼容vllm和ollama等不同框架 (#50)
- 在 document_parser.py 和 service.py 中优化 Embedding URL 拼接逻辑,支持不同形式的 base_url
- 在 axios.ts 中将 400 错误消息从 "账号密码不正确" 更新为 "请求错误"
2025-04-24 23:29:47 +08:00
zstar 2191d1bcd3 refactor(docker): 将GPU配置分离到独立的docker-compose_gpu.yml文件
为了更清晰地管理GPU和非GPU环境,将GPU相关的资源配置从docker-compose.yml中分离出来,并创建了独立的docker-compose_gpu.yml文件。
2025-04-23 23:49:15 +08:00
zstar 2a7e4f2df1
feat(知识库): 添加批量文档解析功能 (#36)
新增顺序批量文档解析功能,支持在知识库详情页启动批量解析任务,并通过轮询实时监控任务进度。该功能包括:
1. 后端新增顺序批量解析路由和服务逻辑
2. 前端添加批量解析按钮和进度展示组件
3. 支持后台异步执行批量解析任务
2025-04-19 01:27:37 +08:00
zstar 803cc7e656
feat: 添加系统Embedding配置功能并优化文档解析 (#35)
在知识库模块中新增了获取和设置系统Embedding配置的API接口,支持动态配置Embedding模型的基础URL、模型名称和API Key。同时,优化了文档解析逻辑,使用系统配置的Embedding模型生成文本块的向量,并将图片与文本块关联存储。
2025-04-18 22:34:25 +08:00
zstar fa17fd40bd
feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33)
- 新增 `get_text_from_block` 函数,用于从 `preproc_blocks` 中提取文本内容
- 在 `perform_parse` 中增加对 `middle_json_content` 的解析,提取块信息并匹配到文本块
- 更新 ES 文档结构,增加 `page_num_int` 和 `position_int` 字段,记录块在文档中的位置
2025-04-17 20:32:48 +08:00
zstar 6057163f28
feat(解析文件类型增加): 解析文件增加对word和ppt的支持。 (#32)
增加对word和ppt的支持,需要安装LibreOffice。同时,将文档解析逻辑从 `KnowledgebaseService` 中提取到独立的 `document_parser.py` 模块,以提高代码的可维护性和复用性。同时优化了文件上传和临时文件处理的逻辑,确保资源正确释放。
2025-04-17 16:31:20 +08:00
zstar 99cc31dc67
feat:Elasticsearch添加/图片解析保存 (#27)
* feat(elasticsearch): 添加Elasticsearch集成以支持知识库文档索引

在`database.py`中添加Elasticsearch客户端连接配置和初始化逻辑,并在`knowledgebases/service.py`中实现文档内容块的上传和索引功能。通过Elasticsearch,文档内容将被索引并支持快速搜索,提升知识库的检索效率。

* feat(知识库): 添加图片处理功能并优化资源清理

在知识库服务中添加对图片块的处理功能,支持上传图片到MinIO并设置公共访问权限。同时,在知识库页面组件中添加资源清理逻辑,确保在组件卸载或停用时释放资源。
2025-04-15 00:35:33 +08:00
zstar dbc75f7ed8
feat(文档解析): 新增文档解析功能及相关API和组件(该版本实现了chunk在MinIO的存储及task表的更新) (#26)
- 添加magic-pdf和transformers依赖
- 实现文档解析进度查询和启动解析的API
- 新增DocumentParseProgress组件用于展示解析进度
- 在知识库页面集成文档解析功能
- 实现后端文档解析逻辑,支持PDF文件的解析和进度跟踪
2025-04-14 21:23:11 +08:00
zstar 16b8ca49b5
feat(知识库): 修改文件管理查询、插入逻辑,新增知识库管理功能 (#25)
知识库管理功能,包括:
1. 新增知识库相关路由、服务和前端接口
2. 新增知识库文档管理功能
3. 新增知识库图标及类型定义
4. 优化文件上传和下载逻辑
5. 新增标准响应格式工具函数
2025-04-14 10:11:02 +08:00