zstar
|
803cc7e656
|
feat: 添加系统Embedding配置功能并优化文档解析 (#35)
在知识库模块中新增了获取和设置系统Embedding配置的API接口,支持动态配置Embedding模型的基础URL、模型名称和API Key。同时,优化了文档解析逻辑,使用系统配置的Embedding模型生成文本块的向量,并将图片与文本块关联存储。
|
2025-04-18 22:34:25 +08:00 |
zstar
|
61d924a4fa
|
refactor: 优化代码结构和UI组件,移除前台和后台功能冲突的组件 (#34)
本次提交主要对代码进行了重构,移除了未使用的代码和注释,优化了部分UI组件的布局和样式。具体包括:
1. 移除了多个文件中的未使用代码和注释。
2. 调整了部分UI组件的布局,使其更加简洁和一致。
3. 更新了logo.svg文件,优化了图标的设计。
4. 修复了部分组件中的样式问题,提升了用户体验。
|
2025-04-18 10:18:07 +08:00 |
zstar
|
fa17fd40bd
|
feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33)
- 新增 `get_text_from_block` 函数,用于从 `preproc_blocks` 中提取文本内容
- 在 `perform_parse` 中增加对 `middle_json_content` 的解析,提取块信息并匹配到文本块
- 更新 ES 文档结构,增加 `page_num_int` 和 `position_int` 字段,记录块在文档中的位置
|
2025-04-17 20:32:48 +08:00 |
zstar
|
6057163f28
|
feat(解析文件类型增加): 解析文件增加对word和ppt的支持。 (#32)
增加对word和ppt的支持,需要安装LibreOffice。同时,将文档解析逻辑从 `KnowledgebaseService` 中提取到独立的 `document_parser.py` 模块,以提高代码的可维护性和复用性。同时优化了文件上传和临时文件处理的逻辑,确保资源正确释放。
|
2025-04-17 16:31:20 +08:00 |