zstar
|
6057163f28
|
feat(解析文件类型增加): 解析文件增加对word和ppt的支持。 (#32)
增加对word和ppt的支持,需要安装LibreOffice。同时,将文档解析逻辑从 `KnowledgebaseService` 中提取到独立的 `document_parser.py` 模块,以提高代码的可维护性和复用性。同时优化了文件上传和临时文件处理的逻辑,确保资源正确释放。
|
2025-04-17 16:31:20 +08:00 |
zstar
|
99cc31dc67
|
feat:Elasticsearch添加/图片解析保存 (#27)
* feat(elasticsearch): 添加Elasticsearch集成以支持知识库文档索引
在`database.py`中添加Elasticsearch客户端连接配置和初始化逻辑,并在`knowledgebases/service.py`中实现文档内容块的上传和索引功能。通过Elasticsearch,文档内容将被索引并支持快速搜索,提升知识库的检索效率。
* feat(知识库): 添加图片处理功能并优化资源清理
在知识库服务中添加对图片块的处理功能,支持上传图片到MinIO并设置公共访问权限。同时,在知识库页面组件中添加资源清理逻辑,确保在组件卸载或停用时释放资源。
|
2025-04-15 00:35:33 +08:00 |
zstar
|
dbc75f7ed8
|
feat(文档解析): 新增文档解析功能及相关API和组件(该版本实现了chunk在MinIO的存储及task表的更新) (#26)
- 添加magic-pdf和transformers依赖
- 实现文档解析进度查询和启动解析的API
- 新增DocumentParseProgress组件用于展示解析进度
- 在知识库页面集成文档解析功能
- 实现后端文档解析逻辑,支持PDF文件的解析和进度跟踪
|
2025-04-14 21:23:11 +08:00 |
zstar
|
16b8ca49b5
|
feat(知识库): 修改文件管理查询、插入逻辑,新增知识库管理功能 (#25)
知识库管理功能,包括:
1. 新增知识库相关路由、服务和前端接口
2. 新增知识库文档管理功能
3. 新增知识库图标及类型定义
4. 优化文件上传和下载逻辑
5. 新增标准响应格式工具函数
|
2025-04-14 10:11:02 +08:00 |