RAGflow/management/server
zstar fa17fd40bd
feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33)
- 新增 `get_text_from_block` 函数,用于从 `preproc_blocks` 中提取文本内容
- 在 `perform_parse` 中增加对 `middle_json_content` 的解析,提取块信息并匹配到文本块
- 更新 ES 文档结构,增加 `page_num_int` 和 `position_int` 字段,记录块在文档中的位置
2025-04-17 20:32:48 +08:00
..
routes feat(文档解析): 新增文档解析功能及相关API和组件(该版本实现了chunk在MinIO的存储及task表的更新) (#26) 2025-04-14 21:23:11 +08:00
services feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33) 2025-04-17 20:32:48 +08:00
app.py feat(知识库): 修改文件管理查询、插入逻辑,新增知识库管理功能 (#25) 2025-04-14 10:11:02 +08:00
check_tables.py feat: 添加文件上传功能并完善文件管理服务 (#21) 2025-04-12 00:42:19 +08:00
clean_all_data.py feat: 管理系统新增文件管理模块 (#20) 2025-04-11 16:33:28 +08:00
cleanup_minio_buckets.py feat: 管理系统新增文件管理模块 (#20) 2025-04-11 16:33:28 +08:00
database.py fix(界面切换显示空白bug): 修复知识库管理时,切换到其它菜单,界面变空白的情况 (#31) 2025-04-16 22:22:28 +08:00
get_minio_image_url.py feat:Elasticsearch添加/图片解析保存 (#27) 2025-04-15 00:35:33 +08:00
minio_test.py feat: 管理系统新增文件管理模块 (#20) 2025-04-11 16:33:28 +08:00
requirements.txt feat:Elasticsearch添加/图片解析保存 (#27) 2025-04-15 00:35:33 +08:00
utils.py feat(知识库): 修改文件管理查询、插入逻辑,新增知识库管理功能 (#25) 2025-04-14 10:11:02 +08:00