RAGflow/management/server/services
zstar fa17fd40bd
feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33)
- 新增 `get_text_from_block` 函数,用于从 `preproc_blocks` 中提取文本内容
- 在 `perform_parse` 中增加对 `middle_json_content` 的解析,提取块信息并匹配到文本块
- 更新 ES 文档结构,增加 `page_num_int` 和 `position_int` 字段,记录块在文档中的位置
2025-04-17 20:32:48 +08:00
..
files feat(解析文件类型增加): 解析文件增加对word和ppt的支持。 (#32) 2025-04-17 16:31:20 +08:00
knowledgebases feat(pdf解析块坐标溯源): 对mineru的解析结果,增加pdf解析块坐标溯源功能 (#33) 2025-04-17 20:32:48 +08:00
teams refactor(database): 统一数据库配置并移除重复代码 (#22) 2025-04-12 16:40:35 +08:00
tenants refactor(database): 统一数据库配置并移除重复代码 (#22) 2025-04-12 16:40:35 +08:00
users refactor(database): 统一数据库配置并移除重复代码 (#22) 2025-04-12 16:40:35 +08:00