zstar
|
38d8932947
|
refactor(agent): 移除 deepdoc 相关代码,防止误导deepwiki
- 移除了 Dockerfile 中的 deepdoc 目录
- 删除了 invoke.py 中的 HtmlParser 导入和相关代码
- 移除了 document_app.py 中的 RAGFlowHtmlParser 导入和相关代码
- 删除了 task_service.py 中的 PdfParser 和 RAGFlowExcelParser 导入和相关代码
- 优化了部分代码格式和结构
|
2025-06-05 10:13:36 +08:00 |
zstar
|
d847d1ddad
|
refactor(tokenizer): 实现解析分词,和原版分词同步
- 新增 RagTokenizer 类,实现中英文混合文本的分词功能
- 优化文档解析过程中的分词操作,提高处理效率和准确性
- 移除知识图谱相关无用代码,简化文档结构
- 添加 tokenizer 依赖到 requirements.txt
|
2025-06-01 20:46:29 +08:00 |
zstar
|
4624f89cc1
|
up to v0.17.2_supple (#7)
|
2025-03-31 10:53:42 +08:00 |
zstar
|
1b2db41c7e
|
首次提交
|
2025-03-24 11:19:28 +08:00 |