RAGflow/api/db/services/write_service.py

import time
from api.db import LLMType, ParserType
from api.db.services.knowledgebase_service import KnowledgebaseService
from api.db.services.llm_service import LLMBundle
from api import settings
from rag.app.tag import label_question
from rag.prompts import kb_prompt
from .database import MINIO_CONFIG


def write_dialog(question, kb_ids, tenant_id, similarity_threshold, keyword_similarity_weight, temperature):
    """
    处理用户搜索请求，从知识库中检索相关信息并生成回答

    参数:
        question (str): 用户的问题或查询
        kb_ids (list): 知识库ID列表，指定要搜索的知识库
        tenant_id (str): 租户ID，用于权限控制和资源隔离

    流程:
        1. 获取指定知识库的信息
        2. 确定使用的嵌入模型
        3. 根据知识库类型选择检索器(普通检索器或知识图谱检索器)
        4. 初始化嵌入模型和聊天模型
        5. 执行检索操作获取相关文档片段
        6. 格式化知识库内容作为上下文
        7. 构建系统提示词
        8. 生成回答并添加引用标记
        9. 流式返回生成的回答

    返回:
        generator: 生成器对象，产生包含回答和引用信息的字典
    """

    kbs = KnowledgebaseService.get_by_ids(kb_ids)
    embedding_list = list(set([kb.embd_id for kb in kbs]))

    is_knowledge_graph = all([kb.parser_id == ParserType.KG for kb in kbs])
    retriever = settings.retrievaler if not is_knowledge_graph else settings.kg_retrievaler
    # 初始化嵌入模型，用于将文本转换为向量表示
    embd_mdl = LLMBundle(tenant_id, LLMType.EMBEDDING, embedding_list[0])
    # 初始化聊天模型，用于生成回答
    chat_mdl = LLMBundle(tenant_id, LLMType.CHAT)
    # 获取聊天模型的最大token长度，用于控制上下文长度
    max_tokens = chat_mdl.max_length
    # 获取所有知识库的租户ID并去重
    tenant_ids = list(set([kb.tenant_id for kb in kbs]))
    # 调用检索器检索相关文档片段
    kbinfos = retriever.retrieval(question, embd_mdl, tenant_ids, kb_ids, 1, 12, similarity_threshold, 1 - keyword_similarity_weight, aggs=False, rank_feature=label_question(question, kbs))
    # 将检索结果格式化为提示词，并确保不超过模型最大token限制
    knowledges = kb_prompt(kbinfos, max_tokens)

    prompt = """
    角色：你是一个聪明的助手。  
    任务：总结知识库中的信息并回答用户的问题。  
    要求与限制：
    - 绝不要捏造内容，尤其是数字。
    - 如果知识库中的信息与用户问题无关，只需回答：对不起，未提供相关信息。
    - 使用Markdown格式进行回答。
    - 使用用户提问所用的语言作答。
    - 绝不要捏造内容，尤其是数字。

    ### 来自知识库的信息
    %s

    以上是来自知识库的信息。

    """ % "\n".join(knowledges)
    msg = [{"role": "user", "content": question}]

    answer = ""
    final_answer = ""
    for ans in chat_mdl.chat_streamly(prompt, msg, {"temperature": temperature}):
        answer = ans
        final_answer = answer
        yield {"answer": answer, "reference": {}}

    # 流式返回完毕后，追加图片
    image_markdowns = []
    image_urls = set()
    minio_endpoint = MINIO_CONFIG["visit_point"]
    use_ssl = MINIO_CONFIG.get("secure", False)
    protocol = "https" if use_ssl else "http"

    for chunk in kbinfos["chunks"]:
        img_path = chunk.get("image_id")
        if not img_path:
            continue

        img_path = img_path.strip()  # 清理前后空格
        img_url = f"{protocol}://{minio_endpoint}/{img_path}"

        if img_url not in image_urls:
            image_urls.add(img_url)
            image_markdowns.append(f"\n![{img_url}]({img_url})")

    if image_markdowns:
        final_answer += "".join(image_markdowns)
        yield {"answer": final_answer, "reference": {}}

    time.sleep(0.1)  # 增加延迟，确保缓冲区 flush 出去
-												refactor(write): 增加延迟，实现图片的返回输出

- 在 write_dialog 函数末尾添加 0.1 秒的延迟
- 确保缓冲区在数据传输时能够及时 flush 出去

											
										
										
											2025-06-05 09:33:46 +08:00
+								import time
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								from api.db import LLMType, ParserType
 								from api.db.services.knowledgebase_service import KnowledgebaseService
 								from api.db.services.llm_service import LLMBundle
 								from api import settings
 								from rag.app.tag import label_question
 								from rag.prompts import kb_prompt
-												refactor(write): 文档撰写模式修改生图逻辑，适配 PR#154 的修改

											
										
										
											2025-06-07 15:41:33 +08:00
+								from .database import MINIO_CONFIG
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								def write_dialog(question, kb_ids, tenant_id, similarity_threshold, keyword_similarity_weight, temperature):
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								    """
 								    处理用户搜索请求，从知识库中检索相关信息并生成回答
 								    参数:
 								        question (str): 用户的问题或查询
 								        kb_ids (list): 知识库ID列表，指定要搜索的知识库
 								        tenant_id (str): 租户ID，用于权限控制和资源隔离
 								    流程:
 . 获取指定知识库的信息
 . 确定使用的嵌入模型
 . 根据知识库类型选择检索器(普通检索器或知识图谱检索器)
 . 初始化嵌入模型和聊天模型
 . 执行检索操作获取相关文档片段
 . 格式化知识库内容作为上下文
 . 构建系统提示词
 . 生成回答并添加引用标记
 . 流式返回生成的回答
 								    返回:
 								        generator: 生成器对象，产生包含回答和引用信息的字典
 								    """
 								    kbs = KnowledgebaseService.get_by_ids(kb_ids)
 								    embedding_list = list(set([kb.embd_id for kb in kbs]))
 								    is_knowledge_graph = all([kb.parser_id == ParserType.KG for kb in kbs])
 								    retriever = settings.retrievaler if not is_knowledge_graph else settings.kg_retrievaler
 								    # 初始化嵌入模型，用于将文本转换为向量表示
 								    embd_mdl = LLMBundle(tenant_id, LLMType.EMBEDDING, embedding_list[0])
 								    # 初始化聊天模型，用于生成回答
 								    chat_mdl = LLMBundle(tenant_id, LLMType.CHAT)
 								    # 获取聊天模型的最大token长度，用于控制上下文长度
 								    max_tokens = chat_mdl.max_length
 								    # 获取所有知识库的租户ID并去重
 								    tenant_ids = list(set([kb.tenant_id for kb in kbs]))
 								    # 调用检索器检索相关文档片段
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								    kbinfos = retriever.retrieval(question, embd_mdl, tenant_ids, kb_ids, 1, 12, similarity_threshold, 1 - keyword_similarity_weight, aggs=False, rank_feature=label_question(question, kbs))
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								    # 将检索结果格式化为提示词，并确保不超过模型最大token限制
 								    knowledges = kb_prompt(kbinfos, max_tokens)
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								    prompt = """
 								    角色：你是一个聪明的助手。
 								    任务：总结知识库中的信息并回答用户的问题。
 								    要求与限制：
 								    - 绝不要捏造内容，尤其是数字。
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								    - 如果知识库中的信息与用户问题无关，只需回答：对不起，未提供相关信息。
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								    - 使用Markdown格式进行回答。
 								    - 使用用户提问所用的语言作答。
 								    - 绝不要捏造内容，尤其是数字。
 								    ### 来自知识库的信息
 								    %s
 								    以上是来自知识库的信息。
 								    """ % "\n".join(knowledges)
 								    msg = [{"role": "user", "content": question}]
 								    answer = ""
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								    final_answer = ""
 								    for ans in chat_mdl.chat_streamly(prompt, msg, {"temperature": temperature}):
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								        answer = ans
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								        final_answer = answer
-												feat(write): 实现 AI 流式回答功能并优化编辑器交互

- 新增流式消息发送钩子和相关状态管理
- 实时更新编辑器内容，支持 <think> 标签显示
- 优化光标位置管理和内容插入逻辑
- 增加 AI 回答中断处理和用户输入时的流式输出中断
- 调整预览模式下的内容显示
- 优化 AI 回答状态的 UI 提示

											
										
										
											2025-06-04 18:56:30 +08:00
+								        yield {"answer": answer, "reference": {}}
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
 								    # 流式返回完毕后，追加图片
 								    image_markdowns = []
 								    image_urls = set()
-												refactor: 优化容器连接配置和minio图片访问路径

- 在数据库服务中添加 MINIO_VISIT_HOST 配置，用于指定 MinIO 访问主机
- 修改对话服务和写入服务中生成 MinIO URL 的逻辑，使用新的 visit_point 配置

											
										
										
											2025-06-08 20:44:14 +08:00
+								    minio_endpoint = MINIO_CONFIG["visit_point"]
-												refactor(write): 文档撰写模式修改生图逻辑，适配 PR#154 的修改

											
										
										
											2025-06-07 15:41:33 +08:00
+								    use_ssl = MINIO_CONFIG.get("secure", False)
 								    protocol = "https" if use_ssl else "http"
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								    for chunk in kbinfos["chunks"]:
-												refactor(write): 文档撰写模式修改生图逻辑，适配 PR#154 的修改

											
										
										
											2025-06-07 15:41:33 +08:00
+								        img_path = chunk.get("image_id")
 								        if not img_path:
 								            continue
 								        img_path = img_path.strip()  # 清理前后空格
 								        img_url = f"{protocol}://{minio_endpoint}/{img_path}"
 								        if img_url not in image_urls:
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								            image_urls.add(img_url)
 								            image_markdowns.append(f"\n![{img_url}]({img_url})")
 								    if image_markdowns:
-												refactor(write): 增加延迟，实现图片的返回输出

- 在 write_dialog 函数末尾添加 0.1 秒的延迟
- 确保缓冲区在数据传输时能够及时 flush 出去

											
										
										
											2025-06-05 09:33:46 +08:00
+								        final_answer += "".join(image_markdowns)
-												feat(write): 优化文档撰写对话输出功能并添加图片支持

- 更新 write_dialog 函数，增加相似度阈值、关键词相似度权重和温度参数
- 在对话服务中添加图片 Markdown 支持
- 调整 Web 前端的写入功能，支持流式输出和图片显示
- 优化模板内容和插入点标记

											
										
										
											2025-06-05 00:52:23 +08:00
+								        yield {"answer": final_answer, "reference": {}}
-												refactor(write): 增加延迟，实现图片的返回输出

- 在 write_dialog 函数末尾添加 0.1 秒的延迟
- 确保缓冲区在数据传输时能够及时 flush 出去

											
										
										
											2025-06-05 09:33:46 +08:00
 								    time.sleep(0.1)  # 增加延迟，确保缓冲区 flush 出去