refactor: 上调TopNItem 组件最大值为100

2025-06-07 16:14:33 +08:00 · 2025-06-07 16:14:33 +08:00 · 70647d36d5
parent e3e68f1006
commit 70647d36d5
2 changed files with 2 additions and 28 deletions
--- a/management/server/services/knowledgebases/document_parser.py
+++ b/management/server/services/knowledgebases/document_parser.py
@ -23,36 +23,10 @@ tknzr = RagTokenizer()
 def tokenize_text(text):
    """使用分词器对文本进行分词"""
    return tknzr.tokenize(text)
 def merge_chunks(sections, chunk_token_num=128, delimiter="\n。；！？"):
    """合并文本块，替代naive_merge功能(预留函数)"""
    if not sections:
        return []
    chunks = [""]
    token_counts = [0]
    for section in sections:
        # 计算当前部分的token数量
        text = section[0] if isinstance(section, tuple) else section
        # 简单估算token数量
        token_count = len(text.split())
        # 如果当前chunk已经超过限制，创建新chunk
        if token_counts[-1] > chunk_token_num:
            chunks.append(text)
            token_counts.append(token_count)
        else:
            # 否则添加到当前chunk
            chunks[-1] += text
            token_counts[-1] += token_count
    return chunks
 def _update_document_progress(doc_id, progress=None, message=None, status=None, run=None, chunk_count=None, process_duration=None):
    """更新数据库中文档的进度和状态"""
    conn = None
--- a/web/src/components/top-n-item.tsx
+++ b/web/src/components/top-n-item.tsx
@ -19,7 +19,7 @@ interface IProps {
  max?: number;
 }
-const TopNItem = ({ initialValue = 8, max = 30 }: IProps) => {
+const TopNItem = ({ initialValue = 8, max = 100 }: IProps) => {
  const { t } = useTranslate('chat');
  return (