RAGflow/management/server/services/files/file_service.py

from peewee import *
from .base_service import BaseService
from .models import File
from .utils import FileType, get_uuid

class FileService(BaseService):
    model = File

    @classmethod
    def create_file(cls, parent_id: str, name: str, location: str, size: int, file_type: str) -> File:
        return cls.insert({
            'parent_id': parent_id,
            'name': name,
            'location': location,
            'size': size,
            'type': file_type,
            'source_type': 'knowledgebase'
        })

    @classmethod
    @classmethod
    def get_parser(cls, file_type, filename, tenant_id):
        """获取适合文件类型的解析器ID"""
        # 这里可能需要根据实际情况调整
        if file_type == FileType.PDF.value:
            return "pdf_parser"
        elif file_type == FileType.WORD.value:
            return "word_parser"
        elif file_type == FileType.EXCEL.value:
            return "excel_parser"
        elif file_type == FileType.PPT.value:
            return "ppt_parser"
        elif file_type == FileType.VISUAL.value:
            return "image_parser"
        elif file_type == FileType.TEXT.value:  # 添加对文本文件的支持
            return "text_parser"
        else:
            return "default_parser"

    @classmethod
    def get_by_parent_id(cls, parent_id: str) -> list[File]:
        return cls.query(parent_id=parent_id)

    @classmethod
    def generate_bucket_name(cls):
        """生成随机存储桶名称"""
        return f"kb-{get_uuid()}"