RAGflow/vllm/docker-compose.yml

services:
  vllm-bge:
    image: vllm/vllm-openai:latest
    ipc: host
    volumes:
      - ./models/bge-m3:/models
    command: [
      "--model", "/models",
      "--served-model-name", "bge-m3",
      "--dtype", "float16",
      "--gpu-memory-utilization", "0.9",
    ]
    ports:
      - "8000:8000"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              capabilities: [gpu]
    networks:
      - ragflow

  vllm-deepseek:
    image: vllm/vllm-openai:latest
    ipc: host
    volumes:
      - ./models/DeepSeek-R1-1.5B:/models
    command: [
      "--model", "/models",
      "--served-model-name", "deepseek-r1",
      "--dtype", "float16",
      "--tensor-parallel-size", "1",
      "--max-model-len", "4096"
    ]
    ports:
      - "8001:8000"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              capabilities: [gpu]
    networks:
      - ragflow

networks:
  ragflow:
    name: docker_ragflow 
    driver: bridge
chore: 添加vLLM相关配置与脚本 (#30) 更新.gitignore文件以忽略vLLM模型目录，新增docker-compose.yml、download_model.py和model_test.py文件，用于配置和测试vLLM服务。删除不再使用的magic_pdf_parser.py文件。 2025-04-16 17:23:29 +08:00			`services:`
			`vllm-bge:`
			`image: vllm/vllm-openai:latest`
			`ipc: host`
			`volumes:`
			`- ./models/bge-m3:/models`
			`command: [`
			`"--model", "/models",`
			`"--served-model-name", "bge-m3",`
			`"--dtype", "float16",`
			`"--gpu-memory-utilization", "0.9",`
			`]`
			`ports:`
			`- "8000:8000"`
			`deploy:`
			`resources:`
			`reservations:`
			`devices:`
			`- driver: nvidia`
			`capabilities: [gpu]`
			`networks:`
			`- ragflow`

			`vllm-deepseek:`
			`image: vllm/vllm-openai:latest`
			`ipc: host`
			`volumes:`
			`- ./models/DeepSeek-R1-1.5B:/models`
			`command: [`
			`"--model", "/models",`
			`"--served-model-name", "deepseek-r1",`
			`"--dtype", "float16",`
			`"--tensor-parallel-size", "1",`
			`"--max-model-len", "4096"`
			`]`
			`ports:`
			`- "8001:8000"`
			`deploy:`
			`resources:`
			`reservations:`
			`devices:`
			`- driver: nvidia`
			`capabilities: [gpu]`
			`networks:`
			`- ragflow`

			`networks:`
			`ragflow:`
			`name: docker_ragflow`
			`driver: bridge`