实战 #

环境 #

modelscope GPU

实战1 #

脚本[1]
遇到的异常[2]

实战2 #

脚本

### 变更模型名字

### import 'modelscope' package

异常[11]

实战3[20] #

脚本
vllm 0.2.3 -> 报异常
vllm 0.3.3 -> 报另一个异常

实战4 #

脚本 [30]
异常 [31]

# 运行这个命令报异常
python -m vllm.entrypoints.openai.api_server --trust-remote-code --served-model-name gpt-4 --model mistralai/Mixtral-8x7B-Instruct-v0.1 --gpu-memory-utilization 1 --tensor-parallel-size 8 --port 8000

monitor[40] #

Ray Dashboard[41] #

Ray logging #

Loki grafana

Built-in Ray Serve metrics #

Prometheus

参考 #

实战 #

环境 #

实战1 #

实战2 #

实战3[20] #

实战4 #

monitor[40] #

Ray Dashboard[41] #

Ray logging #

Built-in Ray Serve metrics #

参考 #

实战1 #

实战2 #

实战3 #

实战4 #

monitor #