实战 #
环境 #
modelscope GPU
实战1 #
-
脚本[1]
-
遇到的异常[2]
实战2 #
- 脚本
### 变更模型名字
### import 'modelscope' package
- 异常[11]
实战3[20] #
- 脚本
vllm 0.2.3 -> 报异常
vllm 0.3.3 -> 报另一个异常
实战4 #
-
脚本 [30]
-
异常 [31]
# 运行这个命令报异常
python -m vllm.entrypoints.openai.api_server --trust-remote-code --served-model-name gpt-4 --model mistralai/Mixtral-8x7B-Instruct-v0.1 --gpu-memory-utilization 1 --tensor-parallel-size 8 --port 8000
monitor[40] #
Ray Dashboard[41] #
Ray logging #
Loki grafana
Built-in Ray Serve metrics #
Prometheus
参考 #
实战1 #
实战2 #
实战3 #
1xx. GitHub - ray-project/langchain-ray: Examples on how to use LangChain and Ray git