Fleet Sim 概览
Fleet Sim 是 vLLM Semantic Router 维护的机队模拟器。vllm-sr-sim 包提供其 CLI 与服务入口,用于在部署前规划 GPU 机队、比较路由与拆分策略,并在仪表盘中暴露这些工作流,而无需恢复单独的模拟器前端。
Fleet Sim 的用途
- 在延迟目标下为同构、异构或拆分的机队做规模估算
- 比较不同 GPU、路由策略与阈值下的年化成本
- 用仿真运行、轨迹回放与假设分析验证规划假设
- 通过维护中的后端代理在仪表盘中呈现上述工作流
Fleet Sim 不做什么
- 不是路由器的在线请求路径
- 不是运行时自动扩缩或突发控制器
- 不是针对单个部署副本的逐算子分析器
- 不能替代路由器配置文档
部署形态
vllm-sr-sim 可以:
- 作为独立 Python CLI,用于本地规模估算与假设分析
- 以 HTTP 服务运行:
vllm-sr-sim serve - 作为
vllm-sr serve默认在共享vllm-sr-network上启动的边车容器