这篇文章讲的是一个面向多模型 LLM 网关的智能路由系统:先对 46+ 模型做端到端基准测试,发现速度、价格和智能度并不线性相关;再基于 14 个维度的规则分类器,对用户请求做极快的意图识别,并结合置信度校准、上下文/工具/视觉过滤和分层回退链,自动选择 SIMPLE、MEDIUM、COMPLEX、REASONING 等不同模型。作者强调,单一优化速度或质量都会失败,真正有效的是在延迟、能力、成本和用户留存之间做多目标权衡。