为GLM-5.2打造世界最快API GLM-5.2是Z.ai发布的744B参数开源大模型,支持百万token上下文,在编程和智能体任务上表现优异。 GLM-5.2 大模型 推理优化 NVFP4量化 缓存路由 分离推理 philipkiely 发布于 3 天前 46 0 0