gkisokay 的文章 - 登链社区

TA的文章 TA购买的 TA喜欢的 TA收藏的

这是一份面向32GB内存本地设备的LLM选型清单，重点推荐了适合离线运行的旗舰模型、快速旗舰模型和伴侣模型，并给出单模型与双模型搭配建议。文章核心在于根据不同任务场景（通用对话、写作、推理、代码、工具调用、长上下文RAG）选择合适的量化版本与模型规模，帮助用户在性能、速度和显存/内存占用之间做平衡。

本地大模型量化 GGUF MoE RAG 工具调用

发布于 2026-04-22 17:41 阅读(291) 点赞(0) ( 2 )