知识蒸馏完全指南 知识蒸馏(KD)是一种将大型教师模型的知识转移给小型学生模型的技术,使小模型继承大模型能力而无需从头训练。 知识蒸馏 模型压缩 软目标 学生模型 教师模型 迁移学习 theturingpost 发布于 5 天前 29 0 0