模型蒸馏

DeepSeek 模型蒸馏范式笔记,概览 Base/Chat 模型与 COT 数据微调流程。

495 技术#AI#DeepSeek#模型蒸馏



总访问
发表了 32 篇文章 🔸 总计 88.4k 字