微调与蒸馏与迁移学习:它们之间有何区别? 随着Deepseek-R1及其蒸馏模型的发布,许多机器学习工程师都在思考:蒸馏和微调之间有什么区别? 生活百科# 大型语言模型# 微调# 知识蒸馏 2个月前0310
超过GPT-3.5,又一个MoE模型开源了! GPT-3.5点蓝色字关注“机器学习算法工程师”设为星标,干货直达!刚刚,又有一家AI公司Databricks开源了一个的LLM模型:DBRX。 生活百科# DBRX# MoE模型# 大型语言模型 2个月前0400