学术观点|王亮:​蒸 馏:一种专业出版领域垂直大模型构建模式——以DeepSeek为例

学者简介:王亮,教授,博士,硕士生导师,现任经济管理学院院长。入选北京高校青年英才计划、北京市委组织部优秀人才计划。毕业于北京交通大学经济管理学院信息管理专业,获管理学博士学位。研究方向为数字版权管理、数字媒体运营管理。获得北京高校优质本科课程(北京高等学校优秀专业课主讲教师),北京印刷学院本科教学优质课堂奖,北京印刷学院青年教师教学基本功比赛一等奖,雅昌教育奖(科研类)。


蒸馏:一种专业出版领域垂直大模型构建模式——以DeepSeek为例

 大模型的生成、推理和泛化能力推动了人工智能技术的快速发展。但在专业出版领域,通用大模型因成本、时效性和专业性等问题,并不能完全满足优质出版内容的创新应用需求。垂直大模型作为一种专注于特定领域的轻量化解决方案,能够很好地解决通用大模型在专业知识领域中应用的弊端。作为DeepSeek所采用的重要技术之一,蒸馏是构建垂直大模型的有效手段。它通过将通用大模型的知识迁移至特定专业领域,在显著降低模型训练的算力和技术成本的同时,也能够有效地解决通用大模型在知识更新效率、专业权威性、用户体验以及“AI幻觉”等方面的问题。文章详细阐述了蒸馏的原理及构建方法,并以DeepSeek作为教师模型,给出了利用蒸馏技术构建垂直大模型的应用实践,为专业出版领域的人工智能应用提供参考。


(本文原载于《中国出版》2025年第05期)

点击链接阅读全文:

https://mp.weixin.qq.com/s/IZ7LThte8Q6VPg0AjMh9Tw 

版权所有:北京印刷学院经济管理学院 电话:60227810