国诚投顾:DeepSeek降低制程依赖,带动国产供应链
️核心观点
DeepSeek通过工程化创新实现降本增效:2025年1月20日,DeepSeek发布了全新的开源推理大模型DeepSeek-R1,震动海内外科技圈。DeepSeek从三个核心角度进行了技术创新,实现了仅用2048块英伟达H800GPU,耗费了557.6万美元就完成GPT-4、Claude-3.5-Sonnet等同等规模的模型训练。同时,在技术评估过程中,DeepSeek-v3的教育类基准测试表现超越了所有的开源模型,在数学领域的所有非CoT模型中也取得了最优性能。1、架构创新:采用了经DeepSeek-V2验证的MLA和DeepSeekMoE技术,并创新性地引入了无辅助损失负载均衡策略。2、高效预训练:设计了专门的FP8训练混合精度框架,以实现训练效率和数值稳定性的最优平衡。开发了DualPipe算法实现高效的流水线并行处理,降低训练过程中的通信开销。3、知识蒸留:创新性的将从longChain-of-Thought(CoT)模型中提炼推理能力集成到标准LLM中。
降低制程依赖。AI普惠化的里程碑:传统的AI训练多依赖高算力芯片,英伟达的H100曾经一卡难求。Deepseek通过技术创新成功降低了对高端GPU的依赖,可以适配国产芯片架构,并为国产芯片提供技术验证场景。
引爆国产算力,带动国产供应链:DeepSeek这种“小而美”的模型的出现,为开发者、内容创作者乃至小型初创者提供了更多的选择,端侧小模型或将遍地开花,进一步带动了国产算力的需求。日前,台积电再次限制中国大陆IC设计公司的流片封装,追使芯片制造向国内可用的先进制程转移。DeepSeek和国产算力芯片的适配不仅给予我国AI发展弯道超车的机会,也将进一步拾升我国半导体制造产业链的天花板。我们认为,在内部需求爆发和地缘政治的共同影响下,我国半导体产业链相关企业将获得更多的验证机会和场景,步入良性循环。
️投资策略
看好国产算力需求爆发和半导体制造产业链天花板拾升。建议关注,国产算力芯片公司、半导体制造公司、半导体设备公司、半导体材料公司、半导体封测公司等。
参考来源:2005年2月11日 中国银河证券 高峰 钟宇佳 电子行业行业点评报告:DeepSeek降低制程依赖,带动国产供应链
️特别声明:分享的题材方向和研报,旨在为您梳理选股方向,不构成投资建议,据此操作,风险自担!
️本文由投资顾问:尚亚雄 A1290623030001 编辑整理