DeepSeek R1深度解析及算力影响几何

中信建投证券发布的《DeepSeek R1深度解析及算力影响几何》报告聚焦国内模型深度推理发展状况与算力影响。关注公众号：【互联互通社区】，回复【DEEP007】获取全部报告内容。DeepSeek的R1模型展现出强大深度推理能力，R1-Zero通过纯粹强化学习证明大语言模型仅靠强化学习也可行，R1在此基础上经多次微调与强化学习优化，在数学、编程等推理任务中成绩优异，还通过蒸馏提升小模型推理能力，且

互联互通社区

220人浏览 · 2025-02-09 17:39:54

互联互通社区 · 2025-02-09 17:39:54 发布

中信建投证券发布的《DeepSeek R1深度解析及算力影响几何》报告聚焦国内模型深度推理发展状况与算力影响。

关注公众号：【互联互通社区】，回复【DEEP007】获取全部报告内容。

DeepSeek的R1模型展现出强大深度推理能力，R1-Zero通过纯粹强化学习证明大语言模型仅靠强化学习也可行，R1在此基础上经多次微调与强化学习优化，在数学、编程等推理任务中成绩优异，还通过蒸馏提升小模型推理能力，且成本较低。

其他模型同样成果显著，Kimi 1.5通过长上下文扩展等创新，在多模态和推理能力上表现卓越，其推理框架和Long2short技术优化了算力；阿里的Qwen2.5系列模型，经高质量数据集构建、上下文训练改进、扩大监督微调数据范围和两阶段强化学习，性能大幅提升，在多个领域领先。

这些模型实现低算力需求得益于多方面优化，如DeepSeek模型采用高度稀疏架构、FP8混合精度训练框架、流水线并行策略、跨节点无阻通信设计和多token预测技术，实现算法、框架和硬件协同。当前大模型行业从生成式向深度推理型转变，整体需求从预训练向后期训练和推理转移。

尽管部分模型现阶段能以较少算力实现高性能，但从长远看，随着模型发展，在深度推理阶段，对算力的需求仍将呈爆发式增长，因为算力对提升人工智能模型性能至关重要，是推动模型不断进步和拓展应用的关键因素。

精彩推荐

关注互联互通社区公众号，回复以下编号，可快速下载相关专题报告合辑。

DEEP001：Deepseek，国产AI应用的“诺曼底时刻”

DEEP002：DeepSeek，技术颠覆or创新共赢

DEEP003：DeepSeeK开启AI算法变革元年

DEEP004：Deepseek发布R1模型，OpenAI推出智能体“Operator”

DEEP005：DeepSeek：从入门到精通

DEEP006：DeepSeek 15天指导手册——从入门到精通

DEEP007：DeepSeek R1深度解析及算力影响几何

以下是报告部分内容

声明

来源：中信建投，互联互通社区推荐阅读，版权归作者所有。文章内容仅代表作者独立观点，不代表互联互通社区立场，转载目的在于传递更多信息。如涉及作品版权问题，请联系我们删除或做相关处理！

关注公众号：【互联互通社区】，回复【DEEP007】获取全部报告内容。

九章云极普惠算力

更多推荐

VideoAgentTrek-ScreenFilter代码实例：Supervisor自启服务管理实战

本文介绍了如何在星图GPU平台上自动化部署VideoAgentTrek-ScreenFilter镜像，实现基于YOLO的视频/图片屏幕内容检测服务。通过配置Supervisor守护进程，该应用可升级为具备自动重启和状态监控能力的生产级服务，确保检测任务稳定运行。

九章云极普惠算力

DeepSeek-OCR-2效果展示：印章覆盖文字、朱砂批注干扰下的鲁棒性识别能力

本文介绍了如何在星图GPU平台自动化部署🖋️ 深求·墨鉴 (DeepSeek-OCR-2)镜像，实现复杂场景下的文字识别。该镜像特别适用于处理带有印章覆盖和朱砂批注干扰的文档数字化，如古籍保护、法律合同等场景，展现出色的鲁棒性和高精度识别能力。

九章云极普惠算力

RVC在老年关怀中的应用：子女声音克隆缓解认知障碍焦虑

本文介绍了如何利用星图GPU平台自动化部署RVC语音克隆镜像，构建老年关怀应用。通过该平台，用户可快速训练个性化声音模型，并将其集成到智能陪伴系统中，用于为认知障碍老人定时播放子女声音的问候与提醒，有效缓解孤独与焦虑。

九章云极普惠算力

所有评论(0)

查看更多评论

互联互通社区

已为社区贡献66条内容