deep level - 搜索 News

知乎 on MSN5 天

陆陆续续看完了DeepSeek的V2、V3、R1论文，发现了一个有趣的现象：DeepSeek竟然在不断“做减法”。 1. V2到V3：从复杂到简单，负载均衡的“减法” 在V2时代，DeepSeek为了应对混合专家架构（DeepSeekMoE）中的负载均衡问题，设计了三种辅助损失函数（auxiliary ...

13 天

长城科技军团：DeepSeek引爆“AI+”，投资进入Next Level

随着国内大模型的进步，尤其是DeepSeek实力破圈，引发产业界对AI落地期待，资金大量流入相关板块。中国科技产品在世界受到关注，也有望增强对中国科技股乃至整体中国资产的信心。我们将积极关注符合产业发展趋势的科技主线轮动，包括AI应用、AI终端、机器人、智能驾驶、低空经济等。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点