5 天
知乎 on MSN为什么直到这次deepseek v3,大家才感受到变化?陆陆续续看完了DeepSeek的V2、V3、R1论文,发现了一个有趣的现象:DeepSeek竟然在不断“做减法”。 1. V2到V3:从复杂到简单,负载均衡的“减法” 在V2时代,DeepSeek为了应对混合专家架构(DeepSeekMoE)中的负载均衡问题,设计了三种辅助损失函数(auxiliary ...
随着国内大模型的进步,尤其是DeepSeek实力破圈,引发产业界对AI落地期待,资金大量流入相关板块。中国科技产品在世界受到关注,也有望增强对中国科技股乃至整体中国资产的信心。我们将积极关注符合产业发展趋势的科技主线轮动,包括AI应用、AI终端、机器人、智能驾驶、低空经济等。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果