结果,令人出乎意料的事情发生了:只用不到10美元的成本,他就在一个3B模型上复刻了DeepSeek的顿悟时刻。 几乎就像是这个3B模型本身就具备了做出惊人事情的潜力,我们需要的,只是通过正确的方式赋予它一定的自主性而已。
复刻DeepSeek的神话,还在继续。之前,UC伯克利的博士只用30美元,就复刻了DeepSeek中的顿悟时刻,震惊圈内。这一次,来自荷兰阿姆斯特丹的研究人员Raz,再次打破纪录,把复刻成本降到了史上最低——只要10美元,就能复现DeepSeek顿悟 ...
除了全模态理解小模型Megrez-3B-Omni外,无问芯穹还开源了其纯语言版本Megrez-3B-Instruct。据官方宣称,与上一代及其他端侧大语言模型相比,单模态 ...