近日,来自荷兰阿姆斯特丹的研究人员Raz成功以仅10美元的成本复现了DeepSeek中的‘顿悟时刻’,这一突破引发了广泛关注。这一成果不仅突破了以往高成本的限制,更为强化学习在小型计算资源环境中的应用提供了新的可能性。
【新智元导读】不到10美元,3B模型就能复刻DeepSeek的顿悟时刻了?来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite,把复刻成本降到了史上最低!同时,微软亚研院的一项工作,也受DeepSeek-R1启发,让7B模型涌现出了高级推 ...
为解决基于基因组学的精准医学局限性问题,北卡罗来纳大学教堂山分校的研究人员开展中枢神经系统肿瘤患者来源模型(PDMCTs)在功能精准医学(FPM)应用的研究。结果表明不同模型各有优劣,该研究为 FPM 发展提供参考,值得科研人员一读。