5 天
来自MSN博导私藏的DeepSeek论文指令被我挖到啦🔥▫ ️当我把「暴躁导师」人设喂给AI: 【输入咒语】"现在扮演纳米材料领域毒舌教授,用红色标注我论文中3个最智障的结论" (第二天收到批注:"这段实验设计,狗看了都得汪两声"😅) ▫ ️当SCI润色开启贵族模式: 【输入咒语】"把'我们发现效果很好 ...
近日,基于昇腾AI硬件与昇思MindSporeAI框架版本的DeepSeek-V3完成开发支持并上线昇思开源社区,面向开发者提供开箱即用的预训练和推理能力,并已成功在大规模集群上预训练和部署。
自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果