在AI领域的技术竞争日益激烈的今天,OpenAI再次站在了风口浪尖。继前一天发布O1系列新产品后,OpenAI掀起了强势的12连发,第二弹便是备受开发者和研究者关注的强化微调(Reinforcement Fine-Tuning)。虽然这一功能要到明年才能正式上线,但它无疑为未来的个性化AI模型训练探索了全新的可能。 昨晚的发布会上,OpenAI研究副总裁Mark Chen在凌晨两点的神秘时刻宣称, ...
机器之心报道编辑:Panda强化微调可以轻松创建具备强大推理能力的专家模型。昨天关于 o1 和 200 美元一个月的 o1-pro 的新闻已经消化完了吗?咱们该夸夸,该吐嘈就吐嘈,但也不得不说,OpenAI 是懂营销宣传的,至少这个 12 ...