作者|Yoky邮箱|[email protected]、李飞飞、LIMO,全球的AI界近期几乎都被这几个名词环绕,而这一切的背后,都要从一个“大隐隐于市”的高手谈起。2月3日,李飞飞和斯坦福大学等团队在arXiv上发表了一篇名为 ...
上海交通大学的研究人员在一项新研究中发现,大语言模型 (LLMs) 无需依赖大规模数据集就能学习复杂的推理任务。他们的研究表明,只需要一小批精心策划的示例,就能训练大语言模型完成那些原本被认为需要数万个训练实例的任务。
另一方面,LIMO模型同样以极低的数据样本量实现了显著的推理能力提升。研究者们通过仅817个样本训练,使得LIMO在几个重要数学基准测试上取得了94.8%的准确率,远超以往需要成千上万样本的传统模型。LIMO的成功挑战了“有监督微调”通常需依赖大规模数据的广泛共识,证明了基础模型在特定任务中所具备的潜力,这将大大减轻开发智能推理应用所需的时间与费用。