编译 | 郑丽媛出品 | CSDN(ID:CSDNnews)AI 大模型的能力,这几年来我们已经有目共睹——然而当 AI 面临失败时,它会怎么做呢?根据 Palisade Research 的最新研究显示,OpenAI 的 o1-preview 和 ...
【新智元报道】艾米丽•琼斯,智子乔杨编辑报道。最近,斯坦福大学发布了一项引人注目的研究,揭示了备受瞩目的AI大模型——o1-preview在数学领域的弱点。尽管这一模型在数学与代码问题上表现出众,但一旦对数学竞赛题目稍加修改,其准确率便骤然下降约30%。这一发现不仅为AI的发展指明了新方向,也让大家重新审视当前AI模型的真实能力。 数学竞赛的领域内,普特南数学竞赛历史悠久,其重要性不言而喻。自19 ...
新智元报道 编辑:智子 乔杨【新智元导读】斯坦福大学最近的一项研究发现,尽管o1-preview在数学、代码等领域能力逆天,但只要对数学竞赛的题目稍修改,模型解答的准确率竟会立刻下降30%。在数学竞赛的领域里,普特南数学竞赛的威名可谓如雷贯耳。它由William Lowell ...
在技术进步飞速发展的今天,人工智能领域迎来了一个引人瞩目的新突破。最近,UC伯克利的研究团队利用仅仅4500美元的低成本,成功复刻了DeepSeek,并且还创造出一个全新的15亿参数模型——DeepScaleR-1.5B-Preview。这一成果不仅在技术上取得了显著的突破,更是在AIME2024基准测试中,以高达43.1%的Pass@1准确率,超越了OpenAI的o1-preview,震撼了整个 ...
IT之家 1 月 25 日消息,IT之家从中国电信人工智能研究院获悉,其“复杂推理大模型”TeleAI-t1-preview 现已正式发布,即将上线天翼 AI 开放平台。TeleAI-t1-preview 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。
编辑:编辑部 【新智元导读】只用4500美元成本,就能成功复现DeepSeek?就在刚刚,UC伯克利团队只用简单的RL微调,就训出了DeepScaleR-1.5B-Preview,15亿参数模型直接吊打o1-preview,震撼业内。 强化学习迎来重大突破!