Preview - 搜索 News

AI也“耍赖”？DeepSeek R1和o1-preview被曝在棋局中输急眼就作弊！

编译 | 郑丽媛出品 | CSDN（ID：CSDNnews）AI 大模型的能力，这几年来我们已经有目共睹——然而当 AI 面临失败时，它会怎么做呢？根据 Palisade Research 的最新研究显示，OpenAI 的 o1-preview 和 ...

21 天

斯坦福大学揭示o1-preview模型数学能力软肋：改变题目，准确率骤降30%！

【新智元报道】艾米丽•琼斯，智子乔杨编辑报道。最近，斯坦福大学发布了一项引人注目的研究，揭示了备受瞩目的AI大模型——o1-preview在数学领域的弱点。尽管这一模型在数学与代码问题上表现出众，但一旦对数学竞赛题目稍加修改，其准确率便骤然下降约30%。这一发现不仅为AI的发展指明了新方向，也让大家重新审视当前AI模型的真实能力。数学竞赛的领域内，普特南数学竞赛历史悠久，其重要性不言而喻。自19 ...

腾讯网21 天

斯坦福揭秘o1-preview软肋！数学竞赛题稍作修改，准确率骤降30%

新智元报道编辑：智子乔杨【新智元导读】斯坦福大学最近的一项研究发现，尽管o1-preview在数学、代码等领域能力逆天，但只要对数学竞赛的题目稍修改，模型解答的准确率竟会立刻下降30%。在数学竞赛的领域里，普特南数学竞赛的威名可谓如雷贯耳。它由William Lowell ...

10 天

仅用4500美元！UC伯克利突破性复现DeepSeek，轻松超越o1-preview

在技术进步飞速发展的今天，人工智能领域迎来了一个引人瞩目的新突破。最近，UC伯克利的研究团队利用仅仅4500美元的低成本，成功复刻了DeepSeek，并且还创造出一个全新的15亿参数模型——DeepScaleR-1.5B-Preview。这一成果不仅在技术上取得了显著的突破，更是在AIME2024基准测试中，以高达43.1%的Pass@1准确率，超越了OpenAI的o1-preview，震撼了整个 ...

27 天

中国电信发布“复杂推理大模型”TeleAI-t1-preview：能解《九章算术》题目

IT之家 1 月 25 日消息，IT之家从中国电信人工智能研究院获悉，其“复杂推理大模型”TeleAI-t1-preview 现已正式发布，即将上线天翼 AI 开放平台。TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

来自MSN8 天

4500美元复刻DeepSeek神话，1.5B战胜o1-preview只用RL！训练细节全公开

编辑：编辑部【新智元导读】只用4500美元成本，就能成功复现DeepSeek？就在刚刚，UC伯克利团队只用简单的RL微调，就训出了DeepScaleR-1.5B-Preview，15亿参数模型直接吊打o1-preview，震撼业内。强化学习迎来重大突破！

当前正在显示可能无法访问的结果。

隐藏无法访问的结果