Scalling - 搜索 News

3 小时

周鸿祎清华授课剖析DeepSeek：开启AI普惠与产业升级进程

2月25日，360集团创始人周鸿祎受清华大学邀请，进行了一场主题为“DeepSeek给我们带来的创业机会”的授课。他以DeepSeek带来的变革为切入点，剖析AI行业发展趋势，并分享了AI技术于创业的应用前景。

3 小时

周鸿祎受邀到清华授课解读DeepSeek如何重塑全球AI格局

i黑马讯 ...

9 小时

刚刚，全球首个混合推理模型Claude 3.7降世，最强编程大脑暴击DeepSeek R1

就在刚刚，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSeek R1，AI编码王者出世了。

来自MSN3 天

当百元显卡 P106 遇到 Lossless Scaling 小黄鸭拼好帧是什么效果

经常打游戏的朋友肯定知道，近期最火的游戏插件莫过于补帧软件 Lossless Scaling 小黄鸭了。它可以通过补帧的方式直接让游戏的帧数翻倍，想比起大几千显卡的才有的 DLSS 而言，这软件只需要 29 元，史低甚至只要 4 元（不过是很久之前了 ...

9 天on MSN

多模态模型Vidu1.5突破，Scaling Law迎来新拐点？

在自然语言处理领域，一个引人瞩目的现象正在显现：传统的通过增加模型规模和数据量来提升性能的Scaling Law似乎已逼近瓶颈。业界开始担忧，单纯依赖这种策略或许已难以带来显著的性能飞跃，低精度训练和推理正使得模型性能提升的边际效益逐渐递减。然而，在自然语言处理遭遇挑战的同时，多模态模型领域却似乎尚未触及这一限制。

搜狐17 天

817样本激发7倍推理性能：上交大'少即是多'定律挑战RL Scaling范式

从OpenAI的o1系列到DeepSeek-R1，各大研究机构纷纷投入海量数据和算力，试图通过强化学习（RL）来提升模型的推理能力。这种'RL Scaling'方法虽然在某些任务上取得了显著成效，但也暴露出数据依赖性强、泛化能力不足等问题。上海交通大学的研究团队提出了一种 ...

搜狐21 天

AI，回国的机票买了吗？Scaling Law与未来的算力革命

近年来，人工智能的迅猛发展仿佛在昭示着一场新的技术革命，而在这场革命的背后，Scaling Law理论为我们理解AI模型性能与规模之间的关系提供了重要的视角。Scaling Law的核心要素包括数据、算法和算力。这一理论最早由百度硅谷人工智能实验室于2017年提出 ...

搜狐27 天

大模型训练开销还能更小！微软推出FP4训练框架，效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！在相同超参数的设置下，可以达到与FP8以及BF16相当的训练效果。这意味着所需的存储和计算 ...

快科技29 天

英伟达回应股价遭DeepSeek暴击：DeepSeek是出色的AI进步

据媒体报道，英伟达发言人表示：“DeepSeek是一项出色的AI进步，也是Test Time Scaling的完美范例，DeepSeek的工作说明了如何使用该技术创建新模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果