Scalling - 搜索 News

3 天

在近年来的人工智能领域，Scaling Law的探讨成为了一个热议话题。财通证券最新发布的研报指出，Scaling Law作为实验科学的重要产物，正面临着数据资源枯竭的挑战，其传统的适用性受到质疑。特别是在大语言模型（LLM）领域，Scaling ...

3 天

财通证券：Scaling Law转向AI基座升级，投资机遇新探讨

近日，财通证券发布了一份关于Scaling ...

腾讯网3 天

财通证券：Scaling Law向后训练、推理阶段转移建议关注AI基座环节

智通财经APP获悉，财通证券发布研报称，Scaling Law作为实验科学的产物，目前面临数据资源枯竭的挑战，Transformer架构也未能完全表达人脑的思考机制。该行认为，对Scaling ...

搜狐3 天

财通证券：Scaling Law向后训练、推理阶段转移建议关注AI基座环节

近日，财通证券发布研报，对AI领域的Scaling Law进行了深入分析。Scaling Law作为实验科学的产物，目前正面临数据资源枯竭的挑战，同时Transformer架构 ...

来自MSN3 天

当百元显卡 P106 遇到 Lossless Scaling 小黄鸭拼好帧是什么效果

经常打游戏的朋友肯定知道，近期最火的游戏插件莫过于补帧软件 Lossless Scaling 小黄鸭了。它可以通过补帧的方式直接让游戏的帧数翻倍，想比起大几千显卡的才有的 DLSS 而言，这软件只需要 29 元，史低甚至只要 4 元（不过是很久之前了 ...

6 天

Grok 3用20万GPU帮AI界做了个实验：Scaling Law没撞墙，但预训练不一定

但是卡多有个好处，就是能压缩实验新想法和训练大模型基座的时间周期。比如你总得探索一些不同的算法、参数或数据配比的模型进行各种实验，你有10个新想法，如果只有2000张卡，可能得跑5天才能得出结论，要是有几万张卡，可能1天就能得出结论，所以卡多对于探索 ...

59 分钟on MSN

一手实测「豆包」深度思考模式：能超越 DeepSeek 吗？

字节跳动旗下AI助手豆包正在小范围测试深度思考模型，据豆包相关负责人对极客公园表示，当前测试的是自家深度思考模型的不同实验版本。另外有报道称，豆包正在测试的深度思考模型是基于豆包1.5基座模型研发。

腾讯网6 小时

DeepSeek开源第三弹：惊人的300行代码驱动R1和V3的训练与推理，超越 ...

DeepSeek开源周第三弹！DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM：极致性能，代码精简，助力V3/R1模型训练与推理！简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) ...

2 天

谷歌超硬核教科书来了，Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

近日，谷歌DeepMind科学家Jacob Austint在X上，发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。进入教科书网站，可以看到大写的标题：「如何扩大模型规模（ How ...

19 分钟

AI技术平权打破垄断！公募重新审视“独家”逻辑

平安科技创新基金经理翟森认为，deepseek模型带来的技术平权趋势愈发显著，开源框架打破闭源模型垄断。中小开发者借助云部署或本地化部署，无需大量算力就能构建垂直场景模型，催生长尾需求。同时，模型使用门槛不断降低，推动用户心智从 “尝鲜” 向 “刚需” 转变，普通用户也能轻松将模型融入生活。在此背景下，AI ...

3 小时

一手实测豆包深度思考模式：猜能超越DeepSeek吗

在这个简单数学题上，豆包和 deepseek 都遵循了小数比较的基本规则，并采用多种方法验证；不同点在于豆包注重教学引导和考虑到用户可能的误解，而 DeepSeek 则更现自我质疑和反复验证，思考过程更复杂。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果