Scaling - 搜索 News

金融界财经 on MSN9 小时

近年来全球人工智能技术加速迭代，中国的大模型企业展现出强大的创新活力。尤其DeepSeek-R1模型的横空出世，不仅以一系列颠覆式创新重新定义了行业标准，更为全球范围内的AI普惠与产业升级提供了全新路径，也因此成为近期AI创业领域无可比拟的焦点所在。

14 小时

一手实测豆包深度思考模式：猜能超越DeepSeek吗

在这个简单数学题上，豆包和 deepseek 都遵循了小数比较的基本规则，并采用多种方法验证；不同点在于豆包注重教学引导和考虑到用户可能的误解，而 DeepSeek 则更现自我质疑和反复验证，思考过程更复杂。

5 小时

顺网科技：将逐步推进“ChinaJoy”这一IP的品牌影响力和内容多样化

顺网科技在投资者关系活动记录表中披露，目前2025ChinaJoy招商工作已启动，在互动娱乐领域，公司将逐步推进“ChinaJoy”这一IP的品牌影响力和内容多样化；后续将积极推动与游戏及动漫等头部IP的业务合作关系。此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系 ...

17 小时

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

【新智元导读】就在刚刚，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSeek R1，AI编码王者出世了。

腾讯网17 小时

DeepSeek开源第三弹：惊人的300行代码驱动R1和V3的训练与推理

DeepSeek开源周第三弹！DeepSeek-AI 重磅发布高效FP8 GEMM库 DeepGEMM：极致性能，代码精简，助力V3/R1模型训练与推理！简单来说这是由 DeepSeek-AI 团队精心打造的 FP8 通用矩阵乘法 (GEMM) ...

4 小时

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息， DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

16 小时

DeepSeek引领AI行业浪潮，算力需求暴涨背后的秘密

在当今高度竞争的科技领域，人工智能（AI）的迅猛发展显然已经成为各行各业关注的焦点。东吴证券在近期的研究报告中指出，DeepSeek（深度求索）公司正是推动这一变革的关键力量，其自2003年成立以来，专注于AI大模型的研发，已经成功推出多款大模型，并在性能和复杂度上持续进化。这不禁让我们思考，DeepSeek究竟是如何引爆整个AI产业的？它在算力需求激增中又扮演了怎样的角色？

9 小时

哈希表的革新：一个因「无知」被推翻的经典猜想

Krapivin的研究突破性地推翻了姚期智长达40年的哈希表性能猜想，提出了更高效的哈希表设计，显著提升了查询和插入操作的速度，并可能在数据库、缓存系统、编译器、网络路由和密码学等领域带来深远影响。

3 小时

原生FP8计算摩尔线程高效完成DeepSeek FlashMLA适配

作为国内率先原生支持FP8计算精度的国产GPU企业，摩尔线程迅速响应，并快速适配DeepSeek的各个开源仓库，旨在为更多GPU开发者赋能。摩尔线程始终致力于推动开源生态的发展，通过技术开放与生态共建，加速国产全功能GPU在AI计算领域的规模化应用， ...

腾讯网10 小时

DeepSeek开源DeepGEMM矩阵乘法加速库，最快加速2.7倍

DeepSeek 开源活动来到了第三天，新项目如约而至。此次开源库名为 DeepGEMM，GitHub 地址在文末。DeepSeek 表示，这是一个支持密集和混合专家（MoE，Mixture of ...

哈尔滨工业大学15 小时

哈工大丁子敬教授课题组发现穿透对流中存在热量输运的经典标度率

穿透对流广泛存在于较大尺度的自然现象中，如大气环流和海洋环流等。对流现象的标度率研究在对流的研究和建模中有着重要意义。美国著名地球物理学家乔治·维罗尼斯（George Veronis）于1963年猜想穿透对流中存在热量输运的经典标度率，即热流量与瑞利 ...

来自MSN12 小时

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大 ...

MM-RLHF团队投稿量子位 | 公众号 QbitAI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果