规模 scale - 搜索 News

3 天

DeepSeek的成功证明了开源模型相较于闭源模型具有一定的优越性，随着模型的智能化趋势演进，模型体量的增加仍然会是行业发展的主要趋势之一。为了完成千亿、万亿参数规模AI大模型的训练任务，通用的做法一般会采用Tensor并行（TP）、Pipeline并行（PP）、和Data并行（DP）策略来拆分训练任务。随着MoE（Mixture of Experts，混合专家）模型的出现，除了涉及上述并行策略外 ...

腾讯网1 天

财通证券：Scaling Law向后训练、推理阶段转移建议关注AI基座环节

智通财经APP获悉，财通证券发布研报称，Scaling Law作为实验科学的产物，目前面临数据资源枯竭的挑战，Transformer架构也未能完全表达人脑的思考机制。该行认为，对Scaling ...

光纤在线13 天

用普通光模块实现光突发交换scale-up网络扩容

导读：为了满足AI集群高带宽域超节点的大节点数、高带宽、低延迟、低成本的要求，默升科技的黄水清发布了《用普通光模块实现光突发交换scale-up网络扩容》的文章，本文提出了利用普通连续模式光模块配合光突发交换构建超大规模scale-up超节点网络 ...

2 天

在线学术报告 | 代文林副教授：基于支撑点的大规模低秩高斯过程预测

代文林，中国人民大学统计与大数据研究院预聘副教授，国家治理大数据和人工智能创新平台副主任。主要研究方向为非参数统计、复杂数据分析与应用统计。以主要作者身份在Journal of the American Statistical Association ...

腾讯网14 天

中规模二维柔性集成电路 | 进展

柔性电子技术是一项跨学科融合的颠覆性科学技术，突破了传统硅基电子器件的固有局限，为后摩尔时代的器件设计与集成、能源革命、医疗技术变革、人机交互等领域提供了创新驱动，将强有力地支撑未来智慧生活的实现。特别是多功能柔性集成电路的发展，为人与物体及环境之间 ...

3 天

Grok 3用20万GPU帮AI界做了个实验：Scaling Law没撞墙，但预训练不一定

但是卡多有个好处，就是能压缩实验新想法和训练大模型基座的时间周期。比如你总得探索一些不同的算法、参数或数据配比的模型进行各种实验，你有10个新想法，如果只有2000张卡，可能得跑5天才能得出结论，要是有几万张卡，可能1天就能得出结论，所以卡多对于探索 ...

亿欧 on MSN3 天

李飞飞巴黎演讲：如果 AI 资源被少数公司垄断，整个生态系统都会完蛋

你以为人工智能的故事始于硅谷？不，它的根须深植于五亿年前的生命起源。

知乎 on MSN13 小时

xAI 推出 Grok 3 聊天机器人，以及名为 Deepsearch 的智能搜索引擎，有 ...

媒体风向变化太快，让人目不暇接。早上还在夸Deepseek成本低，性价比高，预训练Scaling Law死了，不需要太多机器和GPU卡，性价比优先，英伟达休矣；中午Grok 3一出来，说是用了10万张英伟达H100卡，效果力压OpenAI o3 mini和Deepseek R1，就转向说Scaling ...

澎湃新闻2 天

幻方量化规模骤降至200亿元？公司内部人士：谣言

幻方量化的最新规模到底有多少成为今天资本圈热议的话题。 2月20日，一张“幻方量化规模缩水到100多亿”的图片在市场上流传，也有媒体报道称目前规模在200多亿元。对此，澎湃新闻记者联系的幻方量化多位相关人士均表示，这些都为不实消息。对于幻方量化 ...

3 天

开发整形外科全周期解决方案 DSC Inve、施密特等后续投资

以人工智能(AI)为基础的整形外科全周期解决方案开发公司Connective20日表示,成功吸引了总规模达140亿韩元的系列A投资。此次投资阶段共有9个风险投资(VC)参与。现有投资公司DSC Investment、施密特、Stone Bridge ...

1 天

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果