一度狂跌的英伟达股价,又被Grok-3盘活了?20万块GPU训出的模型超越DeepSeek和OpenAI,证明Scaling Law还在继续增长!Ai2研究者大佬直言:Grok-3,就是DeepSeek给美国AI企业压力的又一力证。
媒体风向变化太快,让人目不暇接。早上还在夸Deepseek成本低,性价比高,预训练Scaling Law死了,不需要太多机器和GPU卡,性价比优先,英伟达休矣;中午Grok 3一出来,说是用了10万张英伟达H100卡,效果力压OpenAI o3 mini和Deepseek R1,就转向说Scaling ...
当 Scaling Law 在触顶边界徘徊之时,强化学习为构建更强大的大模型开辟出了一条新范式。 在机器人领域,强化学习也带来了意外之喜。 这只上过好几次全网热搜的机器狗 Spot,想必大家都不陌生。 在原来的文章中,无论 Spot ...
克雷西 发自 凹非寺量子位 | 公众号 QbitAI 算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步! 团队发现了Muon方法的Scaling ...
(注:帕累托前沿是一个经济学和管理学中的概念,描述的是在多目标决策问题中所有可能的最优解的集合,这些解在多个目标之间取得了最佳平衡。在帕累托前沿上的每一个点,都意味着一个目标的改善必然以牺牲另一个目标为代价,因此它代表了在多个目标之间实现的最佳权衡。
月球不仅是地球的守护者,更是生命的摇篮。月球的引力作用对地球的气候、海洋和生物圈产生了深远影响。月球的潮汐力不仅塑造了地球上独特的海洋潮汐现象,还为海洋生物提供了丰富的食物来源。同时,月球的存在也对地球的气候产生了重要影响,为地球生命的繁衍提供了适宜 ...
首先,关于球队核心球员保罗·乔治(Paul George)的伤情有了最新进展。在全明星周末前的比赛中,乔治因膝盖酸痛缺席了对阵雄鹿队的比赛。据快船队随队记者Law ...
今年1月25日的时候,英伟达一夜之间市值大跌17%,市值蒸发了近6000亿美元 (近4.3万亿人民币),堪称破纪录。
据The Information此前报道,微软内部备忘录显示,由于预训练边际效益递减,原计划投入160亿美元升级预训练基础设施的方案已被叫停,微软转而专注于为OpenAI提供推理以获取收益。
究其DeepSeek训练其模型到底使用了多少张英伟达卡,据《DeepSeek-V3技术报告》官方给出的是2048张英伟达H800芯片和1万张A100显卡。而半导体研究机构SemiAnalysis认为DeepSeek囤积了包括1万张A100、1万张H1 ...
AI大模型竞赛愈发白热化,下半场将聚焦推理与数据。 2月23日,马斯克点赞了一条关于AI模型竞争路线的分析,他称赞道“分析得很好”,值得一提的是,上周马斯克旗下xAI正式发布Grok 3大模型。 这篇推文是由Gavin Baker发布,他在文章中表示 ...
国家科技传播中心学术发展讲堂 人工智能专场举办,人工智能,刘锋,机器人,朱政,邓志东,学术 ...