InfiniBand - 搜索 News

本文约6,000字，建议收藏阅读作者 | 北湾南巷出品 | 芯片技术与工艺DeepSeek 是近年来在人工智能（AI）领域崭露头角的大模型之一，专注于自然语言处理（NLP）与生成式 AI（AIGC）。其核心目标是优化 AI ...

2 天

“超擎数智的AI解决方案不仅为亦康医药提供了核心技术升级，更助力亦康医药实现了一场医药研发范式的变革。”亦康医药创始人许春萍博士说，“过去需要跨部门长时间协作的分析任务，如今通过AI平台即可快速高效完成，亦康医药团队得以聚焦更具创新性的疗法设计。” ...

腾讯网20 小时

官方报告：DeepSeek-V3 模型是如何炼成的！

DeepSeek-V3 官方报告解读https://arxiv.org/abs/2412.194371. 论文背景：为什么要开发 DeepSeek-V3？近年来，大型语言模型（LLM）发展迅速，不仅闭源模型（如 ...

4 天

Elon Musk用20万个GPU打造Grok 3，目标是100万GPU

来源：内容来自半导体行业观察综合，谢谢。伊隆·马斯克和三位 xAI 高级员工介绍了他的 AI 聊天机器人Grok 3的最新版本，该公司称其为“地球上最聪明的 AI”。在 X（以前的 Twitter）上的一个直播视频中，马斯克强调了 Grok 3 ...

5 天

数据中心越建越大，如何应对未来挑战？

随着生成式人工智能模型的热度持续攀升，其计算需求也呈指数级增长。当前，单体数据中心的扩展已接近物理极限，如何在电力和空间限制下继续推动AI发展成为行业焦点。业内专家指出，未来可能需要构建覆盖国家甚至大陆的超级数据中心，通过将现有数据中心互联，形成虚拟 ...

头部财经3 天

让大模型训练更高效，奇异摩尔用互联创新方案定义下一代AI计算

DeepSeek的成功证明了开源模型相较于闭源模型具有一定的优越性，随着模型的智能化趋势演进，模型体量的增加仍然会是行业发展的主要趋势之一。为了完成千亿、万亿参数规模AI大模型的训练任务，通用的做法一般会采用Tensor并行（TP）、Pipeline ...

3 天

一文讲透关于DeepSeek的7个核心问题

DeepSeek技术创新的答案，在2024年底和2025年年初发布的两篇技术报告——《DeepSeek-V3 Technical Report》、《DeepSeek-R1: Incentivizing Reasoning Capability in ...

新浪网4 天

让大模型训练更高效，奇异摩尔用互联创新方案定义下一代AI计算

近一段时间以来，DeepSeek现象级爆火引发产业对大规模数据中心建设的思考和争议。在训练端，DeepSeek以开源模型通过算法优化（如稀疏计算、动态 ...

电子信息产业网6 天

DeepSeek整顿AI圈，GPU增长焦虑如何解？

价格亲民的DeepSeek-V3及R1分别在2024年12月和2025年1月上线，随之而来，全球最大数据中心GPU供应商英伟达的股价和市值应声下挫。根据Stock Analysis数据，以月为单位，英伟达市值在2024年12月和2025年1月分别下降2.86%和10.59%。当地时间1月27日，英伟达股价较上一个交易日（1月24日）下跌近17%，市值蒸发5920亿美元。

51CTO4 天

DeepSeek-V3深入解读！

这种连接方式能够实现节点内部的高效通信，减少数据传输的延迟。不同节点之间的通信则通过InfiniBand(IB)网络实现。IB网络以其高带宽和低延迟的特点，能够有效地支持大规模分布式训练中的数据传输需求。这种集群配置结合了节点内部的高速NVLink连接和跨 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果