本文约6,000字,建议收藏阅读 作者 | 北湾南巷出品 | 芯片技术与工艺DeepSeek 是近年来在人工智能(AI)领域崭露头角的大模型之一,专注于自然语言处理(NLP)与生成式 AI(AIGC)。其核心目标是优化 AI ...
DeepSeek-V3 官方报告解读https://arxiv.org/abs/2412.194371. 论文背景:为什么要开发 DeepSeek-V3?近年来,大型语言模型(LLM)发展迅速,不仅闭源模型(如 ...
“超擎数智的AI解决方案不仅为亦康医药提供了核心技术升级,更助力亦康医药实现了一场医药研发范式的变革。”亦康医药创始人许春萍博士说,“过去需要跨部门长时间协作的分析任务,如今通过AI平台即可快速高效完成,亦康医药团队得以聚焦更具创新性的疗法设计。” ...
Nvidia 推出 Spectrum-X 以太网网络技术,结合 InfiniBand 自适应路由功能,可显著提升存储网络性能。测试表明,在大规模 AI 训练和推理场景中,该技术能将存储网络读取带宽提高近 50%,有效缓解网络拥塞,加速 AI 工作负载。
随着生成式人工智能模型的热度持续攀升,其计算需求也呈指数级增长。当前,单体数据中心的扩展已接近物理极限,如何在电力和空间限制下继续推动AI发展成为行业焦点。业内专家指出,未来可能需要构建覆盖国家甚至大陆的超级数据中心,通过将现有数据中心互联,形成虚拟 ...
来源:内容来自半导体行业观察综合,谢谢。 伊隆·马斯克和三位 xAI 高级员工介绍了他的 AI 聊天机器人Grok 3的最新版本,该公司称其为“地球上最聪明的 AI”。在 X(以前的 Twitter)上的一个直播视频中,马斯克强调了 Grok 3 ...
DeepSeek的成功证明了开源模型相较于闭源模型具有一定的优越性,随着模型的智能化趋势演进,模型体量的增加仍然会是行业发展的主要趋势之一。为了完成千亿、万亿参数规模AI大模型的训练任务,通用的做法一般会采用Tensor并行(TP)、Pipeline ...
AI 推理模型和智能代理正在改变各个行业,但要充分发挥其潜力并实现规模化,需要海量的计算能力和优化的软件支持。"推理"过程涉及多个模型,会生成大量额外的 Token,需要具备高速通信、内存和计算能力相结合的基础设施,以确保实时、高质量的结果。
思科提高了业绩预期,现在预计全年收入在560亿至565亿美元之间,高于此前553亿至563亿美元的预期范围。在2月12日业绩公布后的盘后交易中,其股价上涨6.6%,至约66.7美元。照这样下去,感觉又要迎来千禧年时的繁荣景象了。
DeepSeek技术创新的答案,在2024年底和2025年年初发布的两篇技术报告——《DeepSeek-V3 Technical Report》、《DeepSeek-R1: Incentivizing Reasoning Capability in ...
DeepSeek作为2025年开年最受关注的AI大模型,因其出色的性能、低廉的开发成本和开源生态三大核心优势,火爆出圈,迅速引爆全球AI热潮,当前已广泛应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景。