这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。
也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA(Compute Unified Device Architecture,统一计算架构),是由英伟达开发的一种通用编程框架,它允许开发者利用英伟达的图形处理器(GPU,Graphics Processing Unit)进行通用计算。
PD-General 能够充分利用英伟达 GPU 中的内部结构,通过读取 GPU 内部寄存器显卡,在无需更换更高级显卡的同时,就能提升计算效率,从而能够减少对于更高水平的硬件。哪怕使用普通的家用 GPU,也能将原本需要几天才能完成的计算任务缩短到几小时甚至几分钟。
随着 DeepSeek 的大火,也让人们对于英伟达 GPU 及其配套的统一计算设备架构 CUDA(Compute Unified Device Architecture)有了更多了解。而在近日,深圳北理莫斯科大学杨杨副教授和合作者,围绕英伟达 GPU ...
2月5日消息,DeepSeek全球爆火,再一次引发外界对GPU算力限制话题的关注。据报道,DeepSeek开发的大语言模型绕过了英伟达的CUDA框架,正为未来兼容国产GPU芯片做准备。众所周知,英伟达的CUDA(Compute Unified ...
3 天
知乎 on MSNDeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?编辑:桃子 好困 【新智元导读】DeepSeek模型开发竟绕过了CUDA?最新爆料称,DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示,CUDA护城河不存在了? 原本DeepSeek低成本训出的R1,就已经让整个硅谷和华尔街为之虎躯一震。
DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注,其日活用户数在短时间内突破2000万,成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业,外部算力(主要是GPU)限制逐渐成为制约其进一步发展的瓶颈,如今他们正致力于通过优 ...
13 天on MSN
这一技术选择被业内视为DeepSeek为未来兼容国产GPU芯片所做的前瞻布局。为了实现这一目标,DeepSeek在研发过程中采用了PTX(Parallel Thread ...
13 天
知乎 on MSNDeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能,英伟 ...这个内容已经在X上讨论过了, 很火热的问题 我先翻译一下国外教授的详细回答,再讲清楚CUDA、PTX的关系。 中文翻译: 人们说“Deepseek 使用了 PTX,它打破了 CUDA 的护城河!”从根本上误解了这里发生的事情,以及 CUDA ...
来自MSN7 个月
一文搞懂什么是GPU、什么是CUDA(通俗易懂版)本文详细探讨了GPU的重要性、设计初衷及其在AI训练和推理中的应用,同时介绍了CUDA平台及其对GPU计算能力的扩展。通过深入了解GPU和CUDA,读者可以 ...
来自 Mirae Asset Securities Research (韩国未来资产证券)的分析称,V3 的硬件效率之所以能比 Meta 等高出 10 倍,可以总结为“他们从头开始重建了一切”。 在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时,他们针对自己的需求把 132 个流式多处理器(SMs)中的 20 个修改成负责服务器间的通信,而不是计算任务 。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果