GPU Cuda - 搜索 News

12 天

这也说明DeepSeek拥有一些擅长写PTX语言的内部开发者。

18 天

也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA（Compute Unified Device Architecture，统一计算架构），是由英伟达开发的一种通用编程框架，它允许开发者利用英伟达的图形处理器（GPU，Graphics Processing Unit）进行通用计算。

14 天

无需购买英伟达高级GPU也能提升计算速度，科学家开发快速近场动力 ...

PD-General 能够充分利用英伟达 GPU 中的内部结构，通过读取 GPU 内部寄存器显卡，在无需更换更高级显卡的同时，就能提升计算效率，从而能够减少对于更高水平的硬件。哪怕使用普通的家用 GPU，也能将原本需要几天才能完成的计算任务缩短到几小时甚至几分钟。

腾讯网14 天

无需英伟达GPU！科学家开发快速近场动力学算法，比现有算法加速800倍

随着 DeepSeek 的大火，也让人们对于英伟达 GPU 及其配套的统一计算设备架构 CUDA（Compute Unified Device Architecture）有了更多了解。而在近日，深圳北理莫斯科大学杨杨副教授和合作者，围绕英伟达 GPU ...

腾讯网12 天

DeepSeek绕过CUDA！为适配中国国产GPU做准备

2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified ...

知乎 on MSN3 天

DeepSeek绕开CUDA垄断，V3论文细节再挖出！英伟达护城河不存在了？

编辑：桃子好困【新智元导读】DeepSeek模型开发竟绕过了CUDA？最新爆料称，DeepSeek团队走了一条不寻常的路——针对英伟达GPU低级汇编语言PTX进行优化实现最大性能。业界人士纷纷表示，CUDA护城河不存在了？原本DeepSeek低成本训出的R1，就已经让整个硅谷和华尔街为之虎躯一震。

13 天

DeepSeek积极筹备适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优 ...

13 天on MSN

DeepSeek大语言模型新动向：绕开CUDA，携手国产GPU谋发展

这一技术选择被业内视为DeepSeek为未来兼容国产GPU芯片所做的前瞻布局。为了实现这一目标，DeepSeek在研发过程中采用了PTX（Parallel Thread ...

知乎 on MSN13 天

DeepSeek 绕开 CUDA 垄断，针对英伟达 PTX 进行优化实现最大性能，英伟 ...

这个内容已经在X上讨论过了，很火热的问题我先翻译一下国外教授的详细回答，再讲清楚CUDA、PTX的关系。中文翻译：人们说“Deepseek 使用了 PTX，它打破了 CUDA 的护城河！”从根本上误解了这里发生的事情，以及 CUDA ...

来自MSN7 个月

一文搞懂什么是GPU、什么是CUDA（通俗易懂版）

本文详细探讨了GPU的重要性、设计初衷及其在AI训练和推理中的应用，同时介绍了CUDA平台及其对GPU计算能力的扩展。通过深入了解GPU和CUDA，读者可以 ...

20 天

“DeepSeek 甚至绕过了英伟达 CUDA”，论文细节再引热议

来自 Mirae Asset Securities Research （韩国未来资产证券）的分析称，V3 的硬件效率之所以能比 Meta 等高出 10 倍，可以总结为“他们从头开始重建了一切”。在使用英伟达的 H800 GPU 训练 DeepSeek-V3 时，他们针对自己的需求把 132 个流式多处理器（SMs）中的 20 个修改成负责服务器间的通信，而不是计算任务。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果