5 天on MSN
【2 月 21 日,华泰证券指出重要趋势】DeepSeek 在 V3 中运用了比 CUDA 更底层的 PTX 来优化硬件算法,PTX 是 CUDA 编译的中间代码,在 CUDA 和最终机器码间起桥梁作用。NSA 采用了 OpenAl 提出的 Triton 编程语言高效编写 GPU 代码,Triton 底层可调用 CUDA 及其他 GPU 语言,包括 ...
5 天on MSN
【华泰证券:DeepSeek有望加快模型训练与CUDA的解耦进程】华泰证券研究指出,DeepSeek在V3中运用了相较CUDA更为底层的PTX来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间发挥着桥梁作用。而NSA则采用了O ...
华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号内置的HYGON ...
DeepSeek是一款以提升AI模型训练效率为目标的工具,其V3版本的推出在业内引起了广泛关注。PTX(Parallel Thread ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果