size - 搜索 News

17 小时

DeepSeek此次披露的数据不仅验证了其技术路线的商业可行性，更为行业树立了高效盈利的标杆。有分析指出，DeepSeek的开源策略与成本控制能力正在打破AI领域的资源垄断。其模型训练成本仅为同类产品的1%-5%，而推理定价则具有明显优势。这一低成本 ...

来自MSN21 小时

DeepSeek-V3 / R1 推理系统概览

DeepSeek-V3 / R1 推理系统的优化目标是：更大的吞吐，更低的延迟。为了实现这两个目标，我们的方案是使用大规模跨节点专家并行（Expert Parallelism / EP）。首先 EP 使得 batch size 大大增加，从而提高 GPU 矩阵乘法的效率，提高吞吐。其次 EP 使得专家分散在不同的 GPU 上，每个 GPU ...

22 小时

周末，DeepSeek扔出“王炸”首次披露了成本利润率影响多大？

周六，国内AI大模型公司DeepSeek官方账号在知乎首次发布《DeepSeek-V3/R1推理系统概览》技术文章，不仅公开了其推理系统的核心优化方案，更是首次披露了成本利润率等关键数据，引发行业震动。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点