64K - 搜索 News

5 小时

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

【新智元导读】就在刚刚，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSeek R1，AI编码王者出世了。

23 小时

Anthropic首款混合推理模型在亚马逊云科技AmazonBedrock上线

美通社消息，亚马逊云科技宣布，人工智能安全与研究公司Anthropic迄今最智能的模型Claude 3.7 Sonnet现已在Amazon ...

1 天

全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

18 小时

DeepSeek API降价75%：夜间特惠带来新突破

随着API市场竞争的加剧，企业需求也在不断演变。数据显示，2022年全球API市场规模达到了430亿美元，预计到2027年将增长到1080亿美元，年均复合增长率超过20%。在这种背景下，DeepSeek的降价策略，无疑是及时的市场响应。通过对API价格的调整，不仅帮助开发者降低了开发成本，还促进了新应用和创新思路的产生。这对于希望通过API进行技术开发的企业来说，是一种无形的市场推力。

文化大家看 on MSN1 天

“中国地镜”破土而出

项目航拍图。（受访单位供图）《西游记》里，太上老君的八卦炉炼丹制宝，法力强大。在武汉光谷，被誉为“中国地镜”的深部岩土工程扰动模拟设施项目，也在打造一个“八卦炉”，通过锤炼采自地下深处的岩石试样，给地质体做CT。该项目是“十四五”国家重大科技基础设施 ...

1 天

中文比R1丝滑、玩宝可梦还贼溜？全球首个混合推理模型Claude 3.7 Sonnet ...

Claude 3.7 Sonnet 既能提供近乎即时的响应（标准模式，standard），也可以向用户直观展示其长时间的逐步思考过程（扩展思考模式，extended thinking）。API 用户还可以对模型的思考时长进行细粒度控制。当地时间 2 ...

7 天

DeepSeek新注意力机制引热议！梁文锋亲自提交预印本，目标明确降低 ...

实验表明，在解码64k上下文时，基于softmax架构的注意力计算占到总延迟的70%-80%。而在不影响性能的前提下，NSA在64k上下文的解码、前向传播和反向传播中均实现了显著加速。

雷锋网2 天

而这次 DeepSeek 团队最新的研究论文更是重磅，论文中介绍了一种全新的，可用于超快速的长上下文训练与推理的注意力机制 —— NSA，值得一提的是，NSA 还具有与硬件对齐的特点，十足的硬件友好。

23 小时

混合推理+最强编码能力大模型Claude Sonnet 3.7上线Amazon Bedrock

亚马逊云科技CEO Matt Garman在LinkedIn上发文表示：“Claude 3.7 Sonnet现已在Amazon Bedrock上线，它代表了人工智能推理技术的一项进步。作为Anthropic目前最智能的模型，3.7 ...

头部财经2 天

全球首个混合推理模型Claude 3.7发布代码能力超DeepSeek

2月25日，根据新智元报道，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型比o3-mini、DeepSeek R1要强上不少，堪称AI编码领域新王者。

凤凰网7 天

梁文锋亲自上阵、亲自提交！DeepSeek发布新技术论文

三言科技消息 DeepSeek刚刚宣布提交了新的技术论文，是关于NSA（Natively Sparse Attention，原生稀疏注意力），官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

腾讯网2 天

高阶智驾遇上新能源硬派越野体验如何，方程豹豹5给出答卷

作为全球唯一一款兼具比亚迪「天神之眼」和华为「乾崑智驾」两大高阶智驾的车型，方程豹豹5的智驾能力根本不用担心 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果