query - 搜索 News

21 小时

近年来，人工智能技术的迅猛发展引发了学术界与产业界的广泛关注。其中，DeepSeek发布的NSA（原生稀疏注意力）算法为Transformer架构的Attention环节带来了显著的优化，尤其在训练速度和解码效率上，显示出与传统Full Attention的强大竞争力。NSA不仅在效果上与Full Attention持平，甚至在某些场景下表现出色，关键在于其利用稀疏KV（键值）的方法实现了速度提升 ...

腾讯网11 小时

节省 90% 存储！源码级揭秘腾讯云 ES 向量搜索的优化之道

本篇文章聚焦于 Elasticsearch 中向量数据的存储与优化。从向量数据的索引构成，读写流程，一直到量化技术，一步步带读者对 Elasticsearch 向量索引存储机制形成全面理解。同时也将解读腾讯云 ES AI ...

腾讯网19 小时

LLM高效推理：KV缓存与分页注意力机制深度解析

随着大型语言模型（LLM）规模和复杂性的持续增长，高效推理的重要性日益凸显。KV（键值）缓存与分页注意力是两种优化LLM推理的关键技术。本文将深入剖析这些概念，阐述其重要性，并探讨它们在仅解码器（decoder-only）模型中的工作原理。冗余计算 ...

21 小时

DeepSeek NSA：革命性算法创新提升模型训练效率，逐步解构CUDA生态

近日，DeepSeek发布了其最新的算法创新——Native Sparse Attention（NSA），这一技术在Transformer架构中对Attention机制进行了关键优化，使得在解码和前向/后向传播过程中的处理速度提升了6到12倍。这种突破性的进展不仅令NSA的效果与传统的Full ...

13 小时

谷歌发布Palo Alto防火墙命令注入漏洞的概念验证代码

谷歌的 Project Zero 和 Mandiant 网络安全团队近日联合发布了针对 Palo Alto Networks PAN-OS OpenConfig 插件中的一个高严重性命令注入漏洞（CVE-2025-0110）的概念验证（PoC）代码。该漏洞经身份验证的管理员能够通过伪造的 gNMI 请求在防火墙上执行任意命令，并提升权限至 root 访问级别。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果