query - 搜索 News

来自MSN21 小时

梁文锋参与发表的 DeepSeek 新论文 NSA 注意力机制，有哪些信息值得 ...

Codesign真是妙不可言啊 Dynamic sparse attention的主要问题就是如果用flashattention style的kernel写法，那么对于每个query block，需要load每个token激活的key/value block的并集，在最坏条件下是会degrade到full attention的。

4 天

清华与NTU联手推出EmbodiedSAM：实时在线3D分割模型的革命

在当今科技迅猛发展的时代，计算机视觉正逐渐成为各行各业智能化的核心驱动力之一。近日，清华大学和南洋理工大学（NTU）共同提出了一款名为EmbodiedSAM的实时在线3D分割模型。该模型的创新之处在于能够高效、细致地进行RGB-D流视频的在线三维实例分割，为具身智能技术的发展铺平了道路。

腾讯网2 天

山东5区 -> 玉皇顶 2.6万出一组 129 221 组合 3修全部20 21 宝宝功法全部17 ...

无邪推荐如果你也有想尽快出手的角色，可以联系无邪，有偿推荐，收费合理。估价+收藏+群+公众号推荐，助您早日脱坑。为满足公众号粉丝和游戏老板的实际需求，将为小伙伴们提供各类梦幻相关服务，梦幻业务找无邪，安全靠谱：1、估价+推广角色装备BB，100元套餐推广到卖出为止，链接挂公众号菜单及4万人朋友圈、20个群；2、宝 ...

20 小时

不到1美元，打造全球第3超强AI助手！港大3人开源最强Deep Research

OpenAI的Deep Research一经发布便引发了全网的热议。作为新一代通用AI助手，它具备自主搜索和分析互联网海量信息的能力，并能通过编程手段对复杂数据进行深度分析，迅速在全球范围内获得了极大反响。在即将到来的AGI时代，各行各业都需要这样的智能助手来提升工作效率。然而，目前Deep Research仅向Pro用户开放，每月200美元的订阅费用让人望而却步。 CEO奥特曼表示，Dee ...

众播育儿 on MSN2 天

2个冷门Excel函数，轻松按“-”拆分单元格！

按分隔符拆分单元格，我们最常用的几种方法无非是分列、Power Query、或者函数诸如 textsplit。今天要教大家两个冷门函数，可以将“-”两边的数字拆分出来。案例：将下图 1 中“-”符号前后的两段数字分别提取出来，放在两列中。

5 小时

马化腾旁边坐了一个年轻人

不久前一场备受瞩目的座谈会在北京举行，DeepSeek创始人梁文锋现身参会。灰色西装，戴着边框眼镜，紧抿嘴唇，看起来略带拘谨的他，像一个大学生，也像刻板印象中的程序员，而他旁边紧挨着的正是腾讯公司董事会主席兼首席执行官马化腾。

1 天

DeepSeek NSA：革新Transformer，推动AI训练与硬件解耦

近年来，人工智能技术的迅猛发展引发了学术界与产业界的广泛关注。其中，DeepSeek发布的NSA（原生稀疏注意力）算法为Transformer架构的Attention环节带来了显著的优化，尤其在训练速度和解码效率上，显示出与传统Full Attention的强大竞争力。NSA不仅在效果上与Full Attention持平，甚至在某些场景下表现出色，关键在于其利用稀疏KV（键值）的方法实现了速度提升 ...

腾讯网1 天

Z Tech｜关于DeepSeek部署的一切，都在这里

得益于量化技术（GPTQ、AWQ）、推理框架优化（vLLM、TensorRT），DeepSeek的显存需求相比其他大模型可降低约30～70%。

虎嗅网3 天

DeepSeek新论文再次引发热议，它说了什么？

本文来自微信公众号：界面新闻，作者：伍洋宇，编辑：文姝琪，题图来自：AI生成 DeepSeek V3和R1两款模型带来的热度尚未平息，一篇新论文再次引来科技圈对其创新性的集体评估。

红板报 on MSN1 天

视觉定位新范式！清华团队推出Migician，支持任意形式多图定位

黄锴宇投稿至凹非寺量子位 | 公众号 QbitAI 一个眼神锁定你！多模态视觉定位能力升级—— 由单张图像拓展至多图像应用场景。比如，在复杂的相册中自动识别出Luigi并在第二张图中找到他，或是根据钢铁侠剧照自动在合影中找到对应的演员唐尼。 Q：Image-1 is the photo album of someone in Image-2, please find and locate t ...

2 天

一文讲透关于DeepSeek的7个核心问题

DeepSeek技术创新的答案，在2024年底和2025年年初发布的两篇技术报告——《DeepSeek-V3 Technical Report》、《DeepSeek-R1:Incentivizing Reasoning Capability in ...

2 天

DeepSeek新论文再次引发热议，它最重要的创新是什么？

2月18日，DeepSeek的研究团队发布了一篇新的技术论文，《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》。在X（原推特）平台上 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果