Sparse - 搜索 News

8 天

超快长文本处理的未来：DeepSeek推出Natively Sparse Attention机制！

近日，DeepSeek在海外社交平台X上发布了一篇令人瞩目的技术论文，揭示了一项突破性的研究成果——Natively Sparse Attention（原生稀疏注意力）。这项创新技术不仅在超快速长文本训练和推理方面展现出卓越的能力，还成功降低了预训练成本，展现了未来长文本处理的新方向。

2 天

DeepSeek重磅开源FlashMLA，超高效的MLA解码内核引领AI新潮流

近日，DeepSeek在广受期待的情况下，正式开源了其首个项目FlashMLA，该项目在GitHub上线仅半小时内便获得300多颗星，显示了其在AI领域的强大吸引力。FlashMLA的核心特点是"一款面向Hopper ...

来自MSN6 天

DeepSeek最新论文科普解读：NSA，物美价廉的超长上下文方案

DeepSeek在AI领域的发展一直备受关注，其最新论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse ...

1 天

大模型开发者分享研发历程，知乎引领AI“思维链开源”

i黑马讯 ...

中华网3 天

DeepSeek低调参与GDC大会闭门会议引关注

2月23日，2025全球开发者先锋大会主办方确认，近期颇受关注的DeepSeek参与了今年的大会，但主要是以“闭门会议”的方式低调参会，具体场次和出席人并未对外公布。此前2月7日，有消息称全球开发者先锋大会组委会已与DeepSeek团队取得联系，De ...

差评XPIN on MSN1 天

宇树的机器人又进化了，学哪吒跳舞，还能挑战平衡木

既能上春晚扭秧歌，又能模仿科比的后仰跳投、复现 C 罗的腾空半转身。前阵子，宇树科技的人形机器人，可谓是出尽了风头。结果这还没几天，他们家的机器人就又双叒进化了。梅花桩挑战，没有一步踩空，走得稳稳当当。

腾讯网2 天

DeepSeek“开源周”Day1：让英伟达H800性能翻两倍

作者｜沐风来源｜AI先锋官2月24日，DeepSeek的“开源周”，开源了他们第一天的项目FlashMLA。开源地址：https://github.com/deepseek-ai/FlashMLA在DeepSeek整个技术路线中，MLA（多头潜在注意 ...

来自MSN4 天

梁文锋参与发表的 DeepSeek 新论文 NSA 注意力机制，有哪些信息值得 ...

Codesign真是妙不可言啊 Dynamic sparse attention的主要问题就是如果用flashattention style的kernel写法，那么对于每个query block，需要load每个token激活的key/value block的并集，在最坏条件下是会degrade到full attention的。

腾讯网3 天

AI周报｜xAI发布大模型Grok 3;DeepSeek宣布将开源 5 个代码库

xAI 发布 Grok 3 并开放免费使用2 月 18 日，马斯克与 xAI 团队在直播中正式发布了 Grok 最新版本 Grok3。从现场展示的数据来看，Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型，马斯克甚至宣称 ...

10 小时

消息称‌即梦AI视频生成平台考虑接入DeepSeek

近日，有媒体报道称，字节跳动AI视频生成产品“即梦”正在考虑接入爆火的DeepSeek技术，以进一步提升其视频生成能力。这一联动玩法将为用户带来更加精细的视频创作体验，例如，用户可以先用DeepSeek生成视频脚本，再在即梦平台上生成视频内容‌。

腾讯网3 天

DeepSeek低调参与GDC大会，宇树科技表演“机器人遛机器狗”

2月23日，第一财经记者从2025全球开发者先锋大会主办方确认，近期颇受外界关注的DeepSeek也参与了今年大会，但主要是以“闭门会议”的方式低调参会，具体场次和出席人并未对外公布。此前2月7日，就有消息称全球开发者先锋大会组委会已和DeepSee ...

1 天

宇树的机器人又进化了

而高度追踪奖励，跟训狗一个道理。让机器人下蹲或者站立到某个高度，完成任务就能获得奖励。对称性利用，说白了就是让机器人的左右两边的动作更协调、一致。这要比其他同样是做远程控制方案的机器人，成本要低得多。比如斯坦福 Aloha 机器人的硬件成本，就要 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果