Rope - 搜索 News

M-RoPE在定位目标图像上有效，但在多选问题中表现不佳，因为它主要通过垂直位置编码来定位图像，而非时间特征，导致时间维度未能捕捉长距离依赖关系，关注局部信息。相比之下，空间维度则捕捉长距离语义信息，导致M-RoPE在频率分配设计上表现较差。

腾讯网20 小时

MHA/MQA/GQA过时了？姚班TPA改写规则：一个框架统治所有注意力设计

T6一经发布便引发各界热议。创业者们惊喜地发现，借助TPA技术，能大幅降低云服务成本；研究者们则期待团队能在更大规模模型上开展实验，带来更多令人期待的成果。代码已上线始智AI-wisemodel开源社区，欢迎大家使用。

来自MSN8 天

Llama都在用的RoPE有了视频版，复旦上海AI Lab等提出长视频理解/检索 ...

VideoRoPE团队投稿量子位 | 公众号 QbitAI Llama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE，并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中，VideoRoPE始终优于先前的RoPE变体。用三维结构保留时空关系 RoPE是一种能够将相对位 ...

3 小时

ICLR 2025｜浙大、千问发布预训练数据管理器DataMan，53页细节满满

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou ...

1 天

Safety Shot获得100万美元PIPE融资交易

Safety Shot, Inc. (NASDAQ: SHOT )，一家专门从事个人护理产品的公司，已与一位合格投资者签订证券购买协议，获得100万美元融资。该交易于2025年2月20日完成，涉及以每股0.45美元的价格发行222.2222万股。根据 InvestingPro 分析，该公司目前资产负债表上的现金多于债务，但现金消耗速度较快。

9 天

VideoRoPE：让长视频理解与检索突破新界限的智能革命

近年来，随着短视频和长视频的广泛传播，视频理解和检索已成为人工智能领域的热门话题。复旦大学与上海AI实验室等科研团队近日推出了一项开创性的技术——VideoRoPE，标志着旋转位置嵌入（RoPE）在视频领域的突破性扩展，广泛应用于视频检索、理解和幻觉生成等任务，为长视频的理解和检索带来了革命性的进步。这项新技术不仅优化了信息处理的效率，更为未来的智能视频分析奠定了坚实的基础。

4 天

独家对话：谁低估了DeepSeek？解密其低成本AI模型背后的颠覆性创新

DeepSeek通过优化MoE、RoPE和Attention等技术，在模型效率上实现了突破性进展。SemiAnalysis指出，DeepSeek的V2版本相比同行展现了显著的性价比优势，而其从V2到V3的迭代能力也得到了行业内的高度认可。特别是Ant ...

3 天

DeepSeek-R1秘籍大迁移，只需原始数据0.3% | 邱锡鹏团队联合出品

具体实现中，研究人员首先提取预训练模型中的键和值参数矩阵，对这些矩阵进行联合SVD分解；然后根据模型的性能和压缩需求，构建低秩近似矩阵，用这些低秩近似矩阵替代原始的键值矩阵参与后续计算。

中华网4 天

机构预计OpenAI将对DeepSeek保持领先创新策略引关注

DeepSeek如何以颠覆性训练策略重构大型参数模型的成本公式？1月底，美国知名半导体咨询机构SemiAnalysis发布了一篇关于“给Deepseek算经济账”的文章，引起了广泛关注。近日，心智观察所与SemiAnalysis的总裁Dylan ...

红板报 on MSN4 天

DeepSeek-R1秘籍轻松迁移，最低只需原始数据0.3% | 邱锡鹏团队联合出品

一水发自凹非寺量子位 | 公众号 QbitAI DeepSeek-R1背后关键——多头潜在注意力机制（MLA），现在也能轻松移植到其他模型了！而且只需原始数据的0.3%~0.6%。这项研究由复旦大学、华东师范大学、上海AI ...

7 天

Safety Data Sheet是什么检测/MSDS翻译如何办理/限制物质清单MSDS认证

Safety Data Sheet采用标准的 16 个章节格式，包括产品和公司标识、危害识别、成分 / 组成信息、急救措施、消防措施、意外泄漏处理措施、操作和存储、接触控制 / 个体防护、理化特性、稳定性和反应性、毒理学信息、生态学信息、废弃处置、法规信息等。

来自MSN5 天

如何看待国产大模型阶跃星辰开源发布两个新模型？为什么中国公司 ...

不得不说，DeepSeek的含金量还在提高，DS是一条鲇鱼，搅浑了开源和闭源这摊死水，就不说春节期间疯狂发模型的Qwen啦，甚至前两天百度先宣布免费，再宣布开源。OpenAI同时也是坐不住了，先开发o1的思维链（总结版），后面也不挤牙膏了，说马上来G ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果