针对这一问题, 北京大学彭宇新教授团队 系统地分析了多模态大模型在细粒度视觉识别上所需的 3 项能力:对象信息提取能力、类别知识储备能力、对象 - 类别对齐能力,发现了 「视觉对象与细粒度子类别未对齐」 ...
在竞争日益激烈的技术时代,人工智能(AI)和机器学习(ML)领域不断涌现出新的突破性进展。近期,BoostStep团队提出的一种新方法已在提升DeepSeek-R1模型在美国数学邀请赛(AIME)上的表现中展现出了令人瞩目的效果。该方法不仅改变了我们对上下文学习与推理的理解,还为复杂数学问题的解决开辟了全新的途径。作为上海交通大学、香港中文大学和上海人工智能实验室的联合研究成果,BoostStep ...
BoostStep团队 投稿量子位 | 公众号 QbitAI 仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。 研究人员实验发现后者是推理效果的瓶颈: ...
2025年2月21日,中国上海讯—全球独立服务机构NSF今日宣布,其上海实验室已全面开启基于形态定向拉曼光谱(Morphologically-Directed Raman Spectroscopy, 简称MDRS)技术的专业研究分析服务。NSF 提供的MDRS 技术服务包括具有统计学意义的成分特异性颗粒粒度和形态分析,药物体外一致性评估以及制剂粒度反向工程研究。
德森移动筛分站最大的亮点之一就是其强大的移动性。它在牵引下能够轻松在场内移动,并且可以实现快速转场 ...
然而,研究人员使用动态增益的动机是改善头部指向的人体工程学。他们的想法是基于眼睛和头部在视觉获取目标时的自然协调:眼睛移动得更快,首先到达目标,而头部跟随得更慢。因此,考虑动态增益,使光标由头部控制,但向目标移动的速度比头部快,而头部只需要跟随光标在 ...
MedS3 的核心在于其独特的自我进化框架。研究者首先利用蒙特卡洛树搜索(MCTS)技术,基于基础策略模型生成可验证的推理链。在推理链的每一步,都会基于这一步的正确性赋予一个展开值,通过这些经过验证的轨迹来训练策略模型和过程奖励模型(PRM)。
让人眼前一亮的是, DeepSeek创始人兼CEO梁文锋 这次出现在了合著名单之中,在作者排名中位列倒数第二。这意味着他作为项目管理者,参与了一线的研究工作。另外,这篇论文的第一作者Jingyang Yuan是 在实习期间完成的这项研究 。
根据论文介绍,DeepSeek 团队将算法创新与硬件适配优化相结合,以实现超快速长文本训练。NSA 采用动态分层稀疏策略,将粗粒度的标记压缩与细粒度的标记选择相结合,以兼顾全局上下文感知和局部精度。NSA ...
LS-609型激光粒度分析仪是欧美克仪器公司在LS-POP(9)优良测试性能基础上,升级开发的一款智能化、高性能的全自动激光粒度分析仪。LS-609采用进口He-Ne激光器作为光源,激光功率更加稳定,预热时间短。结合其现代化的智能测量控制分析软件和全自动进样测量 ...
人工智能领域迎来一项重大突破!DeepSeek团队近日推出名为NSA(NativeSparseAttention)的新注意力机制,成功解决了大模型上下文建模中计算成本高昂的难题。这一创新成果在业界引发广泛关注,为优化大模型训练提供了全新思路。
IT之家 2 月 18 日消息,DeepSeek 今日官宣推出 NSA(Native Sparse Attention),这是一种硬件对齐且原生可训练的稀疏注意力机制,用于超快速长上下文训练与推理。 NSA 的核心组件包括: 动态分层稀疏策略粗粒度 ...