搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
18 天
o1不是唯一路径!MIT新研究:测试时训练,模型推理能力大幅提升
OpenAI o1团队成员 Noam Brown 表示,o1的大规模计算可能不是最好的方法,很高兴看到有学者在提高推理能力上探索新的方法。 数据生成 的核心是将测试任务中蕴含的输入输出对关系,通过数据增强的方式最大限度地利用,可具体分为两个步骤。
来自MSN
4 个月
AI创新再迈步!新语言模型TTT,比Transformer更高效
近日,一项名为Test-Time Training(TTT)的研究突破了人工智能领域的界限,有望替代长期占据主导地位的Transformer架构。 TTT是一种全新的大语言模型 ...
来自MSN
4 个月
从根本上改变语言模型!全新架构TTT超越Transformer和Mamba,长上下文中 ...
这个架构通过对输入token进行梯度下降来压缩上下文,被称为“测试时间训练层(Test-Time-Training layers,简称TTT层)”。“共同一作”加州大学伯克利 ...
18 天
MIT新研究:测试时训练可提升AI模型推理能力至5.8倍
近年来,随着人工智能的迅猛发展,许多科研机构不断探索提高模型推理能力的新方法。美国麻省理工学院(MIT)近期的一项研究提出了一种创新的“测试时训练”(Test-Time Training, TTT)方法,显著提升了AI模型的推理准确性,最高可达原来的5.8倍。这一发现不仅打破了传统的先训练后测试的模型使用模式,更为解决复杂计算任务带来了新的可能性。 核心技术:测试时训练 TTT方法的核心在于,在模 ...
18 天
MIT科技新突破:测试时训练令大模型性能暴涨6倍!
据新智元的报道,MIT团队的最新研究揭示——测试时训练(TTT)具有突破性潜力,能够显著提升语言模型的直觉和推理能力。在最近的ARC公共基准测试中,他们的模型达到了61.9%的准确率,甚至接近人类的表现。这一发现对整个行业而言,如同黑暗中的一束光芒,给我们提供了新的思路来应对大规模模型扩展的挑战。
18 天
AI技术再进化:探索生成式AI与智能硬件的最新动态
2024年11月,AI行业的快速发展迎来了多项重磅成果。从新模型的发布到智能硬件的革新,各大科技公司和研究机构持续推动着生成式AI的前沿。本文将为您深度解读最新动态,帮助您把握这股技术潮流。 首先,我们关注到MIT科研团队最近提出的“测试时训练”(TTT)方法。这一方法的出现,是对OpenAI提出的Scaling Law的一种挑战,因为后者的应用受限于数据供应的减少,导致模型性能提升的阻碍。TTT ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果
反馈