TTT - 搜索 News

OpenAI o1团队成员 Noam Brown 表示，o1的大规模计算可能不是最好的方法，很高兴看到有学者在提高推理能力上探索新的方法。数据生成的核心是将测试任务中蕴含的输入输出对关系，通过数据增强的方式最大限度地利用，可具体分为两个步骤。

来自MSN4 个月

AI创新再迈步！新语言模型TTT，比Transformer更高效

近日，一项名为Test-Time Training（TTT）的研究突破了人工智能领域的界限，有望替代长期占据主导地位的Transformer架构。 TTT是一种全新的大语言模型 ...

来自MSN4 个月

从根本上改变语言模型！全新架构TTT超越Transformer和Mamba，长上下文中 ...

这个架构通过对输入token进行梯度下降来压缩上下文，被称为“测试时间训练层（Test-Time-Training layers，简称TTT层）”。“共同一作”加州大学伯克利 ...

18 天

MIT新研究：测试时训练可提升AI模型推理能力至5.8倍

近年来，随着人工智能的迅猛发展，许多科研机构不断探索提高模型推理能力的新方法。美国麻省理工学院（MIT）近期的一项研究提出了一种创新的“测试时训练”（Test-Time Training, TTT）方法，显著提升了AI模型的推理准确性，最高可达原来的5.8倍。这一发现不仅打破了传统的先训练后测试的模型使用模式，更为解决复杂计算任务带来了新的可能性。核心技术：测试时训练 TTT方法的核心在于，在模 ...

18 天

MIT科技新突破：测试时训练令大模型性能暴涨6倍！

据新智元的报道，MIT团队的最新研究揭示——测试时训练（TTT）具有突破性潜力，能够显著提升语言模型的直觉和推理能力。在最近的ARC公共基准测试中，他们的模型达到了61.9%的准确率，甚至接近人类的表现。这一发现对整个行业而言，如同黑暗中的一束光芒，给我们提供了新的思路来应对大规模模型扩展的挑战。

18 天

AI技术再进化：探索生成式AI与智能硬件的最新动态

2024年11月，AI行业的快速发展迎来了多项重磅成果。从新模型的发布到智能硬件的革新，各大科技公司和研究机构持续推动着生成式AI的前沿。本文将为您深度解读最新动态，帮助您把握这股技术潮流。首先，我们关注到MIT科研团队最近提出的“测试时训练”（TTT）方法。这一方法的出现，是对OpenAI提出的Scaling Law的一种挑战，因为后者的应用受限于数据供应的减少，导致模型性能提升的阻碍。TTT ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果