在AI领域的激烈竞争中,腾讯以一种独特的姿态稳坐钓鱼台,静待时机。随着DeepSeek的崛起,模型与服务的过剩问题日益凸显,而腾讯所掌握的流量、应用场景及服务生态,反而成为了稀缺资源。
在 ENIGMAEVAL 基准上,研究者对现有多模态和推理基准上表现优异的前沿语言模型进行了评估。结果显示,包括 OpenAI o1 在内等 SOTA 模型在普通谜题(Normal)上的准确率最高仅为 7.0% ...