COT - 搜索 News

红板报 on MSN4 天

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

姜东志投稿量子位 | 公众号 QbitAI OpenAI o1和DeepSeek-R1靠链式思维（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推理，又应该如何细粒度地评估视觉推理呢？

4 天

随着人工智能（AI）领域的迅猛发展，视觉推理能力的重要性愈发凸显。近期，香港中文大学的MMLab研究团队推出了一个名为MME-CoT的新基准测试框架，旨在系统性评估大型语言模型（LMM）在视觉推理任务中的性能表现。这个基准不仅强调了推理过程中的质量、鲁棒性和效率，还为当前的视觉推理任务建立了新的评估标准。随着各种大型模型之间的竞争加剧，MME-CoT的发布将对市场和研究界产生深远影响。

4 天

DeepSeek、OpenAI、Kimi 视觉推理哪家强，港中文 MMLab 推出推理基准 MME-COT

OpenAI o1 和 DeepSeek-R1 靠链式思维（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推理，又应该如何细粒度地评估视觉推理呢？

腾讯网1 天

观点 | 从Deepseek-R1 看 2025 模型的未来

作者 | 栾小凡年初以来，DeepSeek 的爆火引发了行业震动，各大模型厂商纷纷预告下一代大模型的研发计划，包括 OpenAI 的 GPT-4.5 和 GPT-5、Anthropic 的 Claude 4，以及国内众多 AI ...

7 小时

响应小于1秒、唤醒识别超98%！岚图自研AI语音对话系统即将发布

快科技2月26日消息，岚图汽车宣布，其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力，响应时间小于1秒，同时拥有超过98%的唤醒识别率。

9 天

COT报告：日元多头押注以创纪录速度飙升，美元资金外流持续

（图标显示美元净敞口（USD net exposure）的周度变化情况，时间范围从2022年第二季度到2025年第四季度。美元指数在2022年第三季度达到峰值后开始波动，并在2023年第一季度和第二季度之间有所下降。随后，在2024年第一季度再次上升 ...

腾讯网18 天

超越CoT！微软剑桥中科院提出MVoT，直接可视化多模态推理过程

2025-02-08 11:33发布于北京新智元官方账号【新智元导读】近日，微软和剑桥大学公布推理新方法：多模态思维可视化MVoT。新方法可以边推理，边「想象」，同时利用文本和图像信息学习，在实验中比CoT拥有更好的可解释性和稳健性，复杂情况下甚至比CoT强20%。还可以与CoT组合，进一步提升模型性能。大模型也学会了「空间想象力」？还可以自己解释自己？在大语言模型（LLMs）和多模态大语言 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果