红板报 on MSN4 天
DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT姜东志 投稿量子位 | 公众号 QbitAI OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?
随着人工智能(AI)领域的迅猛发展,视觉推理能力的重要性愈发凸显。近期,香港中文大学的MMLab研究团队推出了一个名为MME-CoT的新基准测试框架,旨在系统性评估大型语言模型(LMM)在视觉推理任务中的性能表现。这个基准不仅强调了推理过程中的质量、鲁棒性和效率,还为当前的视觉推理任务建立了新的评估标准。随着各种大型模型之间的竞争加剧,MME-CoT的发布将对市场和研究界产生深远影响。
OpenAI o1 和 DeepSeek-R1 靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?
作者 | 栾小凡 年初以来,DeepSeek 的爆火引发了行业震动,各大模型厂商纷纷预告下一代大模型的研发计划,包括 OpenAI 的 GPT-4.5 和 GPT-5、Anthropic 的 Claude 4,以及国内众多 AI ...
快科技2月26日消息,岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。 该系统具备快速的车控响应能力,响应时间小于1秒,同时拥有超过98%的唤醒识别率。
钛媒体App ...
岚图汽车宣布,其自主研发的 AI 语音对话系统将于2025年上半年正式发布,并应用于即将推出的新车型。该系统的响应时间极快,所有操作的反应时间都将小于1秒,这意味着车主在使用语音控制车辆时可以获得更为顺畅的体验。此外,该系统还具备超过98% 的唤醒识别率,能够精准识别用户的指令。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果