thought - 搜索 News

1 天

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

过去大多数创造力测评在探索 LLM 的 Leap-of-Thought 能力的时候，仍然遵循普通大模型测评中的选择、排序等评估类型。尽管这种评估方式对逻辑思维能力的考察非常有效，但是在对创造力的评估中则不太合理。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果