图 1. (a)CoMCTS 搜索有效性和效率比较。(b)基于 CoMCTS 数据训练的 Mulberry 模型展现了卓越的推理性能。 一个直观的想法是直接将树搜索方法应用于 MLLM 的有效推理路径搜索,但这种方法效果并不好,如图 1 所示。主要原因在于: (1)搜索有效性:传统的 MCTS ...