2023.12.14-Exchange-of-Thought-Enhancing Large Language Model Capabilities through Cross-Model Communication

研究背景与动机

现有的一些增强推理和理解的方案中,CoT和自矫正方案是比较常用的。但在没有外部反馈的情况下,LLM 难以修正其回复,因为模型完全依赖内部表示来生成回复,这使得克服固有的能力限制变得困难。

该文章提出EoT框架,实现在问题解答过程中的跨模型的交互,从而解决这一问题。

主要工作与贡献

概括

  • 提出EoT框架
  • 提出并研究不同的沟通范式
  • 实验结果证明其有效

EoT框架

image-20231215170108276

作者提出的思维交流(Exchange-of-Thought,EoT),通过促进跨模型交流,实现对外部反馈的整合。该方法充分利用了 LLM 的通信能力,鼓励参与模型之间理性和答案的共享,从而建立起一个协同思考和分析的环境。

四种沟通范式

作者提出了四种通信范式,以确定模型之间的适当对应关系。如图所示,有记忆、报告、中继和辩论的通信范式,分别对应总线、星型、环形和树状网络拓扑。

image-20231215170221060

这四种通信范式分别是:

  1. 记忆(Memory): 采用总线拓扑,其中一个中央节点将信息传递给所有其他节点。在 EoT 中,每个模型在推理过程中生成的信息被集中存储,其他模型可以随时访问。
  2. 报告(Report): 采用星型拓扑,其中一个中心节点(中心模型)收集所有其他节点的信息。每个模型向中心模型报告其生成的推理和答案,由中心模型进行综合。
  3. 中继(Relay): 采用环形拓扑,信息通过相邻的节点依次传递。在 EoT 中,模型之间以循环的方式传递推理信息,允许信息在模型之间传递和融合。
  4. 辩论(Debate): 采用树状拓扑,一个中心节点与多个子节点相连。在 EoT 中,中心模型与其他模型展开辩论,各自提出不同的推理和答案,最终达成共识或者根据多数意见选择答案。

对应的不同沟通方式的通信量都有不同,并为了避免不必要的通信,本文也给出了终止通信的标准:一致输出与多数共识。

置信度评估

通过多轮生成的结果是否一致,判断模型输出的信息是否可靠,保护解决过程中免受错误信息的干扰。

未来展望

在 CoT 的基础上,作者引入思维交流(EoT)框架,实现了不同模型之间的跨模型交流,从而使推理性能得到显著提升。

EoT的四种通信范式不仅在各种推理任务中展现出卓越的性能,而且相较于其他方法更节约计算成本。通过对外部反馈的整合,EoT 提供了一种新颖而高效的方式,使模型在解决复杂问题时能够更全面、深入地进行推理。

实验证明,EoT 在常识推理和符号推理任务上表现出更好的性能,充分发挥了多模型协作的潜力。我们的研究也强调了模型多样性的重要性,通过整合不同模型的优势,取得了比单一模型更出色的效果。

工作会偏工程应用,更像是以多个模型去实现这样的任务,并不是在模型基础上优化实现的,存在一定的局限性。

参考文献

  1. https://mp.weixin.qq.com/s/hxZ5SnVcQd2zRSYDSsZOuQ
  2. https://arxiv.org/pdf/2312.01823.pdf