思维链

Posted on 2023-12-13 In 学习笔记

本文主要介绍CoT相关的一些方法和技术

CoT

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

CoT
简单来说就是将原本的问题，经过多个中间步骤最终获取答案，实现更好的推理。

具体实现效果：常识推理能力赶超人类；数学逻辑推理能力大幅度提升；LLM可解释性更强。

zsCoT

零样本思维链通过引入与样本无关指示，来实现自我增强

其实核心就是对生成的多个结果选择取多数的答案，这一个可以直接通过控制temprature和Top-K来实现，很显然这会使得时间会变长。

LtM

将问题按步骤拆分成多个子问题，解决完多个子问题后回答最终问题。具体训练就是分为多个CoT阶段实现。

Flan-T5：在超大规模的任务上对模型进行微调，使得单个模型在1800多个NLP任务上都能够有很好的表现。

微调方法就是在加入CoT数据。其核心是对多任务数据的统一。

实现流程：

结论：

旨在利用大模型思维链推理能力指导小模型解决复杂问题。

FuCoT

简单的说就是用ChatGPT这类大模型生成CoT数据，然后再喂给小模型进行微调。同时该方法需要生成尽可能多的数据。