2024年11月14日

提示词工程-ReAct提示词（反应式）-让智能体像人一样思考和行动

作者柳永强

内容目录

文章会实时同步到我的公众号，有兴趣的童鞋扫码关注我的公众号噢：

提示词工程-ReAct

提示词工程的魅力就在于，让你可以变成现代版的祭师，能够让大模型言听计从，控制大模型做你想做的事情。

我不太确定超级智能会在未来的哪一天出现，但是从AI的快速迭代和进化来看，我们似乎可以预测，这一天不会遥远。一直以来，创造一个能够自主思考，自主学习和进化的智能体应该是AI发展的终极目标，而在这样的发展进程中，提示词工程也许只是这个进程中的一小段旅程，也许有一天，这项技术会成为历史，不过至少现在，它能够让我们对AI大模型有更加深入的了解，并且助力大模型变得更加聪明和务实。

起初，很难相信，生成模型会具有思考的能力，可当研究人员不断的探索出新的提示词技术时，这种怀疑逐渐得到了清晰的答案。

ReAct 提示词

ReAct 是 "Reasoning and Acting" 的缩写，旨在通过结合推理和行动来提高模型在复杂任务中的表现。

起初该框架由Yao 等人于2022年提出。

ReAct提示词实际上是one-shot或者few-shot提示词的一种（对于什么是one-shot，few-shot提示词，请阅读《提示词工程-少样本提示》）。
简单的说，就是给AI大模型一个思考-行动的例子，通过该例子，表明完成一件特殊任务时，思考和行动的基本框架和逻辑。ReAct本身是拟人化的，模拟人类思考和行动的基本方式，这里我可以举一个非常简单的例子，比如肚子饿了，非常想吃蛋糕：

问题：俺肚子饿了，非常想吃蛋糕。
思考：看看家里有没有买了蛋糕啊？
行动：去冰箱里看看，去厨房看看，发现没有。
思考：想吃自己做的蛋糕呢，还是去点外卖呢，哎，最近有点懒，不想动，还是外卖吧！
行动：打开手机APP，搜索蛋糕，得到种类繁多的蛋糕。
思考：我到底想吃哪一种呢，好像提拉米苏更加诱人一些。
行动：下单购买提拉米苏。
......

以上只是一个非常简单的例子，对人类来说，看起来是件非常普通和自然的事情，可是将思考方式分解，用来提示AI大模型时，会出现非常神奇的效果。

与链式思维推理类似，ReAct 是一种提示工程方法，使用少量样本学习来教模型解决问题。CoT 旨在模仿人类思考问题的方式，ReAct 也包含了这种推理元素，但更进一步地允许智能体通过文本操作与其环境进行交互。人类通过语言推理（说话或思考）来帮助制定策略和记忆事物，但我们也可以采取行动来获取更多信息并实现目标。这就是 ReAct 的基础。

ReAct 提示包括包含行动的示例，通过行动获得的观察，以及人类在过程中不同阶段的书面思考（推理策略）。LLM 学会模仿这种交替进行思考与行动的方法，使其成为环境中的智能代理。下方是 ReAct 智能体如何运作的示例，（按“思考 -> 行动 -> 观察 -> 思考”顺序）。

ReAct智能体的任务执行的大致过程：

用户提出问题。
思考，第一步应该做什么，决定执行动作和环境互动。
行动，使用外部工具，从环境中获取需要的信息。
观察，将行动的结果和收集的信息作为下一步思考的输入。
思考，判断是否问题得到解决，基于上一步观察的结果，重新制定下一步需要执行的动作。
重复以上循环，直到问题解决，或者得到了最终的答案，并结束。

ReAct 提示词是一种思考和行动的模版和范式，教AI大模型按照这种思维框架进行学习和解决问题，与其他提示工程不同的是，ReAct需用通过和环境的互动，获取信息，做动态的调整和规划。因此使用ReAct提示词时，同时需要实现智能体，或者智能代理，能够让智能体使用工具和外部环境进行交互。

通用ReAct智能体提示词模版

以下提供的提示词模版是对ReAct的抽象和总结，通过以下模版，开发人员可以定义 AI Agent的基本角色和用户场景，以及智能体能够和外界交互的可用工具集。同时指导智能体在执行特定任务时，需遵从“思考-》执行任务-》观察-》思考”的迭代过程。

以下的ReAct通用提示词可以使用在任何任务场景，程序员只要稍加调整和修改就可以应用在自己的工具和用例里。

TOOL_DESC = """{name_for_model}: Call this tool to interact with the {name_for_human} API. What is the {name_for_human} API useful for? {description_for_model} Parameters: {parameters} Format the arguments as a JSON object."""

REACT_PROMPT = """Answer the following questions as best you can. You have access to the following tools:

{tool_descs}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can be repeated zero or more times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {query}"""

以下是该提示词模板的中文翻译：

TOOL_DESC = """{name_for_model}：调用此工具以与{name_for_human} API 交互。{name_for_human} API 有什么用途？{description_for_model} 参数：{parameters} 将参数格式化为 JSON 对象。"""

REACT_PROMPT = """请尽可能准确地回答以下问题。你可以使用以下工具：

{tool_descs}

使用以下格式：

问题：你必须回答的输入问题
思考：你应该始终考虑要做什么
行动：要采取的行动，应为 [{tool_names}] 之一
行动输入：行动的输入
观察：行动的结果
...（此思考/行动/行动输入/观察可以重复零次或多次）
思考：我现在知道最终答案了
最终答案：对原始输入问题的最终答案

开始！

问题：{query}"""

写在最后

由于ReAct需要通过环境来获取信息，因此从环境中获取的信息的准确性会严重影响最终的输出结果。因此开发者需要考虑环境信息的准确和可靠，才能保证ReAct应用的性能和可靠性。

ReAct的推理并不完美，但仍然是一种强大的提示工程方法，它克服了链式推理中的幻觉问题，并使大型语言模型能够成为可以与环境互动的智能体。此外，这是一种非常可解释的方法，因为智能体在行动时会输出其思维过程。

ReAct提示词可以让智能体变的更加聪明，帮助我们解决更加复杂的问题，探索ReAct智能体是一件非常有趣的过程。

我相信你一定好奇，如何使用以上的提示词模版实现一个能够自主思考的智能体，接下来后续的文章我将分析如何通过不同的Agent框架，快速的构建智能体，希望持续关注我的博客文章。

参考文章：

标签ReAct 提示词工程智能体

提示词工程-ReAct提示词（反应式）-让智能体像人一样思考和行动

提示词工程-ReAct

ReAct 提示词

更多ReAct提示词的例子

通用ReAct智能体提示词模版

写在最后

参考文章：

赞过：

发表回复取消回复

提示词工程-ReAct提示词（反应式）-让智能体像人一样思考和行动

提示词工程-ReAct

ReAct 提示词

更多ReAct提示词的例子

通用ReAct智能体提示词模版

写在最后

参考文章：

赞过：

发表回复 取消回复

发表回复取消回复