Parcourir la source

fix bug in chapter4

jjyaoao il y a 9 mois
Parent
commit
bede6253f4
1 fichiers modifiés avec 5 ajouts et 2 suppressions
  1. 5 2
      docs/chapter4/第四章 智能体经典范式构建.md

+ 5 - 2
docs/chapter4/第四章 智能体经典范式构建.md

@@ -850,7 +850,7 @@ Reflection 机制的灵感来源于人类的学习过程:我们完成初稿后
    - <strong>遗漏信息</strong>:是否忽略了问题的某些关键约束或方面? 根据评估,它会生成一段结构化的<strong>反馈 (Feedback)</strong>,指出具体的问题所在和改进建议。
 3. <strong>优化 (Refinement)</strong>:最后,智能体将“初稿”和“反馈”作为新的上下文,再次调用大语言模型,要求它根据反馈内容对初稿进行修正,生成一个更完善的“修订稿”。
 
-这个循环可以重复进行多次,直到反思阶段不再发现新的问题,或者达到预设的迭代次数上限。我们可以将这个迭代优化的过程形式化地表达出来。假设 $O_i$ 是第 $i$ 次迭代产生的输出($O_0$ 为初始输出),反思模型 $\pi_{\text{reflect}}$ 会生成针对 $O_i$ 的反馈 $F_i$:
+如图4.3所示,这个循环可以重复进行多次,直到反思阶段不再发现新的问题,或者达到预设的迭代次数上限。我们可以将这个迭代优化的过程形式化地表达出来。假设 $O_i$ 是第 $i$ 次迭代产生的输出($O_0$ 为初始输出),反思模型 $\pi_{\text{reflect}}$ 会生成针对 $O_i$ 的反馈 $F_i$:
 $$
 F_i = \pi_{\text{reflect}}(\text{Task}, O_i)
 $$
@@ -859,12 +859,15 @@ $$
 O_{i+1} = \pi_{\text{refine}}(\text{Task}, O_i, F_i)
 $$
 
+
+
 <div align="center">
 <img src="https://raw.githubusercontent.com/datawhalechina/Hello-Agents/main/docs/images/4-figures/03.png" alt="Reflection机制中的“执行-反思-优化”迭代循环" width="70%"/>
 <p>图 4.3 Reflection 机制中的“执行-反思-优化”迭代循环</p>
 </div>
 
 
+
 与前两种范式相比,Reflection 的价值在于:
 
 - 它为智能体提供了一个内部纠错回路,使其不再完全依赖于外部工具的反馈(ReAct 的 Observation),从而能够修正更高层次的逻辑和策略错误。
@@ -1198,7 +1201,7 @@ def find_primes(n):
 2. Plan-and-Solve:我们实现了一个先规划后执行的 Plan-and-Solve 智能体,并利用它解决了需要多步推理的数学应用题。它将复杂的任务分解为清晰的步骤,然后逐一执行。其核心优势在于<strong>结构性</strong>和<strong>稳定性</strong>,特别适合处理逻辑路径确定、内部推理密集的任务。
 3. Reflection (自我反思与迭代):我们构建了一个具备自我优化能力的 Reflection 智能体。通过引入“执行-反思-优化”的迭代循环,它成功地将一个效率较低的初始代码方案,优化为了一个算法上更优的高性能版本。其核心价值在于能<strong>显著提升解决方案的质量</strong>,适用于对结果的准确性和可靠性有极高要求的场景。
 
-本章探讨的三种范式,代表了智能体解决问题的三种不同策略。在实际应用中,选择哪一种,取决于任务的核心需求:
+本章探讨的三种范式,代表了智能体解决问题的三种不同策略,如表4.1所示。在实际应用中,选择哪一种,取决于任务的核心需求:
 
 <div align="center">
 <p>表 4.1 不同 Agent Loop 的选择策略</p>