il y a 9 mois · bede6253f4
--- a/docs/chapter4/第四章智能体经典范式构建.md
+++ b/docs/chapter4/第四章智能体经典范式构建.md
@@ -850,7 +850,7 @@ Reflection 机制的灵感来源于人类的学习过程：我们完成初稿后
 
				    - <strong>遗漏信息</strong>：是否忽略了问题的某些关键约束或方面？ 根据评估，它会生成一段结构化的<strong>反馈 (Feedback)</strong>，指出具体的问题所在和改进建议。
			
 
				 3. <strong>优化 (Refinement)</strong>：最后，智能体将“初稿”和“反馈”作为新的上下文，再次调用大语言模型，要求它根据反馈内容对初稿进行修正，生成一个更完善的“修订稿”。
			
 
				 
			
 
				-这个循环可以重复进行多次，直到反思阶段不再发现新的问题，或者达到预设的迭代次数上限。我们可以将这个迭代优化的过程形式化地表达出来。假设 $O_i$ 是第 $i$ 次迭代产生的输出（$O_0$ 为初始输出），反思模型 $\pi_{\text{reflect}}$ 会生成针对 $O_i$ 的反馈 $F_i$：
			
 
				+如图4.3所示，这个循环可以重复进行多次，直到反思阶段不再发现新的问题，或者达到预设的迭代次数上限。我们可以将这个迭代优化的过程形式化地表达出来。假设 $O_i$ 是第 $i$ 次迭代产生的输出（$O_0$ 为初始输出），反思模型 $\pi_{\text{reflect}}$ 会生成针对 $O_i$ 的反馈 $F_i$：
			
 
				 $$
			
 
				 F_i = \pi_{\text{reflect}}(\text{Task}, O_i)
			
 
				 $$
			
@@ -859,12 +859,15 @@ $$
 
				 O_{i+1} = \pi_{\text{refine}}(\text{Task}, O_i, F_i)
			
 
				 $$
			
 
				 
			
 
				+
			
 
				+
			
 
				 <div align="center">
			
 
				 <img src="https://raw.githubusercontent.com/datawhalechina/Hello-Agents/main/docs/images/4-figures/03.png" alt="Reflection机制中的“执行-反思-优化”迭代循环" width="70%"/>
			
 
				 <p>图 4.3 Reflection 机制中的“执行-反思-优化”迭代循环</p>
			
 
				 </div>
			
 
				 
			
 
				 
			
 
				+
			
 
				 与前两种范式相比，Reflection 的价值在于：
			
 
				 
			
 
				 - 它为智能体提供了一个内部纠错回路，使其不再完全依赖于外部工具的反馈（ReAct 的 Observation），从而能够修正更高层次的逻辑和策略错误。
			
@@ -1198,7 +1201,7 @@ def find_primes(n):
 
				 2. Plan-and-Solve：我们实现了一个先规划后执行的 Plan-and-Solve 智能体，并利用它解决了需要多步推理的数学应用题。它将复杂的任务分解为清晰的步骤，然后逐一执行。其核心优势在于<strong>结构性</strong>和<strong>稳定性</strong>，特别适合处理逻辑路径确定、内部推理密集的任务。
			
 
				 3. Reflection (自我反思与迭代)：我们构建了一个具备自我优化能力的 Reflection 智能体。通过引入“执行-反思-优化”的迭代循环，它成功地将一个效率较低的初始代码方案，优化为了一个算法上更优的高性能版本。其核心价值在于能<strong>显著提升解决方案的质量</strong>，适用于对结果的准确性和可靠性有极高要求的场景。
			
 
				 
			
 
				-本章探讨的三种范式，代表了智能体解决问题的三种不同策略。在实际应用中，选择哪一种，取决于任务的核心需求：
			
 
				+本章探讨的三种范式，代表了智能体解决问题的三种不同策略，如表4.1所示。在实际应用中，选择哪一种，取决于任务的核心需求：
			
 
				 
			
 
				 <div align="center">
			
 
				 <p>表 4.1 不同 Agent Loop 的选择策略</p>