|
|
@@ -170,7 +170,7 @@
|
|
|
|
|
|
其次,行动的结果也并非总是确定的。根据结果的可预测性,环境可分为**确定性**和**随机性**。当智能体执行本地代码进行数学计算时,结果是确定的;但当它调用一个实时变化的搜索引擎API时,结果便带有随机性,这就要求智能体必须具备容错和处理不确定性的能力。
|
|
|
|
|
|
-此外,环境中还可能存在其他行动者,从而形成**多智能体** **(Multi-agent)** 环境。在这种情况下,智能体之间需要协作或竞争,一个智能体的行动会成为另一个智能体环境中的变量,这对智能体的沟通和协调能力提出了更高要求。
|
|
|
+此外,环境中还可能存在其他行动者,从而形成**多智能体(Multi-agent)** 环境。在这种情况下,智能体之间需要协作或竞争,一个智能体的行动会成为另一个智能体环境中的变量,这对智能体的沟通和协调能力提出了更高要求。
|
|
|
|
|
|
最后,几乎所有任务都发生在**序贯**且**动态**的环境中。“序贯”意味着当前动作会影响未来;而“动态”则意味着环境自身可能在智能体决策时发生变化。这就要求智能体的“感知-思考-行动-观察”循环必须能够快速、灵活地适应持续变化的世界。
|
|
|
|