Ver Fonte

Update 第三章 大语言模型基础.md

“使由“改为 ”是由”
Nicolas há 6 meses atrás
pai
commit
f79b0ca220
1 ficheiros alterados com 1 adições e 1 exclusões
  1. 1 1
      docs/chapter3/第三章 大语言模型基础.md

+ 1 - 1
docs/chapter3/第三章 大语言模型基础.md

@@ -518,7 +518,7 @@ Decoder-Only 架构的工作模式被称为<strong>自回归 (Autoregressive)</s
 
 在使用大模型时,你会经常看到类似`Temperature`这类的可配置参数,其本质是通过调整模型对 “概率分布” 的采样策略,让输出匹配具体场景需求,配置合适的参数可以提升Agent在特定场景的性能。
 
-传统的概率分布使由 Softmax 公式计算得到的:$p_i = \frac{e^{z_i}}{\sum_{j=1}^k e^{z_j}}$,采样参数的本质就是在此基础上,根据不同策略“重新调整”或“截断”分布,从而改变大模型输出的下一个token。
+传统的概率分布由 Softmax 公式计算得到的:$p_i = \frac{e^{z_i}}{\sum_{j=1}^k e^{z_j}}$,采样参数的本质就是在此基础上,根据不同策略“重新调整”或“截断”分布,从而改变大模型输出的下一个token。
 
 `Temperature`:温度是控制模型输出 “随机性” 与 “确定性” 的关键参数。其原理是引入温度系数$T\gt0$,将 Softmax 改写为$p_i^{(T)} = \frac{e^{z_i / T}}{\sum_{j=1}^k e^{z_j / T}}$。