|
|
@@ -518,7 +518,7 @@ Decoder-Only 架构的工作模式被称为<strong>自回归 (Autoregressive)</s
|
|
|
|
|
|
在使用大模型时,你会经常看到类似`Temperature`这类的可配置参数,其本质是通过调整模型对 “概率分布” 的采样策略,让输出匹配具体场景需求,配置合适的参数可以提升Agent在特定场景的性能。
|
|
|
|
|
|
-传统的概率分布使由 Softmax 公式计算得到的:$p_i = \frac{e^{z_i}}{\sum_{j=1}^k e^{z_j}}$,采样参数的本质就是在此基础上,根据不同策略“重新调整”或“截断”分布,从而改变大模型输出的下一个token。
|
|
|
+传统的概率分布是由 Softmax 公式计算得到的:$p_i = \frac{e^{z_i}}{\sum_{j=1}^k e^{z_j}}$,采样参数的本质就是在此基础上,根据不同策略“重新调整”或“截断”分布,从而改变大模型输出的下一个token。
|
|
|
|
|
|
`Temperature`:温度是控制模型输出 “随机性” 与 “确定性” 的关键参数。其原理是引入温度系数$T\gt0$,将 Softmax 改写为$p_i^{(T)} = \frac{e^{z_i / T}}{\sum_{j=1}^k e^{z_j / T}}$。
|
|
|
|