il y a 5 mois · c2c04c5a3b
--- a/docs/chapter3/第三章大语言模型基础.md
+++ b/docs/chapter3/第三章大语言模型基础.md
@@ -40,7 +40,7 @@ $$P(w_i∣w_{i−1})=\frac{Count(w_{i−1},w_i)}{Count(w_{i−1})}$$
 
				 - $Count(w_{i−1},w_i)$：表示词对 $(w_{i−1},w_i)$ 在语料库中连续出现的总次数。
			
 
				 - $Count(w_{i−1})$：表示单个词 $w_{i−1}$ 在语料库中出现的总次数。
			
 
				 
			
 
				-公式的含义就是：我们用“词对 $Count(w_i−1,w_i)$ 出现的次数”除以“词 $Count(w_{i−1})$ 出现的总次数”，来作为 $P(w_i∣w_{i−1})$ 的一个近似估计。
			
 
				+公式的含义就是：我们用“词对 $Count(w_{i−1},w_i)$ 出现的次数”除以“词 $Count(w_{i−1})$ 出现的总次数”，来作为 $P(w_i∣w_{i−1})$ 的一个近似估计。
			
 
				 
			
 
				 为了让这个过程更具体，我们来手动进行一次计算。假设我们拥有一个仅包含以下两句话的迷你语料库：`datawhale agent learns`, `datawhale agent works`。我们的目标是：使用 Bigram (N=2) 模型，估算句子 `datawhale agent learns` 出现的概率。根据 Bigram 的假设，我们每次会考察连续的两个词（即一个词对）。