Parcourir la source

Fix formula description in chapter 3

Corrected the formula description for bigram probability estimation in the text.
jjyaoao il y a 5 mois
Parent
commit
c2c04c5a3b
1 fichiers modifiés avec 1 ajouts et 1 suppressions
  1. 1 1
      docs/chapter3/第三章 大语言模型基础.md

+ 1 - 1
docs/chapter3/第三章 大语言模型基础.md

@@ -40,7 +40,7 @@ $$P(w_i∣w_{i−1})=\frac{Count(w_{i−1},w_i)}{Count(w_{i−1})}$$
 - $Count(w_{i−1},w_i)$:表示词对 $(w_{i−1},w_i)$ 在语料库中连续出现的总次数。
 - $Count(w_{i−1})$:表示单个词 $w_{i−1}$ 在语料库中出现的总次数。
 
-公式的含义就是:我们用“词对 $Count(w_i−1,w_i)$ 出现的次数”除以“词 $Count(w_{i−1})$ 出现的总次数”,来作为 $P(w_i∣w_{i−1})$ 的一个近似估计。
+公式的含义就是:我们用“词对 $Count(w_{i−1},w_i)$ 出现的次数”除以“词 $Count(w_{i−1})$ 出现的总次数”,来作为 $P(w_i∣w_{i−1})$ 的一个近似估计。
 
 为了让这个过程更具体,我们来手动进行一次计算。假设我们拥有一个仅包含以下两句话的迷你语料库:`datawhale agent learns`, `datawhale agent works`。我们的目标是:使用 Bigram (N=2) 模型,估算句子 `datawhale agent learns` 出现的概率。根据 Bigram 的假设,我们每次会考察连续的两个词(即一个词对)。