【NLP】15. NLP推理方法详解 --- 动态规划：序列标注，语法解析，共同指代

动态规划（Dynamic Programming，简称 DP）是一种通过将问题分解为较小子问题来优化计算效率的技术。它特别适用于优化最优解问题，比如序列标注（sequence tagging）这类任务。

序列标注是自然语言处理（NLP）中常见的任务之一。它的目标是为输入的每个单词（或者子序列）分配一个标签。这个标签集通常是固定且有限的。最常见的例子是：

在序列标注中，标签是来自一个固定的标签集合，且序列长度已知且固定。

在许多基础的机器学习模型中，每个标签都是独立预测的。这种方法存在一个问题，就是 独立预测可能会导致不一致的结果。例如，在词性标注任务中，模型可能会错误地标记某个单词的词性，但这个错误可能会影响后续预测。

贪心算法（greedy approach）逐步做出局部最优的选择，但由于缺乏全局视野，这种方法可能会导致全局的错误。例如，贪心算法可能错误地为某个词分配了标签，导致后续的标注结果不一致。

举个例子，“the old man the boat”这个句子中，如果我们贪心地预测每个词的标签，可能会错误地预测"man"作为动词（即“the old man [to] the boat”）。但由于模型只关注当前词，错误直到后续预测时才会变得明显。

动态规划（DP）是解决这类问题的有效工具。它的基本思想是通过将问题分解为子问题，并存储子问题的解，避免重复计算，进而提高效率。在序列标注中，DP通过计算每个词的标签得分以及标签之间的转移得分，来有效地找到最高得分的标签序列。

序列标注任务的模型通常会涉及两个主要部分：

发射模型（Emission Model）：表示当前单词与某个标签的关联。例如，对于命名实体识别任务，发射模型会计算每个单词属于某个实体类型（如人名、地点等）的概率。
转移模型（Transition Model）：表示从一个标签转移到另一个标签的概率。例如，标签 “动词” 转移到标签 “名词” 的概率。

$p ro b 1 = e / t$

其中 e 是发射概率，t 是转移概率。

递归计算（Intermediate Scores）：对于每个单词，基于其与当前标签的发射概率，和从前一个标签到当前标签的转移概率，计算所有可能路径的得分。

$\text{prob4} = e \times \max(t \times \text{prob pre})$

其中 prob pre 是前一个状态的概率。

$\text{prob10} = \max(t_{\text{pre}} \times \text{prob pre})$

其中 tpre 是前一个标签到当前标签的转移概率，prob pre 是前一个标签的得分。

O(|words| * |labels|²)：对于标准的序列标注任务，时间复杂度是 O(单词数×标签数^2)，因为对于每个单词，我们需要计算标签之间的转移概率，而转移的计算需要遍历每对标签。
O(|words| * |labels|³)：如果我们在模型中加入了更多的标签上下文（例如，考虑更长的标签序列历史），时间复杂度会增加到 O(单词数×标签数^3)，这意味着计算量会更大。