
我记得原书里好像有段话,研究员调侃说:困惑度最大的好处是开组会方便,因为可以说:“我们把perplexity降低了多少多少”。
看书一向不仔细的我,更困惑了:语言模型就是一堆概率啊。
语料一般划分为训练集和测试集两个集合,每个都由若干句子组成,训练集一半比测试集大得多。
困惑度一般用测试集计算。
问AI “举例说明如何计算语言模型的困惑度”:


计算整个测试集困惑度的方法是对句子的困惑度求算术平均数。
夏普指数(Sharpe Ratio)是由1990年诺贝尔经济学奖得主威廉·夏普于1966年提出的一个金融指标。它用于评估投资组合的风险调整后收益,计算公式为:
夏普比率 =(投资组合预期收益率 - 无风险利率) / 投资组合收益率的标准差。

人的认识是螺旋式上升的。“这就命名了个定理?”、 “高次方程也适用”、“哦”。