Earyant的技术博客

欢迎来到Earyant的技术博客,在这里我将与你分享新技术。

评估指标

各大任务的评价指标


1. 语言模型 — Perplexity

PPL 主要用于衡量语言模型的好坏,其根据每个词来估计一句话出现的概率, 并用句子长度做 Normalization。

2. BLEU

欢迎关注我的其它发布渠道