评估指标 发表于 2022-03-12 阅读次数: 本文字数: 196 阅读时长 ≈ 1 分钟 各大任务的评价指标 1. 语言模型 — Perplexity 2. BLEU 各大任务的评价指标 1. 语言模型 — PerplexityPPL 主要用于衡量语言模型的好坏,其根据每个词来估计一句话出现的概率, 并用句子长度做 Normalization。 2. BLEU 打赏 欢迎关注我的其它发布渠道 Zhihu Github RSS