搜索常见指标
Precision@K
- 指检索得到的文档中相关文档所占的比例。
- 公式
- Precision@K 表示 = K
Recall@K
- 指所有相关文档被检索的比例
- 公式
AUC/GAUC
- AUC的物理意义为任取一对正例和负例,正例得分大于负例得分的概率
- AUC的值与ROC(tpr-fpr)曲线下方面积相等
iterm | 意义 | 公式 |
---|---|---|
tpr | True Postive Rate | TP/(TP+FN) |
fpr | False Postive Rate | FP/(FP+TN) |
- GAUC先对搜索session内样本求AUC,然后对所有session求平均
MAP(Mean Average Precision)
- AP/AveP:同时考虑准确率和召回率,把准确率看成召回率的函数 precision = ,来衡量随着召回率从0到1,准确率的变化情况。AveP 即对该函数进行积分,求 precision 的期望均值
其中,rel(k) 表示第k个文档是否相关,若相关则为1,否则为0;P(k) 表示前k个文档的准确率,即precision@K。- 公式理解
其中,R 表示相关文档的总个数;position® 表示,结果列表从前往后看,第 r 个相关文档在列表中的位置。举例,有三个相关文档,位置分别为1、3、6,那么:
- MAP:对多个query的AveP求均值
NDCG (Normalize DCG)
- 特点:支持对多级label(>2)文档进行综合打分
- 公式:DCG (Discounted cumulative gain)
其中,gain函数一般取: ,rj 为 label,
discount 函数一般取: - 公式:
MRR (Mean reciprocal rank)
- RR (reciprocal rank) 表示第一个相关文档排序位置的倒数。MRR即对多个query的RR求均值:
- 应用:常用于只要求一个最终结果的场景,如问答类检索
ERR (Expected reciprocal rank)
- 表示用户的需求被满足时停止的位置的倒数的期望
- 公式:
其中,PPr 为用户在位置 r 停止的概率;指位置的倒数。
其中,Ri是关于文档相关度 label 的函数,如可取: - 特点:考虑了文档之间的相关性信息,一个文档是否被用户点击和排在它前面的文档有很大的关系。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Steven's Blog!
评论