其他分享
首页 > 其他分享> > 搜索相关性方法

搜索相关性方法

作者:互联网

  1. 基于bm25的改进
    https://tech.meituan.com/2017/06/16/travel-search-strategy.html
    美团点评旅游搜索召回策略的演进, 关于相关性跟进的方法。参考BM25公式。
    主要考虑点:
    1)考虑不同文本域权重不一样,其中H表示文本域集合,名称, 品类等。
    i_f是命中域的动态权重,可以根据命中Term在Query中的比例或权重来设置
    w_f是f的权重,比如POI名称域的权重一般会高于Deal标题域
    lf是文本域f的长度
    文中这里取max,是担心某个域的缺失对得分影响太大。但具体应用中可以改为sum或者其他。
    2)考虑 term在query中的词权重。
    在这里插入图片描述

标签:权重,搜索,相关性,命中,考虑,文本,方法
来源: https://blog.csdn.net/zhouwenyuan1015/article/details/122086524