交行统一搜索复合排序和分类导航
交行统一搜索
--复合排序,分类导航 复合排序
排序算法如下:
1) 选取匹配度最高的100条文档,每个文档的匹配度为P(0-1的小数)
2) 每个文档有一个地域属性D,按分行划分,本行的文档D=1.2,总行的文档D=1.1(如果这个人是总行,文档也是总行,两个条件均符合,则取最大值D=1.2),其他行的文档D=1(如果应用系统如内网不能提供文档所属分行,一律按空白处理,这一类文档权重跟其他行的一样)
3) 新鲜度F:文档新鲜天数days = 系统当前时间 - 文档更新时间(新创建的文档取文档创建时间,流转中文档取最新更新时间,不是指索引创建时间),如果新鲜天数days <=30天,则F=1.2;30<days<=60,则F=1.1;days>60,则F=1;如果无法获取文档更新时间,F=1。
4) 应用A:根据文档来源的应用系统,得到不同的系数 OA公文 A:1.2
内网 A:1
邮件 A:1.1
外部资讯 A:1
论坛 A:1
档案 A:1.2
总的相关度R=匹配度P * 地域D * 新鲜度F * 应用A
按相关度R从大到小依次排序,R越大的文档越靠前。
在总的相关度R都计算完后,调用(参看SimpleSearch.java277至297行) Collections.sort(list,new ComparatorMap());
排序算法要求如下:
索引库有以下字段数据:
CreateDate:文档更新时间
AppID:文档所属应用
AreaID:文档所属地域
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库交行统一搜索复合排序和分类导航在线全文阅读。
相关推荐: