播发布okex火币网下载官方app币安网挖矿交易平台

当前位置:主页 > 百科知识 > 本文内容

【成都网站推广】Reputation

发布时间:2021-03-02 12:15源自:seo网站优化作者:网站推广阅读()

  【成都网站推广】Reputation
 
  上面的所有算法,都是从查询项或者主题出发,经过算法处理,得到结果网页。多伦多大学计算机系Alberto Mendelzon,Davood Rafiei提出了一种反向的算法,输入为某个网页的URL地址,输出为一组主题,网页在这些主题上有声望(repution)。
 
  给定一个网页p,计算在主题t上的声望,首先定义2个参数,渗透率和聚焦率,简单起见,网页p包含主题项t,就认为p在主题t上。
 
  是指向p而且包含t的网页数目,是指向p的网页数目,是包含t的网页数目。结合非条件概率,引入是WEB上网页的数目。P在t上的声望计算如下:
 
  指定是既指向p有包含t的概率,即,显然有
 
  我们可以从搜索引擎(如Altavista)的结果得到,,,WEB上网页的总数估计值某些组织会经常公布,在计算中是个常量不影响RM的排序,RM最后如此计算:
 
  给定网页p和主题t,RM可以如上计算,但是多数的情况的只给定网页p,需要提取主题后计算。算法的目标是找到一组t,使得RM(p,t)有较大的值。TOPIC系统中是抽取指向p的网页中的锚文本的单词作为主题(上面已经讨论过锚文本能很好描述目标网页,精度很高),避免了下载所有指向p的网页,而且RM(p,t)的计算很简单,算法的效率较高。主题抽取时,还忽略了用于导航、重复的链接的文本,同时也过滤了停止字(stop word),如“a”,“the”,“for”,“in”等。
 
  Reputation算法也是基于随机漫游模型的(random walk),可以说是PageRank和SALSA算法的结合体。

欢迎分享转载→ 【成都网站推广】Reputation

用户评论

验证码: 看不清?点击更换

注:网友评论仅供其表达个人看法,并不代表本站立场。

播发布提供最新火币网下载官方app,okex,币安网,币安网,数字货币虚拟货币购买价值,区块链技术挖矿交易平台知识服务. 备案号:蜀ICP备15006276号-1收藏本站 - 网站地图