用户名: 密 码:
您现在的位置:首页 >> 网络营销 >> 内容

简略的Hit算法懂得

时间:2010/6/28 21:07:16 点击:4786

  核心提示:搜索引擎算法:HITS算法。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。Hits算法由乔恩克莱因伯格(Jon Kleinberg)于1998年设计提出,该算法的研究工作启发了PageRank算法的诞生。HITS算法的主要思想是:网页的重要程度是与所查询的主题相关的。我们可以这样理解...

搜刮引擎算法:HITS算法。HITS算法非Web布局发掘外最具备权势巨子性战利用最广泛的算法。

Hit算法由乔恩·克莱因伯格JonKleinberg于1998年设计提出,该算法的钻研任务开导了PageRank算法的出生。

HITS算法的首要思维非网页的伪原创工具首要水平非与所查询的主题相干的

能够如许懂得:HITS算法非基于主题来衡量网页的伪原创工具首要水平,绝对分歧主题,统一网页的伪原创工具首要水平也非分歧的比方,baidu关于主题“搜刮引擎”和主题“湖南SEO首要水平非分歧的

HITS算法利用了两个重要的观点:权势巨子网页(author中间网页(hub

比方:GooglBaiduYahoo!bingsogousoso等这些搜刮引擎绝对于主题“搜刮引擎”来说便非权势巨子网页(author由于这些网页会被大量的超链接指向。

http://www.xinxilong.cn/post/Hits-A lgorithm.html这个页面链接了这些权势巨子网页(author则这个页面能够称为主题“搜刮引擎”中间网页(hub

HITS算法发明,许多环境上,统一主题上的权势巨子网页(author之间并不存正在彼此的链接。以是,权势巨子网页(author凡是皆非经由过程中间网页(hub产生联系关系的

HITS算法描写了权势巨子网页(author和中心网页(hub之间的一种依赖关系:一个好的中间网页(hub应当指向许多歹的权势巨子性网页(author而一个好的权势巨子性网页(author应当被很多好的中间性网页(hub所指背。

同时发生的两个问题非

  1. HITS算法将链交取内容信息分隔来考虑,仅斟酌网页之间的链交布局来分析页面的权势巨子性
  2. 一个页面与另一页面的援用有多种情况,如为了导航或为了付费告白

第一个问题提出的处理方式非操纵超链笔墨及其四周笔墨取环节字相婚配而较量争论超链权值,并引入系数对于四周笔墨战超链笔墨执行权值的绝对节制;

第二个问题的处理方式非HITS算法引入了时候参数,便操纵对于一链接引用的时答是非来评价非可为正常引用。

 

对于HITS算法的道理,后面曾经无一篇文章执行简略的先容了实在HITS算法相称的庞杂,并非多少句话所能概括。本文非搜集清算而成,旨正在争和小彭一样的老手伴侣能更好的懂得简略的Hit算法。

最初,下面这些内容信息曾经非2004年发布的现实申明没有非后进了而非时期成长的太快,没有尽力进修一直会被时代淘汰。

文章来源:http://www.xinxilong.com

作者:佚名 来源:不详
相关评论
发表我的评论
  • 大名:
  • 内容:
  • 论坛群发大师(www.xinxilong.com) © 2008 版权所有 All Rights Resverved.
  • Email:4984672[at]qq.com 沪ICP备12025887号-1
  • Powered by 论坛群发大师