天使网赚论坛

 找回密码
 立即注册
查看: 1304|回复: 0

PageRank研究的一些结论

[复制链接]

126

主题

127

帖子

380

积分

网赚能手

Rank: 5Rank: 5

积分
380
qingqing3721 发表于 2011-11-9 16:08:11 | 显示全部楼层 |阅读模式
结合PageRank的算法原理以及实证剖析,应用PageRank判断网页的质量具有一定的可靠性和可行性,这方面已经得到行业的认可,但在评价中必需思索以下几个方面的成绩:


1.对评价对象抽取样本停止实验,检验PageRank值对评价该主题网页质量的可靠性和可行性,如根据SEO的相关网站的PageRank值与网页的质量未见相关性。对于该主题,不能轻易使用PageRank来判断网页的质量。


2.不同语言的网页的PageRank值不具有可比性,经过我们的实验显示,中文网页的PageRank值远低于英文网页的PageRank,也就是说,同等质量的内容,中文网页的PageRank远低于英文网页。


3.PageRank值不适用于评价中文网页。从实验中可以看到,中文网页的PageRank值绝大多数仍为0。


中文网页PageRank值得分低,至少有3个方面的原因:一是语言的影响使网页在全球范围内传达才能弱于英文网页。第二,与中文网页的链接行为有关。在以往的实验中,发现PageRank为零的网页所在的网域的PageRank并不低,很多高达5或6,也就是说,中文网页的链接通常更多的是链接到网站的主页,而不是链接到资源所在的网页,这使一些网页内容很好的网站不一定取得更多的威望链接,影响其PageRank值。第三,从实证一和实证二中发现,对于以PageRank为关键词检索到的网页,中文网页的内容90%以下去自于博客(blog)网站或论坛,一些被评价为好的网页的内容多来自对国外文章的编译,而其他少量的网页内容仅几句话。英文网页的内容有些来自于学术机构(以edu、ac为网域)或专家的团体网站。


4.PageRank的算法在评价学术网页时,有其自身的缺陷:第一,PageRank的算法未思索到网页的日期成绩。从实证中发现,有的网页质量较高,但PageRank值却很低,进一步观察发现这些网页的日期很新。剖析PageRank算法,也可以发现PageRank算法未思索网页的新旧成绩,一个刚发布的优质网页,能够由于没有多少外部链接而被PageRank视为高等级,相反,一个旧的质量较普通的网页,能够由于工夫累积,造成外部链接相对较多,而排名居前。第二,PageRank算法未思索域的价值,在学术网页的评价中,这显然是一个缺陷。由于网络中存在少量的广告,因此,来自域edu、ac的网页通常比来自com、net的网页更具有学术性。对于这类网页只有人工添加权重以补偿上述缺陷。


由此可见,只有在对PageRank的评价作用、适用范围有清楚的掌握时,才能使用这一指标停止网页质量评价。


网站的内容质量取决于构成网站的诸网页的内容质量,检索到网站关于某主题的相关网页后,将相关网页的PageRank值之和作为网站的PageRank值,这样,PageRank就从评价网页的指标进而成为评价网站的指标。
文章由 www.bjthx.com 太空记忆枕 整理,收集辛苦,希望能保留出处,谢谢斑竹大哥。
igerl.com Gainreel歌瑞尔内衣旗舰店
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

天使网赚论坛创建于2008年8月,本站内容均为会员发表,并不代表本论坛立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
天使网赚论坛法律顾问:ITlaw-庄毅雄

QQ|小黑屋|Archiver|天使网赚论坛 |网站地图

GMT+8, 2024-6-3 01:12 , Processed in 0.140067 second(s), 28 queries .

快速回复 返回顶部 返回列表