最新消息:阿里云双12优惠,史上最低折扣。

链接算法-pagerank算法解析

服务器租用 aliyun 329浏览

虚拟主机为什么仍然存在?其主要用途介绍

虚拟主机已经被使用了很多年,其是区别于物理主机配置的方式,可以用来托管网站。在网站服务器的选择中,虚拟主机以低成本而备受用户喜爱与选择。

谈到网站推广,这里就不得SEO与SEM。

SEM不过是SEO推广的分支,这里暂且不谈。主要这是花钱既有展现,推广一旦停止既没有流量。

SEO涉及的算法就比较多了,其有一句为:“内容为王,外链为皇”。虽然外链的作用不断降低,不过目前在搜索中依旧占据举足轻重的地位。

本次我们谈一下链接算法始祖——PageRank算法

一、PageRank算法简述

1.PageRank算法

PageRank是网站投票的一个机制,比如A页面有B页面的链接,这就算是A给B的一个投票。这个投票中传递一个参数叫做“权值”。

当一个页面拥有很多网站的投票,则这个页面就越重要,接收到的权值多,也越容易受到搜索引擎的“青睐”。

2.PageRank算法中的链接陷阱

我们可以想象如果互联网不存在检索词,只有PageRank算法决定排名,则接收到权值最多的网站则排名越好。

所以也就出现了链接陷阱,比如D页面指向A,而这个A页面的关系却如下:

A→B→C→A

可以看到这就是一个链接陷阱,A、B、C绕了一圈就回去了,获取的权值会越来越多,却不会往外输出权值。其积累的权重会越来越多……

3.远程跳转

为了避免出现先前的链接陷阱,后续谷歌在算法中加入了链接远程跳转。

A→B→C→?

当一些页面互联一圈后,蜘蛛会在库中随机挑选URL跳出,把权值带走。

?中的页面是随机的跳转的,因此也叫远程跳转。

二、PageRank传值算法

假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

 

重新假设B链接到A和C,C只链接到A,并且D链接到全部其他的3个页面。一个页面总共只有一票。所以B给A和C每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

 

对于一个页面A,那么它的PR值为:

 

PR(A) 是页面A的PR值

PR(Ti)是页面Ti的PR值,在这里,页面Ti是指向A的所有页面中的某个页面

C(Ti)是页面Ti的出度,也就是Ti指向其他页面的边的个数

d 为阻尼系数,其意义是,在任意时刻,用户到达某页面后并继续向后浏览的概率,

 

该数值是根据上网者使用浏览器书签的平均频率估算而得,通常d=0.85

转载请注明:小猪云服务器租用推荐 » 链接算法-pagerank算法解析