改善网站链接:计算内部页面的PR权重

    |     2016年6月4日   |   SEO培训, SEO案例   |     0 条评论   |    1443

pins-links-ss-2910-800x449

网站架构 – 建立和组织内部链接(例如,网站从主导航的about us部分的链接)的方式 – 起到在用户和搜索引擎如何能够浏览网站至关重要的作用,最终影响网站的排名。

现代搜索引擎使用链接抓取网页。通过搜索引擎的爬虫来点击页面上出现的每个环节上 – 内部链接和外部链接 – 然后每个后续页面上的所有链接,等等。这使得搜索引擎找到网页,并按照其指数来实现排名。

搜索引擎如谷歌也使用的链接的数量来进行排序的给出查询结果,考虑每个链接重要性的一个页面(即,网页级别)来进行表决判断。

出于这个原因,网站链接的网页影响着搜索引擎的如何抓取,对于理解和排名网站起到很大的作用。作为一个SEO从业者,如何确保网站架构是最佳的,内部链接是否组织正确,让我们来探讨如何计算度量内部的PageRank。

基本的网站架构和基于导航的内部链接

有两种基本类型的内部链接的:

  1. 形成你的网站的导航结构的内部链接
  2. 出现在上下文中(不一定是你的网站导航结构的产物,在文章和其他地方)的二次内部链接整个网站

来看看前者。第一步,让你的内部联系,以便为组织共同的导航元素,坚持一个组织良好的网站结构。我建议创建一个经典的内部链接结构,并利用布鲁斯·克莱的筒仓架构为内部链接的基础。这些尝试和测试的工作,逻辑站点结构。下面是一个例子:

Strict-Internal-Linking-For-SEO-800x449

 

现在,您的网站有内部链接了坚实的基础,让我们来看看这些导航链接,以及存在于上下文中的内部链接怎么样,可能会影响搜索引擎如何抓取和排名页面。看整体的内部链接的影响,我们将检查所有的页面的内部的PageRank。

什么是PageRank的?

来讨论一下什么是PageRank的。PageRank是谷歌使用排名在其搜索结果网页上的算法之一。这是拉里·佩奇的名字命名的,该公司的联合创始人之一。

PageRank算法,把简单的谷歌,“作品被链接的数量和质量计数到一个页面,以确定该网站是多么重要的粗略估计。”

pagerank-network-example

内部的PageRank?

谷歌的PageRank计算在其索引的每一页,网站内链接各种页面在一起,以及连接其他网站的页面。但背后的PageRank的理念 – 确定根据从其他网页上的链接页面的重要性 – 可以在一个大的网络应用(如一个由谷歌的爬虫发现),或在网络上的一个较小的子集。

对于检查内部链接的目的,将利用的PageRank的想法来看待每一个网页的相对重要性在一个网站上。

通过“内部的PageRank,”我指的不是谷歌的PageRank算法,而是基于单个网站的内部链接类似的计算。让我们开始并计算内部的PageRank为您的网站。

注意:要清楚,我不是在谈论或倡导PageRank的造型。我说的是使用的PageRank类似指标来诊断你的网站架构内的任何问题。当通过一个实例将变得更加清晰。

第1步:用抓取青蛙尖叫

之前,可以计算出实际的PageRank内部,需要抓取网站。在这个例子中,用尖叫青蛙,因为它是在SEO从业者的武器库的标准工具。

通过推出尖叫青蛙和爬行你的网站开始。当爬网完成后,选择  大容量导出 > 所有对外连结  从顶部的菜单,和CSV文件保存到所需的位置。

该CSV包含在网站的所有内部链接的列表。将使用这个列表创建网络和计算内部的PageRank。

screamingfrog-outlinks

第2步:计算内部的PageRank有R

如果你不熟悉– [R ,它是用于统计计算和图形在各种平台上运行一个免费软件,  下载  并安装它,如果你不已经拥有了它。

通过启动R控制台和执行安装的igraph库:

install.packages(“IGRAPH”)

一旦安装了该库,你就可以使用下面的代码与尖叫青蛙爬行你的网站结合:

library("igraph")
# Swap out path to your Screaming Frog All Outlink CSV. For Windows, remember to change backslashes to forward slashes.
links <- read.csv("C:/Documents/screaming-frog-all-outlinks.csv", skip = 1) # CSV Path
# This line of code is optional. It filters out JavaScript, CSS, and Images. Technically you should keep them in there.
links <- subset(links, Type=="HREF") # Optional line. Filter.
links <- subset(links, Follow=="true")
links <- subset(links, select=c(Source,Destination))
g <- graph.data.frame(links)
pr <- page.rank(g, algo = "prpack", vids = V(g), directed = TRUE, damping = 0.85)
values <- data.frame(pr$vector)
values$names <- rownames(values)
row.names(values) <- NULL
values <- values[c(2,1)]
names(values)[1] <- "url"
names(values)[2] <- "pr"
# Swap out 'domain' and 'com' to represent your website address.
values <- values[grepl("https?:\\/\\/(.*\\.)?domain\\.com.*", values$url),] # Domain filter.
# Replace with your desired filename for the output file.
write.csv(values, file = "output-pagerank.csv") # Output file.

只需按照代码中的注释(记),不要忘了:

  1. 指定的路径尖叫青蛙CSV文件。
  2. 指定域和TLD扩展。
  3. 命名输出文件,其中将包含每个网页的PageRank的内部在您的网站。

例子

让我们通过一些实际的网站几个示例运行。

重塑的网站品牌之后,仍在制定一些方案。抓取网站并检查其内部的PageRank。

下面是输出的一个示例:

cd-r-pagerank

看着在内部的PageRank方面的网站页面,可以看到,首页却是联系页面。这看起来是不是不正确的!

无法看到在此基础上典型的网站抓取。例如,尖叫青蛙指出联系人页面实际上有一个环节比主页少,尽管更高的内部PR值。内部的PageRank,像谷歌的PageRank算法,考虑到链接到该网页的网络中的质量,而不仅仅是的链接数量。

cd-inlinks-screamingfrog

现在寻找在谷歌的品牌名称:

catalyst-serp

谷歌搜索结果印证了这个问题的存在,既然我们已经意识到这个问题,我们可以看看我们的网站架构,并开始制定一个解决方案。

斯莱克社区网站分析

让我们运行在一个类似的试验 网络天才,一个网络营销斯莱克社区,并查看是否有出现。

下面是从R中输出的一个示例:

og-internal-pagerank-from-r

该网站有一个页面比主页获得更高的内部PR值。这不是我们因指向主页,是关键字的外部链接的数量引起问题,我们要考虑维护网站的完整性。

结论

现在你应该有如何组织在自己的网站内部链接的一些感觉。已经建立了基于导航的内部链接的基本结构之后,就可以开始使用R.来抓取网站,并计算内部的PageRank来审核网站的内部链接问题.

回复 取消