网站爬行第1天从哪里开始
网站爬行,第1天:你从哪里开始?
技术先进的搜索引擎优化SEO
当你面对成千上万的技术SEO问题时,知道从哪里着手是至关重要的。深圳网站制作的新网站上爬行的动力,我引导你通过隔离的关键问题迅速处理。
当你面对一个大型网站可能存在的成千上万个潜在问题时,你从哪里开始?这是我们重建站点爬行时要解决的问题。答案几乎完全取决于你的站点,并且需要对它的历史和目标有深刻的了解,但是我想概述一个可以帮助你减少噪音并开始的过程。
简单化可能是危险的。
以前,我们要试图标签每个问题为高,中,或低优先级。这种简单化的方法可能会吸引人,甚至令人欣慰,你可能会想知道我们为什么要离开它。这是一个非常有意识的决定,它归结为几个问题。
首先,优先次序很大程度上取决于你的意图。曲解你的意图会导致糟糕的建议,从迷惑到彻底的灾难性的范围。让我们说,例如,我们雇用了一个全新的SEO在莫桑比克他们看见下面的问题数弹出:
几乎35000 noindex标签吗?那孩子们呢?!!
如果新的搜索引擎优化然后匆忙删除这些标签,他们会做很多的损害,而不是意识到,绝大多数的指示是故意的。我们可以使我们的系统更聪明,但他们不能理解你的想法,所以我们要小心误报。
第二,对敲问题的优先级不帮助你理解的性质,这些问题或者如何去改正。我们现在将站点爬行问题分类为五种描述性类型中的一种:
临界爬行问题
履带式的警告
重定向问题
元数据问题
内容的问题
按类型分类使你更具战术性。例如,我们新的“重定向”类别中的问题将有更多的共同点,这意味着它们可能有共同的修复。最终,帮助你发现
1。从关键爬虫问题开始
这并不是说一切都是主观的。一些问题阻碍爬虫(不只是我们的,但搜索引擎)到您的网页在所有。我们已经将这些“关键履带问题”进入我们的第一类,和他们目前包括5xx 4xx错误,错误,和重定向到4xx。如果你在错误的5xx突然上升,你要知道,几乎没有人故意重定向到一个404。
您将看到整个站点爬行界面中突出显示的关键爬虫问题:
寻找红色警报图标快速发现关键问题。首先解决这些问题。如果一个页面不能被抓取,那么其他爬虫类问题都是没有实际意义的。
2。平衡问题与流行
当涉及到解决您的技术SEO问题,我们也必须平衡严重性与数量。知道什么您的网站,我会说404的误差可能是值得解决之前重复的内容-但如果你有十一404s和17843重复的网页?你的优先事项突然变得非常不同。
在工地爬回家的底部,查看“MOZ建议修复”:
我们已经为你们做了一些数学运算,以问题的普遍性来衡量紧迫性。这确实需要一些关于优先级的假设,但是如果你的时间有限,我们希望它至少能给你一个快速的切入点来解决几个关键问题。
3.解决多页面问题
处理高计数问题还有另一个好处。在很多情况下,你可以用一个固定的方法来解决成百上千页的问题。这是一个更战术的方法可以节省你很多时间和金钱。
让我们说,例如,我想挖到我的916页MOZ.com失踪的meta描述。我立即注意到,这些页面中有些是博客帖子类别。所以,我通过URL过滤:
我可以很快看到,这些页面占了我丢失的描述的392——其中的43%。如果我关心这个问题,那么我很可能用一个相当简单的CMS页面来解决它,用几行代码来消除几百个问题。
在不久的将来,我们希望为您做一些分析,但是如果过滤不起作用,您也可以将任何问题列表导出到CSV。然后,旋转和过滤你的心的内容。
4。用深度和爬行深度潜入页面
如果你不容易发现清晰的模式,或者如果你已经解决了一些大问题,接下来呢?如果你知道这些URL是重要的,那么一次只解决一个URL上的成千上万个问题是值得的。
幸运的是,现在可以用Page Authority(PA)排序和站点爬行中的爬行深度排序。PA是我们自己的排序能力的内部度量(主要是由链接资产驱动),而爬行深度是页面与主页的距离:
在这里,我可以看到,在我们的mozbar网址有一个重定向链,这是一个很高的权威页面。这可能是一个值得修复的问题,即使它不是一个明显的更大的群体的一部分。
5。注意新问题中的尖峰
最后,随着时间的推移,你也要对新问题保持警惕,特别是当它们出现时。这可能预示着突然的、潜在的破坏性变化。站点爬行现在可以轻松跟踪新问题,包括警报图标、图表,以及按类别快速总结新问题:
任何抓取都会发现一些新页面(内容机器从不休息),但是如果你突然看到一个单一类型的数百个新问题,重要的是快速挖掘并确保没有错误。在一个完美的世界里,SEO团队总是知道其他人和团队对网站做出了什么改变,但我们都知道这不是一个完美的世界。