什么是抓取预算,它对 Google 有多重要以及如何改进它?

爬虫(也常被称为机器人或蜘蛛)是一种软件,负责以自动且持续的方式爬行和探索所有网站及其不同的 URL 。

所有搜索引擎(或互联网搜索引擎)都有这些跟踪器。他们上网冲浪并分析他们在途中发现的不同网站,以创建一个数据库,其中包含收集到的有关他们的最大数量的信息。

抓取预算呢?我们所有在互联网上工作的人,尤其是那些与 SEO 领域相关的人,肯定已经不止一次地听过或读过一些提到这个术语的短语。但我们真的知道这意味着什么吗?

是我们所说的“爬行预算”。并且,抓取预算是Google分配给网站抓取其URL及其中存在的内容的频率和时间段。

反过来,这在 SEO 中意味着,根据预算,Google Bot 将花费或多或少的时间对我们网站上的不同 URL 进行抓取和索引。权威性、加载速度、出版物频率和网站年龄等因素对预算有重要影响。

但是,也许现在,您想知道:这对我真的很重要吗?

尽管起初我们认为我们网站上的抓取预算较高或较低并不那么相关,但我们应该知道,当我们谈论或多或少开始具有更大范围的任何项目时,这是至关重要的。

现在我们来看看为什么。

为什么你应该有一个良好的跟踪预算?
让我们从一个网站的例子开始,Google 为其抓取分配了 X 时间预算。机器人将遍历它,开始抓取它,浏览它的 URL 等。并且,一旦本次抓取预算的预计时间结束,机器人将离开该网站。

但是,问题的关键在于:如果您分配的时 2024 年更新的手机号码数据 间很短,Google Bot 很可能会在处理完该网站上输入的所有内容(旧的或新的)之前退出该网站。网站。入索引的内容会继续生成,但如果项目规模增大,这样做会让 Google 更难找到它。这意味着较低的抓取预算会增加与搜索引擎不可见的网络某些区域的距离。

2024 年更新的手机号码数据

如果Google 需要很长时间来抓取和识别您

的内容,当竞争对手在您之前复制它并对其建立索引时,Google 本身将确定他们的内容是原创的。这将导致副本或副本被分配给您,并可能带来潜在的处罚。
4° 我们可能遇到的另一个大问题是,Google 需要很长时间才能采取我们在SEO On Page级别所做的任何类型的更改,这反过来又延迟了反映每个更改结果的时间。我们在网站上做什么。
通过这些示例,您可以清楚地看到当我们的预算或抓取预算较低时我们面临的一些缺点。

利用抓取预算有何重要性?
拥有良好的抓取预算不仅很重要,而且知道如何充分利用它也很重要。

事实是,无论谷歌分配给我们多少跟踪时间,如果我们不利用它,它对我们几乎没有用处。

我这是什么意思?
首先,我们应该对我们的网站进行很好的优化,以充分利用我们的预算的 100%,这样机器人就不会迷失在抓取我们内容的方式中。

我们稍后将与我的朋友David Ayala一起讨论如何利用和改进此抓取预算。

他将告诉我们有关如何改进网站或电

抓取预算的大幅改进将对页面和内 AppMaster 六月更新 容的索引速度产生几乎直接的影响。

现在,要做到这一点,您需要更好地了解 GoogleBot 的行为。

另一方面,有时,仅仅因为您被搜索引擎抓取的频率较高,您并不会更快地建立索引并更好地定位您的网站。但是,在我们继续讨论这个问题之前,我们需要更好地了解 Google Bot 在我们网站上的行为方式。

Google 在我们的网站上的行为如何?
要了解 Google 更重视哪些领域以及 Google 在我们网站上的行为,非常重要的一点是查看日志。

日志存储在我们自己的服务器上,我们可以直接访问它们以查看 Google Bot 正在进行哪些访问以及它在任何给定时间正在访问哪些区域。

当然:我们必须承认,执行此检查可能有点乏味,但幸运的是,有像Screaming Frog Log File Analyzer 这样的程序可以使该过程变得更加容易。

尖叫青蛙日志分析器 – 抓取预算

这可能会成为一个问题,因为许多人倾向于生 ADB 目录  成大量实际上没有用的内容,或者在生活中不会排名的内容,因为他们认为大量的内容占据了位置,而实际上它可能会产生相反的效果。

如果您让Google Bot在许多您不感兴趣的网址上浪费时间,它就不会抓取您真正想要定位的网址,因此您将在无意义的页面上浪费您的抓取预算。

因此,如果您有一个中/大型网站,最好首先问自己哪些内容值得保留,哪些内容应该删除。

同样,其他类型的内容,例如由分页、参数等生成的内容,只会浪费 Google Bot 的时间。

删除不需要且无法删除的内容,只需使用 robots noindex nofollow 标签并使用 robots.txt 文件阻止它们即可。

对于容易被蚕食的内容

即那些在您自己的网站内竞争相同关键字的内容,也会发生同样的情况。

在极少数情况下,自己的一组内容可能会被定位在类似术语的顶部位置,从而成为不必要的跟踪费用。

在这种情况下,不要消除竞争内容,而应仅选择定位最佳的版本,并对其他版本进行 301 重定向。

优化加载速度
优化加载速度 – 抓取预算

如果您的网站需要很长时间才能加载,Google Bot 抓取您网站内部页面的时间就会减少,因此,它会浪费更多的等待时间而不是抓取时间。

 

滚动至顶部