Google蜘蛛抓取和索引网页的频率
By: 全球搜 2018年11月19日

Google蜘蛛抓取和索引网页的频率

在一次网站管理员的视频环聊中,一位网站管理员提到,如果在一个网页中添加了noindex nofollow命令,那么Google从索引中删除该网页的速度有多快。

(注释:我们在SEO过程中可能会不希望搜索引擎收录某个页面和抓取链接,noindex和nofollow两个标签就可以解决此问题。 noindex:禁止收录该页 nofollow:禁止抓取该页链接)

该管理员说他们添加了noindex nofollow命令后,但页面仍然出现在谷歌的索引中。Google的John Mueller回答了这一问题,谈话中他提到了一些网页被编入索引的频率。

John Mueller透露,URL是以不同的速率被谷歌蜘蛛抓取。这一点大家多多少少都有一定了解。令人感兴趣的是,他说一些网址可能每六个月才被谷歌抓取一次。

1

网站管理者说:“我们一个网页设置了noindex nofollow,但几个月之后我们仍然可以在谷歌索引中看到它。”

John Mueller这样回答到:

“我认为这里的问题在于谷歌不会始终以相同的频率抓取所有的网址。谷歌会每天抓取一些网址,但有些网址可能每周抓取一次,还有一些网址每隔几个月抓取一次,有的甚至可能半年左右才抓取一次。之所以这样做是为了避免服务器过载。

此外,如果你在网站上进行了重大更改,那么可能大部分更改很快就会被发现,但一般是会有遗留一些更改未被及时发现。

因此,特别当你执行网站查询等操作时,很有可能会看到那些每半年才被抓取一次的网址。几个月了,他们还是老样子。

这是谷歌重新处理、抓取网页的正常时间。因此,这并不一定表明某些事情在技术上有漏洞。如果你仍然认为这些网址根本不应该被编入索引,或许你可以给谷歌提交一个最后修改过站点地图的文件,以便Google能够以其他方式加快检索的速度。”

 

通过Site Map触发蜘蛛进行新的爬行和抓取

John Mueller建议更新站点地图,让Googlebot发现最近修改日期并将给予提示,以便移除旧网页、触发新的抓取。

Google URL检查工具

使用谷歌的URL检查工具,这一点John Mueller没有提到。通过Google站长工具重新提交索引,提交过程可能需要一到两周的时间。URL检查工具适用于需要重新抓取的个别网址,如果有大量网页,Google建议改为提交站点地图。

 

(编译 /全球搜 Jason)

 

三角22

关注我们

播放
全球搜视频