搜索引擎抓取页面后面大量字符串怎么办？

周星星 2021-05-04 22:29:30 SEO资讯 1343 views

在做SEO的过程中，你是否偶尔会遇到这样的情况：

当你在检索自己品牌词的时候，你经常会发现首页的搜索结果有多个，打开网址之后，你会发现：

很多页面都是首页加了大量的字符串，比如：

① index.html?id12345.html

② index.html#id34532.html

甚至一些相对比较长的数据字符串，这给我们网站目标页面“确权”造成一定影响。

导致搜索引擎不能精准定位品牌词到底在哪个目标页面。

搜索引擎抓取页面后面大量字符串怎么办？

其实，解决这个问题，非常简单：

你只需要在网站根目录中，增加robots.txt，然后在该文件下进行限制，比如：

Disallow:/*?*

Disallow:/*#*

但这里需要有一个细节值得注意，屏蔽了#号，可能会导致谷歌不能抓取相关性页面，如果你的网站部分流量来自于谷歌，我们建议需要多加选择与思考，并且在站长管理中心监测。

一般在国内，我们都是建议禁止让百度爬虫去抓取相关性上述特征链接。

为此，如果你有网站全新上线，我们认为你可能需要：

①思考，针对搜索引擎友好，你应该关注哪些细节性的问题。

②合理的确保首选域唯一性。

③善用robots文件，引导搜索引擎抓取与爬行，限定哪些页面暂时不需要抓取，节省抓取频率。

④时刻关注搜索引擎最新动态，了解与掌握最新算法更新策略。

⑤专注细节，参考竞争对手的策略，看看已经成形的网站都配置哪些元素。

总结：搜索引擎抓取页面后面大量字符串怎么办，上述内容，仅供参考，诸多细节仍然需要进一步讨论。

蝙蝠侠IT https://www.batmanit.com/h/2081.html 转载需授权！

相关推荐