蝙蝠侠IT
SEO站长新闻,专注于打造中国站长资源平台,用于站长之间相互交流与学习!
文章3107 浏览4026197

搜索引擎抓取页面后面大量字符串怎么办?

在做SEO的过程中,你是否偶尔会遇到这样的情况:  

当你在检索自己品牌词的时候,你经常会发现首页的搜索结果有多个,打开网址之后,你会发现:  

很多页面都是首页加了大量的字符串,比如:  

① index.html?id12345.html  

② index.html#id34532.html  

甚至一些相对比较长的数据字符串,这给我们网站目标页面“确权”造成一定影响。  

导致搜索引擎不能精准定位品牌词到底在哪个目标页面。  

搜索引擎抓取页面后面大量字符串怎么办?

其实,解决这个问题,非常简单:  

你只需要在网站根目录中,增加robots.txt,然后在该文件下进行限制,比如:  

Disallow:/*?*  

Disallow:/*#*  

但这里需要有一个细节值得注意,屏蔽了#号,可能会导致谷歌不能抓取相关性页面,如果你的网站部分流量来自于谷歌,我们建议需要多加选择与思考,并且在站长管理中心监测。  

一般在国内,我们都是建议禁止让百度爬虫去抓取相关性上述特征链接。  

为此,如果你有网站全新上线,我们认为你可能需要:  

①思考,针对搜索引擎友好,你应该关注哪些细节性的问题。  

②合理的确保首选域唯一性。  

③善用robots文件,引导搜索引擎抓取与爬行,限定哪些页面暂时不需要抓取,节省抓取频率。  

④时刻关注搜索引擎最新动态,了解与掌握最新算法更新策略。  

⑤专注细节,参考竞争对手的策略,看看已经成形的网站都配置哪些元素。  

总结:搜索引擎抓取页面后面大量字符串怎么办,上述内容,仅供参考,诸多细节仍然需要进一步讨论。

蝙蝠侠IT https://www.batmanit.com/h/2081.html 转载需授权!