蝙蝠侠IT
SEO站长新闻,专注于打造中国站长资源平台,用于站长之间相互交流与学习!
文章3107 浏览5111460

如何制定网站海量数据的抓取策略?

我们知道做SEO网站推广的基础是网站有排名,而有网站搜索排名的基础就是页面被有效抓取,对于常规网站来说,页面被抓取只要提交给百度即可,而一些大型网站的页面数量是海量的,最高提交配额也根本不够。

如何制定网站海量数据的抓取策略?

那么,如何制定网站海量数据的抓取策略?  

根据以往做SEO攻略的经验,我们认为:  

1.主动提交  

针对促进网站页面被有效抓取的策略,我们认为,不论哪种策略都不如直接提交给搜索引擎来得直接,但问题是我们的配额不足,我们认为可以通过以下方法来实现主动提交:  

①多账号提交  

如果一个网站的数据量达到海量的程度,相信网站管理也不止几个人,我们认为可以让每一管理人员都注册一个账号,绑定自己管理的板块,这样就可以通过多账户来解决提交数量的限制。  

②有策略提交  

也可以利用搜索引擎不同的提交方式来提交url,常规网站提交配额比较大的主要有api提交与sitemap提交,我们可以将网站的不同url分别以不同的渠道提交,因为提交了也不一定就会收录,只是我们提交会减少页面不被抓取的可能,所以这种方式可以解决大部分网站的提交问题。  

③选择提交  

还可以有选择的提交,因为海量数据,并不一定都是重要的页面,就算都很重要,也有不同的重要程度,比如稀缺性内容、流量高页面、时间属性强页面等等,如果现在网站对收录的需求更大那么,稀缺性、时间属性强的页面应该先提交,如果需要提升流量,那么,流量高,关键词指数高的页面应该先提交,指定一个提交计划,有选择的进行提交。  

2.站内引导  

当然,一般情况大型网站本身不缺蜘蛛,只需要有效引导,大部分页面都可以被有效抓取:  

①相关调用  

网站中最多的页面是内容页面,这些页面不仅仅包括内容主体,还可以包括各种相关调用板块,我们可以对相关调用进行设计,让每一个页面的相关调用都产生变化,或者针对新页面进行推荐,让新页面有更多的展示机会,也就增加了被抓取的概率。  

②网站结构  

而更好的站内引导策略是依靠网站结构设计的天然优势,很多大型网站结构混乱,url层次深,不利于抓取,其实最利于抓取的网站结构是扁平化结构,但页面数量多不利于用户体验,所以综合来看,还是金字塔结构最合理。  

大型网站只设置一个金字塔结构,站内内容展现并不利于抓取,建议可以分别以不同分类来建立金字塔结构,组成多个金字塔为一体的网站结构来提高页面被抓取的概率。  

3.关注事项  

①服务器带宽  

通常提交的内容越多,网站蜘蛛就会越多,这就会导致网站服务器容易出现问题。  

具体数据不好计算,可以根据服务器的带宽数据承载量来协调网站带宽的升级工作,有很多网站因为蜘蛛抓取量大而导致服务器崩溃,其实这样的损失更大,不论是对SEO还是用户体验。  

②作弊提交  

还有不要做一些作弊提交,一些方法可能会有效,但网站同样也存在一定风险,既然是做大型网站SEO,付出的成本肯定很高,将高成本置于高风险中是很不明智的选择。  

总结:如何制定网站海量数据抓取策略的问题,我们就讨论到这里,以上内容,仅供参考。

蝙蝠侠IT https://www.batmanit.com/h/2994.html 转载需授权!