蝙蝠侠IT
SEO专家:专注SEO十五年,关注网络营销推广与新媒体运营 -> 个人微信号:batmanseo
文章1766 浏览11947678

详解,百度搜索公开课,网站数据生产的细节!

这段时间是真的有点忙,其实每次百度搜索资源平台的公开课程我都想看,但无奈由于课程的时间节点问题,我总是会错过线上直播,而只能看回放,这就缺失了和官方搜索工程师对话的机会。  

虽然,作为一名长期的SEO运营,已经积累丰富的专业知识,有的时候我们可能总是会有一些盲点,多关注百度官方动态,总是会弥补一些知识空缺。  

而本期公开课的内容,我认为是最为值得关注的一期,搜索研发工程师也是非常的靠谱,分享的都是SEO日常运营中经常会遇到的常见问题,这里还是给一个赞,可谓SEO实力干货!  

详解,百度搜索公开课,网站生产数据的细节!

那么,浅析百度官方网站数据生产,有哪些值得关注?  

根据以往SEO营销的经验,蝙蝠侠IT,将通过如下内容阐述:  

1、抓取与展现  

①链接筛选  

②网页筛选  

③索引筛选  

这几点因素本期并没有深入讨论,因为在上期的网站抓取建设已经有大量的内容所关联,我们也是简单的给大家做一下解读:  

对于链接质量筛选:  

我们认为更多的可能从链接形态,链接属性,以及链接关联的价值进行筛选,比如:  

a:大量的列表翻页是否值得爬行,我们认为搜索策略一定是推荐爬行的。  

b:同一链接对应内容,同一链接URL地址,产生大量的动态参数,这种非必要动态参数,一定是不推荐爬行的。  

c:而基于链接所关联的价值,比如:链接类型类似于关于我们这样的页面(about),可能存在低抓取频率的可能,而对于产品页面链接特征(product)等等,往往可能是高频率抓取的对象。  

对于网页质量筛选:  

我们认为搜索引擎会优先通过大量的特征模型进行相关性主题的判断,你的网站是小说,是下载站,是导航网站,是B2B站等等。  

同时,它同样会基于页面的元素、结构、布局、速度、前端样式、视觉体验、内容主题,等多维度衡量页面质量。  

对于索引筛选:  

一般来讲,我们通常认为搜索引擎会基于主题相关性进行判断预估计算,这个页面内容覆盖解决搜索需求能力有多强,而进行基础性质量评估,比如:是进入高质量库,还是低质量库。  

2、数据生产建议  

①链接生产方面  

首页链接:  

1)建议官网认证  

2)避免网站链接内容为空  

解读:在日常运营的过程中,无论是企业新站,还是运营一段周期的站点,基于诸多因素,有的时候,我们总是搜索不到首页相关的品牌词。  

这里百度官方是建议大家先做一个官网认证,而根据我们大量实际数据的运营经验,我们非常明确,官网认证对于新站初期的寻址,以及增加信任度上,都会有积极的辅助作用。  

而企业新站上线,针对网站存在链接内容为空的情况,我们也是不建议的,比如:网站导航中某一个分类链接下面根本没有文章列表,甚至某些页面内容非常短质量不高,这非常影响搜索引擎对于企业新站上线质量的评估。  

备注:由于新站上线,很多企业主经常会选择霸屏策略,这通常在SERP中生成大量的品牌词链接,而自己的新站权重低,就很难展现在搜索结果前端,解决这个问题,也可以尝试利用官网认证。  

站内链接:  

官方强调:避免动态链接,无效链接,无效参数,多参数链接,避免自动化批量生产链接。  

解读:我们在做站内布局的时候,经常习惯的在站内布局大量的链接,从而对站内页面进行有针对性的索引,比如:链轮策略,也可以理解为批量生产链接,实际上,如果你链接关联的内容质量不高,往往更多可能是适得其反。  

同时,值得提醒的就是,对于站内链接而言,有的时候相同内容,我们在不同栏目的展现是多形态的,最为明显的一个问题就是首选域的问题,经常是多个版本,比如:首页domian/,domain/index.html,在不同的栏目中,出现不同的展现形态。  

主域建站:  

1)避免主域名建立多站点  

2)主域名下站点分类清晰,分工明确  

解读:在早期SEO运营,搜索引擎还没有特别从垂直度去审查一个网站的时期,作为站长我们经常会将通过多目录的形式,在主域名下建立多个站点,并且有的是不相关的。  

从目前来讲,搜索引擎并不推荐采用这个策略,而是希望大家在一个垂直领域深度建站某一个行业的相关性内容,而站点下的多目录之间是存在一定关联性,亦或是互补作用。  

同时,我们也建议网站运营者,不要试图通过大量的二级域名去布局分站的内容,而二级域名主体下面,调用大量的主站内容,实际本身并没有大量的内容增量与增益。  

②内容生产方面  

对于内容生产方面,百度搜索团队主要通过如下几个方面进行讲述:  

1)确保首页简洁,内容美观  

2)内容上,聚焦在一个行业  

3)内容清晰,分段合理,便于阅读  

4)注意美观度,丰富度,时鲜性,提升网易整体质量  

5)避免空内容,出现死链接,短而低价值的内容  

6)网页标题与anchor与页面内容相互匹配  

7)TDK标准化,不要堆积和采集  

8)避免采集其他资源,拼凑相关资源  

9)避免使用相同内容,重复性建站  

10)保障页面,查询,消费,购买等,避免消费障碍  

解读:上述相关性内容,蝙蝠侠IT,已经通过大量的内容进行反复的讨论与讲述,我们这里重点挑选一些大家日常经常会忽略的关键点讨论一下:  

其中,我们认为网站内部的anchor也就是我们经常提及的锚文本链接,内链的标注的文字形态,经常会有站长使得文字性内容与目标链接内容,不相关,明明你的文字是A,你只向的链接确是B内容,这是非常不建议采用的策略。  

同时,TDK标题与描述标签中,大量堆积关键词的问题,我们不断在反复强调,但仍然有很多小伙伴,错误的认为,这样的策略可以提高网站排名。  

针对大型网站而言,我们知道由于站点结构的庞大,很多网站都会尝试采用采集与组合拼凑的内容,进行内容组合,这是目前搜索引擎最为不建议的策略,也是网站不收录,没有排名的重要因素。  

对于相同内容,重复建站的问题,这是企业主经常会犯的一个错误,利用大量相同资源,频繁的创建不同的站点,唯一不同的就是,首页的标题布局不同的关键词。  

从SEO的角度来讲,站内元素基本相同,可能很多企业主认为,内容与产品页面我根本不需要排名,我就做首页排名即可,但实际上首页的排名,也是需要整站质量的评估,质量高整体权重才高,首页权重才高。  

最后,对于保障性页面,我们从SEO的角度给一个温馨提示,新站来讲,抓取频率有限,这部分我们应该合理利用nofollow,进行屏蔽。  

③资源导流方面  

1)导流会传递负向特征  

在这里官方主要强调自己的站点,不要给无关低质量的页面导流,甚至是一些非法的页面,试图通过高权重的页面,带动这些页面提升权重。  

解读:从目前来看,老站带新站,这个新站一定需要具备高质量内容,否则基于上述策略,一定是双向影响,其次,很多网站有出售目录的情况,这就是一个非常危险的信号。  

相反,我们就需要思考一个问题:导流低质量页面容易被算法打压,我们导流到高质量的相关性页面,理论上应该提高页面的综合质量评估,而根据我们的实地测试,事实就是如此。  

2)关联导流同样会被打压  

对于关联导流,搜索官方主要是强调,如果你的网站被降权网站刻意关联,那么你的站点,同样会出现被牵连的情况,一个最为重要的事情就是:如果你的友情链接大量出现降权关联站点,你不能够及时处理的话,很容易被关联到。  

解读:建议大家在做外部链接和友情链接交换的时候,一定要选择优质站点,并且是白帽策略建站,以免后期算法识别,降权产生关联作用。  

④资源稳定性方面  

1)做好301和302跳转  

解读:我们认为如果你在运营的过程中,经常会遇到站内调整,比如:旧链接的关键词排名,被整合到新的专题页面,这个时候我们就有必要进行301重定向旧链接。  

2)保证http与https通用的访问性  

解读:这是我们经常会忽略的一个问题,那就是你的网站配置了HTTPS,我们需要确保,Http内容合理的重定向到HTTPS。  

3)IP更新及时到新域名服务器  

解读:如果你的网站服务器迁移到新IP,一定要在百度搜索资源平台做站点IP更新,但值得注意的一个细节是当你的新网站没有完全迁移成功的时候,不要着急第一时间同步这个IP。  

4)尽量避免使用CDN加速  

解读:官方强调尽量不要使用小型的cdn服务,我们认为是正确的,特别是一些CDN服务商,对百度爬虫的友好性相对比较差,这里建议大家选择百度云加速。  

5)建站与网站配套小程序  

解读:目前百度搜索建议大家还是积极的配置百度小程序,我们认为这是正确的选择,不光在流量加权上,搜索会给予较高的倾斜,后期在百度生态整合运营的过程中,小程序也是一个非常重要的环节。  

6)PC与移动端适配机制  

解读:有的时候我们经常会讲我的移动端都收录了,为什么我的PC端没有收录,这里面有一个基础性情况就是PC端与移动端的移动适配没有合理的关联。  

当然也存在一个情况,那就是PC端的样式,更多的是移动端的样式展现。  

7)Robots规范合理性  

解读:我们在做Robots配置的时候,一定要进行验证,是否配置错误,如果文件配置不当,很容易造成重要页面抓取不到的情况,这里建议大家使用百度搜索资源平台的工具进行验证。  

8)定期安检,避免网站被黑,第三方插件错误  

解读:有的时候我们经常会发现莫名其妙的被降权,而没有任何作弊的策略,这个时候建议大家审查一下网站的安全性,看看网站被黑的情况,比如:被动添加黑链等。  

⑤索引维护方面  

1)网站ICP备案  

2)网站死链接内容及时反馈  

3)过期图片及时发现处理并且更新,避免页面大量加载页面。  

4)严禁出售与出租站点部分资源。  

5)强调不要给垃圾网站导流  

解读:在多次百度搜索公开课中,已经反复的提及网站ICP备案的问题,我想这个重要程度,大家还是不言而喻了,如果你的网站长期不收录和排名,我们还是优先看看是不是没有进行合理的备案。  

其次,值得说明的一件事情就是网站站内大量图片调用的问题,如果没有合理的处理,经常是无法加载也是有损用户体验的,同时也要注意调整图片大小。  

最后,这次百度搜索公开课,也反复强调:不要给垃圾网站倒流,亦或是一些违法的站点倒流。  

补充:我们认为基于索引的角度来讲,我们在后期一定是需要维护的,特别是你的落地页内容,是否需要随着动态的搜索需求而改变,调整相应内容,甚至是元素,比如:短视频内容的需求等等。  

3、数据生产误区  

①链接越多越好  

解读:在做外链建设的过程中,并非是链接越多越好,我们老生常谈的话题是更加注重于链接质量,外链页面本身对目标页是否有真实的推荐与解释的意图。  

②内容关键词越多越好  

解读:搜索引擎更在乎是页面解决搜索需求的能力,并非是内容的数量,如果海量内容,没有解决任何问题,其实也是无意义的。  

③导流越多越好  

解读:来自于站外的导流,并非越多越好,特别是低质量的导流,往往会适得其反。  

④收录后不在维护  

解读:网页收录之后,还是一定需要维护的,维护排名,维护页面内容,维护页面的用户体验。  

⑤索引越多流量越高  

解读:如果索引的页面都是没有任何解决搜索需求的原创内容,实际上,也不会带来大量流量的增长。  

4、相关搜索问答  

①为什么原创文章第一天有排名,而第二排名消失?  

答:搜索官方建议大家进行站点质量异常的查询,比如:是否出现流量大幅度下跌等情况。  

解读:我们认为搜索引擎有一个质量评估的过程,如果你更新的内容,存在站内冲突,亦或是页面质量不高,虽然第一天收录,第二天也会出现丢索引的情况。  

②搜索页面全标题,查询不到自己的网站排名?  

解读:通常如果你搜索全标题没有相关结果的情况,可能涉及到页面内容是否采集的问题,该内容更新目录是否降权的情况,页面标题是否具有一定竞争力的问题。  

③新网站正常被抓取,而没有任何收录和排名?  

解读:基于目前搜索现状,新网站我们认为备案是首选,上线之前,内容丰富度是必须,其次页面的模板、布局、结构都是直观影响收录与排名的重要作用。  

④近期,网站收录量异常暴涨暴跌的情况?  

答:官方认为收录量不是最为重要的指标,大家应该关注流量,如果流量异常,可以反馈给官方。  

解读:搜索引擎在每隔一定时间周期,都会有针对性的对算法进行调整,一些排序策略进行调整,甚至可能回档一些基础性数据,有可能会产生索引出现波动的情况。  

⑤网站页面有收录,没有出图是什么原因?  

答:官方建议丰富页面的质量,图片的位置,图片的清晰度,图片的描述标签等等。  

解读:搜索结果出图,通常来讲,需要页面内容本站也具备一定的高质量,同时图片大小合适,位置相对居中,有的时候便可以产生出图的结果,甚至是首页,一般出图的内容,往往是页面正文中的第一张图片。  

总结:本次百度搜索官方课程关于网站生产数据的内容,仍然有诸多细节需要讨论,并且值得关注,而上述内容,仅供参考!

蝙蝠侠IT https://www.batmanit.com/p/1541.html 转载需授权!

最后编辑于:2021/05/29作者: 流量君

蝙蝠侠IT·站长:微信号 batmanseo