欢迎来到丰采网

山东晟利谈论百度平台新上线反作弊算法--劲风算法

来源:丰采网  作者:丰采网   2020-07-02 阅读:1043

针对恶劣聚合页,主要分为四种类型:


1、站点内容跨领域或过于分散


这个指的是网站中包含了太多领域的词汇。例如你既要做游戏、又搞教育,还参与了加盟,甚至有电影。不仅搜索引擎无法识别你网站自身的专注领域,

用户访问你站点的聚合页后,得到的体验也是极差的。


这种网站一般都是通过采集拼凑的内容。而这种网站也基本可以理解为是完全基于流量目的的流量站。只能是站长单方面获得了流量,但对用户、对搜索引擎都是伤害的。


2、标题与内容不相符


这里所说的标题,更多的可以理解为是我们聚合页面的关键词,例如这个聚合页你部署的关键词是SEO培训,而里面调取的内容有介绍游戏的、

介绍电影的等与关键词本身不相关的内容。这样即便搜索用户进入到你这个聚合页,还是不能很好的解决用户需求!


3、利用站内搜索生成的聚合页


利用站内搜索功能,批量生成静态页面,这种操作是批量生成聚合页的惯用手法。多为大内容量较大的网站盛行。


SEO通过大量的关键词整理,然后技术人员以这些词为站内的搜索词,将返回的搜索结果批量生成另一种模板的页面。称之为利用站内搜索做聚合页最典型的方式。


这种页面生成的技术含量最难点在于自身搜索引擎的技术能力。而很多网站又没有专业的搜索引擎团队,即便生成出来的内容,相关性差、页面可读性低。

同样是劲风算法打击的对象。


4、内容为空,或较少,以及失效的聚合页


批量生成的聚合页,以SEO为首,单纯以获取流量为目的的页面。大多都会存在聚合页内,调取的内容过少,甚至为空的现象。


这种类型的页面可想而知,毫无用户体验可言。所以劲风算法对其进行惩罚也是早晚的事情!




劲风算法惩罚的目的


劲风算法,主要惩罚的对象是针对恶劣的聚合页。


不管是网站还是百度智能小程序,都在劲风的惩罚范围内。而基于这个算法的面世,其主要问题是行业内,存在很多单纯以获得流量为目的,

不管用户搜索需求满足度以及搜索体验的聚合页。百度为了保障搜索用户在使用搜索引擎时的整体体验,同时保证搜索排序的公平公正性。上线了劲风算法。

就是为了惩罚创造这一类聚合的网站。


他的周期是多久呢?


针对命中劲风算法之后,并不是说这个网站就从此废掉了。只要改过自新、百度还是会给机会让网站重新获得百度的信任的。


而劲风算法的惩罚周期官方并没有具体公布,但通过以往算法惩罚后的经验推断。一般在3~6个月左右。具体的要视情况而定!


命中劲风算法后,如何进行整改恢复呢?



那,命中劲风算法之后,我们就等着恢复吗?如果不对网站进行整改是基本不可能恢复的。所以恢复的前提是你已经改过自新了!而针对整改我给出如下建议:


从大原则上,来看劲风算法惩罚的问题


前提要明确,聚合页还是可以做的,只不过针对不能满足搜索用户需求,单纯以获取自然搜索来源流量为目的的,是不能再做了。你也不要报着上有对策、

下有政策的心态,想办法去规避被惩罚。即便这一次你没有命中,那么按照百度的惯例,还会有下一次的劲风算法2.0等着你。


具体的一些整改措施


1、针对网站领域过于分散的:


建议确定好一个主要的领域,且将其他领域的内容robots掉,屏蔽搜索引擎抓取,且不再参与搜索引擎排名;


更完美的方式是对其他领域的内容进行删除,并将删除的内容URL在百度搜索资源平台提交404,确保网站无恙。


2、针对题文不相符的:


如果你有精力与资源,可以对应每一个聚合页的主题进行审查,确保聚合页下内容都是针对当前聚合页主题所延展的相关内容。


从技术角度看,建议通过内容相似度计算的方式将网页内的主体文本进行提取计算。得出当前聚合页的主题与内容的相似度得分。


并通过实际观察,确保相似度得分在哪个值上,是可以解决搜索用户需求的。


例如通过观察,我认为相似度得分达到62%(便于理解的假设值)的,基本都是相关页面,那么针对低于62%的暂时就别在前端页面进行展示了,

如果这类URL被访问到建议设置404,并提交百度搜索资源平台!


3、针对利用搜索批量生成的:


利用站内搜索批量生成的内容,其最关键的问题在于其内容无法满足用户需求。毕竟你的搜索引擎技术无法与百度相比。这里给出的建议是:


1.招聘精通搜索引擎的技术人员,针对搜索调取的内容相关进行大幅度提升。从而提升用户的体验度。

2.利用第3点提到的相似度判断方式,让编辑协助完成低于62%的聚合页的内容撰写工作。以此不断提升满足62%的内容量。

3.技术能力达不到的,可以通过其他办法进行尝试,但最终还是无法确保满足用户需求的,建议删除或者robots操作。

4、针对内容为空或过于少,甚至无效的:


内容为空,甚至过少。在你站点内容资源很丰富没得到更多调取到聚合页的情况时,可以采取以下方式:


将更多品类的内容进行搜索整理,从而提升聚合页下内容整体的丰富度,前期要保证相关性。例如我这个聚合页是围绕爬虫抓取策略展开的,

那么其调取的内容都应该基于爬虫抓取的策略,不能剑走偏锋,适得其反!


其次,也可以给予你的聚合页关键词进行分类。例如爬虫抓取、爬虫算法、搜索引擎爬虫、baiduspider,我们认为是一类聚合页。当内容为空或少于X条时,

我们可以通过扩展调取的维度进行补全。


从技术需求的实现角度可以为:如果当前聚合页下调取内容为0或不足X条时,那么调取当前聚合页所属关键词同类别的其他内容,补全X条。


这样一来,通过扩大调取的品类,以及给关键词做分类形成补全规则问题就能很少的得到解决!


但如果你的内容资源信息很少,那么建议设定的逻辑为:当内容低于X条,甚至为空时,当前页面返回404。另外,由于我们这些做了404的页面已经被收录或者爬虫抓取了,

建议再提交百度搜索资源平台的死链提交工具,进行完备。确保不会让搜索引擎认为你网站存在大量的死链接!


免责声明:
本站部份内容系网友自发上传与转载,不代表本网赞同其观点;
如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!