首页 > 搜索算法 > 360算法 > 正文

[2014/5/30/] 360搜索ICO算法--清理低质重复内容

作者: admin     来源: 红尘画舫     发布时间: 2019-11-20 15:15:23    浏览人数:
摘要ICO算法是360搜索上线以来向站长公布的第一个算法,发布于2014年5月30日。360搜索ICO算法的目的是清理内容重复的页面,以及清理已经入索引库的低质量URL和无效URL数据,目的是去掉对用户没有价值的内容页面,提升用户体验度
ICO算法是360搜索上线以来向站长公布的第一个算法,发布于2014年5月30日。360搜索ICO算法的目的是清理内容重复的页面,以及清理已经入索引库的低质量URL和无效URL数据,目的是去掉对用户没有价值的内容页面,提升用户体验度。
360搜索ICO算法
360搜索ICO算法简介

360搜索ICO算法中的ICO全称:Index clear optimize,ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。

算法公布规范:一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。

处理网页特点:

该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。

例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。
很赞哦! ()