搜索引擎系统之透析搜索引擎分析处理系统,搜索引擎分析处理系统是搜索引擎系统中第二个系统,给大家介绍搜索引擎的收录原理,能够明白搜索引擎的分词原理以及对不同分词的价值计算原理;进一步明白搜索引擎对网页内容的质量判断的标准,从而能够做出更高质量的原创内容,获得更好的排名;
搜索引擎分析处理系统工作工程
1、搜索引擎首先抓取接受网页的数据;
2、分析网站的内容,去除无价值的内容,比如每篇页面都出现的链接、关键词等的,比如顶部导航栏;
3、判断是否符合收录的标准,不符合,删除,符合的话进入分词处理系统,对标题、h1、h2、strong、链接锚文本词等做分词处理;
4、计算分词的权重,根据搜索引擎的算法可以计算出每个关键词的权重;
5、判断网页的总价值,做出关键词排名;
6、交给数据库系统做排序和管理。