搜索引擎的蜘蛛是如何爬的?

clsrich 搜索引擎算法 2019-01-06 19:59:03 2463 0 搜索引擎的工作原理

搜索引擎的蜘蛛是如何爬的?

搜索引擎的工作过程大体可以分成三个阶段：

(1)爬行和抓取：搜索引擎蜘蛛通过跟踪链接发现和访问页面，读取页面HTML代码，存到数据库。

(2)预处理：索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理，以备排名程序调用。

(3)排名：用户输入查询词(关键词)后，排名程序调用索引数据，计算相关性，然后按一定格式生成搜索结果页面。

搜索引擎的工作原理.jpg

搜索引擎的工作原理

爬行和抓取是搜索引擎工作的步，完成数据收集的任务。搜索引擎用来抓取页面的程序被称为蜘蛛(spider)

一个合格的SEOer，要想让自己的更多页面被收录，就要想法设法吸引蜘蛛来抓取。

蜘蛛抓取页面有几方面因素：

(1)网站和页面的权重，质量高、时间长的网站一般被认为权重比较高，爬行深度也会比较高，被收录的页面也会更多。

(2)页面的更新频率，蜘蛛每次爬行都会把页面数据储存起来，如果第二次，第三次的抓取和次的一样，说明没有更新，久而久之，蜘蛛也就没有必要经常抓取你的页面啦。如果内容经常更新，蜘蛛就会频繁访问页面，来抓取新的页面。

(3)导入链接，不管是内部链接还是外部链接，要想被蜘蛛抓取，就必须有导入链接进入页面，否则蜘蛛就不会知道页面的存在。

(4)与首页的点击距离，一般网站上权重高的是首页，大部分外部链接都会指向首页，那么蜘蛛访问频繁的页面就是首页，离首页点击距离越近，页面权重越高，被爬行的机会越大。

u1350512.jpg

吸引百度蜘蛛

如何吸引蜘蛛来抓取我们的页面?

坚持有频率的更新网站内容，好是高质量的原创内容。

主动向搜索引擎提供我们的新页面，让蜘蛛更快的发现，如百度的链接提交、抓取诊断等。

搭建外部链接，可以和相关的网站做友情链接交换，可以去别的平台发布高质量的文章指向自己的页面，内容要相关。

制作网站地图，每个网站都应该有一个sitemap，网站所有的页面都在sitemap中，方便蜘蛛抓取。XbF30tN

版权声明

本文仅代表作者观点，不代表本站立场。
发布的有些文章部分内容来源于互联网。如有侵权，请联系我们，我们会尽快删除。

本文链接：https://www.shseotuiguang.com/post/117.html

上一篇： coolmax，过滤袋，阻燃面料，苏州网站推广,百度优化排名
下一篇：为什么有些站点不设置关键词排名却很好？

发表评论

评论列表（0人评论 , 2463人围观）

☹还没有评论，来说两句吧...

选关键词

URL优化

代码优化

网页结构

经验之谈

内链外链

优化误区

英文优化

搜索算法

百度AD

谷歌AD

黑帽灰帽

百度PC端

百度手机端

搜狗PC端

搜狗手机端

360搜索

神马搜索

好书推荐

好站推荐

视频学习

优化工具

谷歌优化

生意经

搜索引擎的蜘蛛是如何爬的?

版权声明

相关文章

发表评论

网站分类

最近发表

标签列表

统计代码 | 蜀ICP备18039239号

Powered By 城南二哥