搜索引擎优化
做seo是为了尽量减少搜索引擎的工作量、降低搜索引擎的工作难度,使其能更轻松、快速的收录网站页面,更准确的提取页面内容。搜索引擎指的是由蜘蛛程序沿着链接爬行和抓取的大量页面,存进数据库,经过处理,用户在搜索框输入关键词后,搜索引擎排序程序从数据库中挑选出符合搜索关键词要求的页面。搜索结果中包含页面标题(来自HTML代码中的标题标签title),页面说明(来自HTML中的说明标签description)
- 缩进列表,当排行靠前的来自同一个网站的不同页面,搜索结果会把两个结果连在一起排在高位那个页面附近,并把第二个页面向右缩进三个字的空间。
- 全站链接,对于一些权重高的网站,除了正常的结果列表外,还会显示最多四行、两列共8个内页链接,称为全站链接。如果是一行4个链接则为迷你全站链接。
- One-box,直接在搜索结果页面上显示相关信息,不用点击到其他网站上查看的结果。
- 富摘要某些使用了RDFa或Microdata格式标签的页面,搜索引擎可能还会在标题下面以灰色文字加一行富摘要。
- 说明文字中的链接对于一部分使用了页面内锚链接的页面,搜索引擎有时会尝试在说明文字中显示链接,用户可以跳到页面内锚链接部分。
工作原理
爬行和抓取是蜘蛛通过跟踪链接访问网页,获取页面HTML代码存入数据库。预处理是对抓取的数据进行文字提取、中文分词等。排名是根据用户输入关键词后排名程序调用索引数据库计算相关性,然后生成索引结果页面