搜索引擎接收到用户输入的搜索词后,需要对搜索词做一些处理,才能进入排名过程。

搜索词处理包括以下几方面:

(1)中文分词。与页面索引时一样,搜索词也必须进行中文分词,将查询字符串转换为以词为基础的关键词组合。分词原理与页面分词相同。

(2)指令的处置。平时咱们在搜索时会输入多个词语,实在默认的情况下,搜索引擎把多个默认的词语都依照“与”来进行词语。比方你搜索“seo”“培训”时,搜索引擎会默认咱们输入的“seo培训”来进行处置,独自包括“seo”或者“培训”的网站内容实践上将不会返回,但实际情况往往也会呈现独自包括一个词语的网站。另外,还要处置各种高等搜索指令的词语,比方加号减号等。

(3)停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限度地提高排名相关性及效率。

(4)过错纠正。用户如果输入了明显错误的字或英文单词拼错,搜索引擎会提示用户正确的用字或拼法。

(5)整合搜索触发。某些搜索词会触发整合搜索,比如明星姓名就经常触发图片和视频内容,当前的热门话题又容易触发资讯内容。