现在位置: 首页 > 搜索引擎原理
2013年12月16日 搜索引擎优化 ⁄ 共 1512字 ⁄ 阅读 1,680 次
当用户检索时,搜索引擎需要计算与查询相关的文档并且进行一定排序。而排序需要有算法有数据库,搜索引擎索引系统便为排序算法提供了数据基础。在网页分析阶段,搜索引擎将主题内容等信息提取出来,其后,便是索引系统对这些信息进行数据化、存储等阶段。 搜索引擎索引系统涉及内容很多,如存储内容、存储形式、数据结构、压缩、内存管理、磁盘I/O等,虽然对搜索引擎很重要,但对于SEO而言,了解意义不大。本文仅谈倒排索引的基...
阅读全文
2013年12月16日 搜索引擎优化 ⁄ 共 4298字 ⁄ 阅读 2,300 次
搜索引擎在抓取到网页之后,需要对网页内容数据进行一定分析处理,以便于建立索引(即收录)、响应用户检索及排序等。 简单来讲,搜索引擎分析系统主要确定两项内容:网页主题及网页重要性。 一、网页主题 确定网页主题通俗来讲就是要确定网页主要内容,即“文档在讲什么”。 要知道文档在讲什么,我们要知道哪些内容是跟文档主题相关的,内容由哪些词组成,文档是否已分析过,哪些内容是文档里重要的,文档内容属于什么类别(如...
阅读全文
2013年09月12日 搜索引擎优化 ⁄ 共 3627字 ⁄ 阅读 7,785 次
作者:笨鸟  原载于:ITSEO 了解搜索引擎抓取网页过程有助于理清SEO工作方向,本文中笨鸟将结合网络、图书等资源及个人理解来探讨搜索引擎抓取过程及对SEO的指导意义。 首先,看一下搜索引擎抓取的简要过程,如图: 上图简要的描绘了SE抓取过程原理,虽然在分布式信息采集中需要爬虫之间有通信,但针对单一爬虫大概过程便如图所示,下面针对每个步骤做解析: 1、总链接库 总链接库存放着爬虫曾经爬取过的URL及时刻新增的URL,...
阅读全文