在互联网技术高速发展的时代,搜索引擎(search engines)作为用户到达率最高的互联网服务出现在人们面前。然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。因此,对于SEO(Search Engine Optimization)的研究显得更为重要。
1.影响网站搜索排名的因素
1.1 页面重要性:PageRank(PR)值会将网站的外部链接数考虑进去,因此,我们可以这样说:一个网站的外部链接数越多、外部链接站点的级别越高其PR值就越高,PageRank值的打分还考虑外部联接的质量,网站的PR值可以通过相关工具来进行检测。
1.2 关键字密度:除了PR值的影响以外,影响最大的是关键字密度。很容易理解,你页面涉及的某个关键字的密度越高,Google认为你的页面跟某个关键字的关系越大。不考虑作弊方式增加关键字密度的原则:适当重复关键字,降低页面的长度,从而提高页面整体关键字密度。
1.3 明确的网页主题:
- 网页的命名:赋予包含有关键词的网页文件名。
- 网页的标题:搜索引擎单页优化时,是用标题来判断一个网页的主题内容。
- h1标签的应用:搜索引擎通过查找和中的文字来确定网页的主要内容。
- 文件时间:随着时间的推移页面在搜索引擎的排名会越来越低,所以可根据搜索引擎蜘蛛程序的访问频率保持文件名相同的前提下进行适当的全部重新发布。
1.4 原创性内容:网站内容要与众不同,搜索引擎特别喜欢原创性内容,如果只是对别人网站的内容进行复制,即使被搜索引擎收录,那收录价值不大。
2. Google排名原理分析
在众多搜索引擎当中,如果网站在Google中能获得较好的排名,那么在其他搜索引擎的排名自然不会靠后。因此,下面我们就以Google为例,针对一些可能算法对如何进行搜索引擎优化进行分析猜测。下面主要对页面等级算法以及HillTop算法进行说明和简单对比。
2.1 页面等级算法(PageRank) PageRank的具体算法是,将某个页面的PageRank除以存在于这个页面的正向链接,由此得到的值分别和正向链接所指向页面的PageRank相加,即得到了被链接的页面的PageRank。算法基于”从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系,来判定所有网页的重要性。然而,并不是说一个网站的外部链接数越高,这个网站就越重要,就会取得更高的排名。假设一个包含三个网页的网站(如图1所示),没有外部链接。在Ⅰ、Ⅱ、Ⅲ的情况下,我们为每个网页分配初值1,阻尼系数保持与Googl一致(0.85),经过迭代收敛后,得到三种情况PageRan值如表1。网站Ⅰ严重浪费了潜在PageRank值,Ⅱ的情况稍好一些,总值只是最大值的一小部分。在Ⅲ的链接结构下,网站达到了PageRank最大值。可见链接的不好,潜在的PageRank值完全可能浪费。因此,通过分析和研究PageRank这种基于链接结构的搜索结果排名算法,可以指导网站链接结构优化,有组织、有规划的提高网页在搜索结果中的排名,避免盲目处理造成的混乱结果。
2.2 HillTop算法 HillTop算法的指导思想和PageRank的是一致的,都是通过网页被链接的数量和质量来确定搜索结果的排序权重。但HillTop认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大。这对于两个具有同样主题而且PR相近的网页排序过程中,HillTop算法就显得非常的重要了。HillTop同时也避免了许多想通过增加许多无效链接来提高网页PageRank值的做弊方法。HillTop算法以如下方式计算一个网页的“权威值”:以该关键词进行一次普通查询,找专家文档“文集”。“专家文档”的定义有严格标准,“文集”应该是数量上易于管理的一组网页。将返回的专家列表中来自同一个域或域相同而后缀不同的站点和镜像站点去掉。根据所获得的上述专家文档对其投票的数量和质量,网页被分配以一个“局部分数”,然后按网页的“局部分数”进行排名。Hilltop算法若没有找到搜索引擎认为数量足够的“专家文件”(至少需2票) ,则该算法失效,即返回结果为零。换言之,对于高度明确化的查询条件,Hilltop算法的结果很可能为“0”,这是该算法的一个独特特性。简单地说,页面等级决定一个网页的“权威性”,而Hilltop算法则决定匹配一个查询条件的一个网页的“权威性”。
针对搜索引擎的优化策略见仁见智,但是丰富网站的内容还是最重要、最有效的方法,一个有内涵的网站自然会得到搜索引擎的青睐。另外,随着搜索引擎技术的变化发展,也要相应地调整策略去适应新的技术。
