关键词是SEO的核心概念之一。 SEO练习中的许多工作都围绕关键词展开。本文试图结合搜索技术原理和网站优化实践来总结SEO中内容页面关键词布局的具体登陆方法。
一、搜索引擎技术原理的简要说明
搜索引擎的核心技术基础是将用户的查询词分割成自然语言中有意义的短语,然后从索引库中找到包含这些短语中全部或部分关键词的内容,然后返回结果。
普通人的搜索思路是带上关键词,以查找关键词是否包含在内容中。假设您要从序列号为1-10的10个网页中查找包含“关键词布局”的网页,请对这10个网页进行全文搜索,以查找是否包含“关键词布局”一词,然后返回序列号包含该单词的网页。但是,如果从数百万或数千万个网页中进行搜索,则速度非常慢,因此发明了倒排索引的概念。 (下图中的数据不是实际数据,仅供参考)
内容页关键词布局优化解析
如上所示,它是最简单的倒排索引模型(DocID是搜索引擎分配给爬网网页的唯一编号)。每次搜索引擎抓取工具抓取网页时,它都会将该网页分为几个词组,并将这些词与倒排索引表一一比较:如果倒排索引表的“关键词”列中有该词,则添加对应倒排列表中当前网页的DocID号;如果不是,则添加一行(涉及新单词识别,此处未扩展),为该关键词分配一个ID,然后输入当前网页的编号。这样,当我们查询“关键词1”时,我们将很快知道相关网页具有(1,2,3,5)。更复杂的查询词被假定为分为“关键词1”和“关键词还可以快速搜索“单词3”和“关键词6”这三个单词以找到相关的网页(1,2,3,5,6,7,9)。
仅此一项不足以对搜索结果进行排序。在非作弊的情况下,某个特定的关键词出现在网页上的次数越多,该关键词越能代表网页的特征,前提是停用词被过滤掉(停用词几乎每个网页都有很多,但不是表达任何特定含义的单词,例如:“的”,“是”,“了”等)。如果我们可以在倒排索引表中的网页中添加关键词的频率信息(缩写:术语频率-TF),则可以对网页进行排序。
内容页关键词布局优化解析
我们搜索了“关键词如何布局”,搜索词被分为“关键词”,“如何”,“布局”关键词优化,其中“关键词”,“如何”和“布局”出现在第1页2、2、2次,共6次;第2页中的“如何”和“布局”出现7次。根据先前的逻辑,最终的搜索结果被排序为(2,1),这显然不是理想的排序结果。因此,第2页的主题显然是关于“如何布局Go”的。需要引入IDF(反向文档频率索引)来解决此问题。
如果网页集中包含某个关键词的网页较少,则该关键词具有更好的网页区分能力,因此IDF越大,权重越高。假设上图中“关键词”,“如何”,“布局”和“开始”的IDF为2.5、0.3、0.8、3,即每个单词的TF乘以IDF并求和后,网页1、 2的相关性为:7.2、4.6,因此搜索“关键词布局”的排序结果为(1,2),仅更现实。
关键词的位置信息也很重要。通常认为,出现在标题中的关键词比出现在文本中的相同关键词可以更好地反映网页的主题特征。这就是H标签的重要性。搜索引擎还可以根据代码布局和噪声比(例如停用词的频率)来确定导航在哪里,文本在哪里,边栏在哪里等。位置信息将标记在倒排索引列表中,以参与排名决策。
此外,还有一些其他常见的技术方法,例如:两词索引/短语索引。 “如何布置关键词”不一定要分为三个短词,也可以分为“关键词”,“布局”,“如何”,“如何布置”等;相关词合并搜索,“关键词”相关词“关键词”,“如何”相关词“如何”等。
当然,在实践中,现代大型搜索引擎的倒排索引模型将更加复杂,并且排序算法还涉及许多其他因素(一个重点是超链接分析)。由于篇幅和作者水平的限制,我们将不会继续扩展。
二、如何布置关键词
1、标题中必须有关键词,但不一定是完整的疑问句
由于搜索引擎会将查询划分为N个以上的单词,双词和短语,并在查询时添加相关的单词,因此标题中的关键词可能不是完整的疑问句,典型的是“很高兴成为XXXX”。标题中不一定需要完整的单词。即使标题包含此完整的短句,也无法与其他完整的短句匹配。高质量的网页通常可以匹配数百个长尾关键词。显然标题不匹配。可能包含所有内容。标题的另一个主要功能是吸引点击。点击率也是影响排名的一个因素,但是必须显示核心??词“ XXXX”,“好”和“公司”。
2、在文本中自然而均匀地分布一些核心词和细分词
在搜索引擎开发的早期,许多技术人员使用TF * IDF算法中权重较高的漏洞来堆积大量关键词,以快速获得更好的搜索排名。后来,搜索引擎从算法层面修复了漏洞,以防止作弊,并出现了互联网流行的“理想关键词密度3%?8%”的观点。首先,不是针对完整查询词而是针对分割后的所有词计算该密度。实际上,您会发现有些网页的关键词密度略低于3%,还有一些网页的关键词密度远高于8%。能够获得良好的排名。
如果您是搜索引擎工程师,您会怎么做?我想我会结合整个网络的历史访问数据(例如百度统计,移动百度等可以获得更全面的访问数据)和关键词密度信息合理范围和警告范围,超出警告范围的将是静默处理后,站点的历史数据和小流量排名第一阶段的访问数据反馈将在警告范围内组合,以决定是抑制还是维持或给出更高的排名。
与关键词密度相比,我们应该更加注意的是语言的平滑度(盲目插入关键词显得冗长而笨拙)和内容的深度。毕竟,搜索引擎具有成百上千个排名因素,它们不能彼此忽视。
3、主要文本和侧边栏下方的相关内容推荐适当的布局关键词
尽管搜索引擎可以通过代码和噪声比来判断这些不是文本部分,从而在这里减轻了某些关键词的权重,但从百度快照缓存的角度来看,它仍然没有什么作用。
主要在文本下方和侧栏中的相关内容和推荐内容都是从水平和垂直角度中选择的。例如,在本文中,主题是关于“关键词布局”,然后水平推送一些“网站结构布局”,“关键词挖掘技巧”和其他站点优化内容,很可能有很多访问者感兴趣;垂直推送一些“教学”,“如何建立高质量的外部链接”和“如何提高目标网页的转化率”,这也是访问者可能会暂时抑制的隐藏需求。在增加关键词布局的同时,还可以增加PV,减少跳出并增强用户体验。为什么不这样做。