网站优化的中文分词技术浅谈
2012-05-24
什么是分词技能?分词技能是查找引擎针对用户提交查询的要害词进行的查询处置后,依据用户的要害词用各类匹配办法进行的一种技能。
分词技能最早研讨创造的是谷歌,也是最成熟的技能,中文分词技能人人都很清晰的。固然谷歌是分词技能的开创者,但在中文比之英文要复杂得多,有多种语义,所以中文分词技能这方面是百度抢先。
中文分词有三种办法:1.字符串匹配的分词法2.词义分词法3.计算分词法。在这里就不具体引见了,实例为主。我们以“中文分词技能”为例,假定它是网页的要害词,若何对它进行分词来使我们的网页排名更靠前,让更多人查找到。百度分词:字符串匹配的分词是“中文分词技能”,词义分词是“中文分词”、“分词技能”,计算分词是“中文”、“分词”、“技能”。一个词百度可以分这么多个,而我们要提取对网站有效的词语,百度也会依据词语的匹配、词义的匹配、词语呈现的频率,决议依据哪些词语捕获网页。
在百度输入“中文分词技能”,排在搜快网络上的都是“中文分词技能”为题目的网页,除了第一位网站,是“中文分词”为题目。能够有人会感觉奇异,其实否则在题目意思邻近,文章的被存眷率,网站主题,网站的外链及权重就决议了它的排名,当然这不是我们目前讨论的。我们从查找后果可以看到,赤色的字体大都为“中文分词技能”,阐明在网站前提相当的状况下,先显示题目匹配的网页。然后在往后看,用百度快照检查网页,你会发现,“中文分词技能”、“中文分词”、“中文”字体为黄色,“分词技能”、“分词”为蓝色,“技能”为绿色。百度辨别给它们的权重是黄色>蓝色>绿色,如许我们就晓得若何拔取要害词了。优先选择“中文分词技能”、“中文分词”(“中文”这个词就不必思索了,跟我们的文章主题不符),然后再选择“分词技能”,固然“分词技能”权重稍低,但契合我们文章主题。
经过分词技能,连系文章主题与网民的查找习气,我们可认为本人的网站确定要害词,其实这也是搜索引擎优化的由来。分词技能是查找引擎的中心技能之一,假如你在这方面有研讨的话,在提上彀站排名方面,就能如虎添翼了。