420176210 发表于 2012 年 6 月 6 日 13:58:17

百度在中国搜索引擎市场站第一

百度在中国搜索引擎市场站第一,严格来说是他有了一套非常好的分词技术。这种分词技术很难有人理解。毕竟没有不透风的墙,从中可以发现一些规律。今天为大家谈一谈关于百度分词的一点点基本的猜测。先说说百度为什么会分词,并不是所有的词都会有分词产生,例如我们搜索“seo优化软件”,返回的结果,搜索结果非常的精确,那么百度就对这个词没有进行了分词处理。当我们搜索“seo快速排名”百度就会把词拆成“seo”“快速排名”。“百度用三个中文字符分词”有可能有的朋友这样猜测?这样的话,大家应该考虑一下,要是真的是这样那就非常的good呀,我们最后又做了一个实验,发现了一个新的问题,如果一个词已经被百度词库收为一个单独的词,其实这样不用考虑他有多少个字符,百度也会先推荐精准匹配网页,然后推荐分词匹配网页。

本文源自(www.maokong.org)
页: [1]
查看完整版本: 百度在中国搜索引擎市场站第一