找回密码
 注册
【阿里云】2核2G云新老同享 99元/年,续费同价华为云精选云产品特惠做网站就用糖果主机Jtti,新加坡服务器,美国服务器,香港服务器
查看: 126|回复: 0

新网络索引系统Caffeine

[复制链接]
发表于 2011 年 12 月 12 日 11:54:37 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
,我们正式宣布:新网络索引系统Caffeine的开发完成了。Caffeine提供 的网络搜索结果比上一个版本索引的结果新50%,它能给我们提供最多的网络内容。现在,无论是新闻报道、博客还是论坛帖,在其发表后,您都可以比以往任何 时候更快地找到相关内容的链接。

对于那些不是和我们一样以构建搜索引擎谋生的人们来说,以下是一些背景知识:当您搜索谷歌时,您在搜索的 不是实时网络;相反,您搜索的是谷歌的索引,它和书背面的清单一样,可以帮助您锁定需要的信息的位置。(点击这里,可以清楚了解索引是如何工作。)

那 么,我们为什么要创建一个新的搜索索引系统呢?网络的内容日益剧增,这不仅仅是数目和容量在增多。随着视频、图片、新闻和实时内容的出现,普通网页的内容 更丰富也更复杂。此外,人们对搜索的预期也比以往更高。搜索者希望找到最新的相关内容,内容发布者希望在发布内容后立即被人搜索到。

为了 紧跟网络的发展趋势并满足不断增长的用户期望,我们创建了Caffeine。下图将为您演示Caffeine与旧索引系统的工作原理的对比:

我们的旧索引有多层结构,它们中间的更新速度不尽相同:有一些会比另外一些更新速度快, 而主层则是几个星期更新一次。为了更新旧索引的一层,我们必须分析整个网络,这意味着,在我们找到网页与让您访问该网页之间,将会有很大的延迟。

在 Caffeine系统下,我们分析网络的小部分,并在全球持续更新我们的搜索索引。当我们发现新网页,或现有网页出现新信息时,我们可以将其直接添加在索 引中。这意味着您可以发现比以往任何时候都更新的信息――无论该信息是在什么时候、什么地方发布的。

凭借Caffeine我们可以检索规 模巨大的网页。事实上,每秒钟Caffeine能平行处理上几十万个网页。如果这些网页是一堆纸的话,那么每秒钟纸堆都将长高三英里。Caffeine占 据了数据库中近1亿G的储存空间,并以每天几十万G的速度添加新信息。存储这么多信息,您需要625,000个存储量最大的iPod才能完成;将这些 iPod头尾相连的话,总长将超过40英里。

着眼于未来,我们创建了Caffeine。它不仅可以保证内容更新,还能为我们创建一个更快 速全面、并且随着网络信息增长而扩展的搜索引擎打下坚实基础,从而为您提供更多相关的内容。请做好准备,在未来几个月里您可以见证更多的改进。
Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net

Archiver|手机版|小黑屋|金光论坛

GMT+8, 2024 年 11 月 16 日 18:48 , Processed in 0.019875 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表