《一个关于搜索引擎的想法》的补充

12号我偶然胡思乱想到《一个关于搜索引擎的想法》。昨天POST到这里来,今天一早,令狐就在MSN上就这个问题跟我讨论了一下,我觉得他的一些想法也很有道理。

首先我补充说明一下我的那个想法:

我设想的实现大致是这样:通过安装浏览器插件,实现一个新协议,比如search://…,类似于eDonkey那样,而Search的索引存在于每一个peer上,所有的peer形成一个巨大的搜索引擎,在某种程度上类似于F*G的Fr**N*t(有码的是敏感词-_-|||)。每个人可以在自己的peer设置搜索喜好(即算法),在向外发出搜索请求时,将算法与关键词一起发出,最后通过分布式查询得到搜索结果。

因为各人有各人的喜好,不会是一个固定的算法,所以SEO也就无能为力了。

但令狐指出,目前google面临的问题是:

我倒觉得这个问题的产生是目前的技术导致google的算法不能反映真实情况,因为“有价值的页面提供有价值的链接”这个理论是建立在页面的所有者对页面本身有绝对控制权的基础之上的。可是对动态交互的页面,比如带评论的blog、wiki、bbs,这个法则并不适用。

令狐认为可以在google的基础上考虑解决的办法:

这个我觉得不需要peer去选择算法,而是google把算法中加入用户的一些信息作为参数就可以了。当然了,可能又会带来隐私的问题,还有,像“浏览时间”这样的信息,恐怕技术上也有些难度。

对于我的设想的SearchGrid,令狐的建议也是一个好办法:

至于类似P2P实现,也有可行性,我想是不是可以这样,还是按上面的算法,但是把用户浏览信息保存在peer里,类似eMule那样,在别人的机器上保存你的搜索习惯信息,这样可以避免作弊。但是数据库问题还是不大好解决。

这就需要一个基于Grid的分布式数据库查询技术。

脱离政治环境谈这方面的技术,实在是纯属空谈啊。sigh~~~

17 Replies to “《一个关于搜索引擎的想法》的补充”

  1. Grid的概念现在很流行,但很多人是想某教授所说一样,把“Grid”降低到自己能认识的层次来理解,认为很简单。认为Grid=分布式+中间件。上届全国的Grid的会议,“成果”最多的就是Storage Backup,其实只是把以前的分布式概念就药换新汤。Grid的概念的兴起,也许很大程度上源于98年度“图灵奖”得主–微软的吉姆·格雷博士。隆重推荐大家读一读后来他补发表的领奖讲演文章,文中最后提出的10个问题,偶觉得那才是Grid的基础。Search等等只是Grid上的service而已。

  2. 不算Grid是简单还是复杂,作为一种基础技术,终归是要服务于应用的。8知道风焱想表达什么意思?偶哪里说得不对了么?

  3. 娃哈哈,偶现在就是喜欢把人说晕;)看来可以去考“半仙证”了。某鸟,我并没有否定search作为一种功能会继续的存在,也没有否定随着grid的来到,search会基于grid。我只是认为那时候的“search”并不是大家现在说的“search”。其实现在的SE是这样,很大程度是因为ipv4平台的因素。而文中虽提到要用Grid解决,但偶看到提到的具体问题以及解决的方法也几乎在现在的Internet平台上。所以,呵呵,并不是偶像表达10么意思,而是你把偶弄糊涂了

Leave a Reply

Your email address will not be published. Required fields are marked *