当前位置: 首页 > 科技观察

乔纳森·弗莱彻:被遗忘的“搜索引擎之父”

时间:2023-03-12 21:49:34 科技观察

乔纳森·弗莱彻(JonathonFletcher)导读:英国BBC网站周二发表题为《乔纳森·弗莱切:被遗忘的搜索引擎之父》(乔纳森·弗莱彻:被遗忘的搜索引擎之父)的一篇评论文章称,尽管乔纳森·弗莱彻的名字并不为大多数人所熟知,但世界上第一个现代搜索引擎就是他编写的。尽管他的项目由于种种原因没有持续下去,但他开发的技术为后来所有的网络搜索引擎奠定了基础。以下为文章全文:当谷歌(888.67,0.62,0.07%)迎来15岁生日时,这家互联网巨头已经成为信息检索的代名词。然而,如果你用谷歌搜索乔纳森弗莱彻的名字,你不会立即理解他在万维网发展中的作用。当然,很少有资料称他为“现代搜索引擎之父”。但20年前,在苏格兰斯特林大学的一个计算机实验室里,正是弗莱彻发明了世界上第一个使用网络爬虫技术的搜索引擎——无论是谷歌、必应还是雅虎(29.48,0.24,0.82%),一个当今所有主要搜索引擎工具都使用的技术。解决搜索问题1993年,网络世界才刚刚起步。世界上第一个流行的浏览器Mosaic发布后不久,全世界的网页总数只有几千个。但即便如此,如何在网络上检索信息仍是一个未解决的问题。Mosaic有一个名为What'sNew的页面,用于在创建新站点后索引内容。问题在于,为了让Mosaic开发人员发现他们的网站,网站管理员必须写信给浏览器所在的伊利诺伊大学香槟分校的国家超级计算应用中心(NCSA)。当时,乔纳森·弗莱彻还是斯特林大学的明星毕业生,刚刚获得格拉斯哥大学的全额博士奖学金。但在他离开之前,他在格拉斯哥大学的奖学金被取消了,弗莱彻似乎走进了死胡同。“突然之间,我不得不自己照顾自己,所以我回到了斯特林,在技术部门找到了一份工作,”他回忆道。正是在那个职位上,他遇到了万维网和Mosaic的最新消息页面。更好的方法在为斯特灵大学构建Web服务器时,Fletcher发现了What'sNew页面中的一个根本缺陷。由于页面是手动添加的,因此无法跟踪内容更改。因此,链接会很快过期并可能被错误标记。“如果你想知道发生了什么变化,你必须自己回去看看,”弗莱彻谈到马赛克的链接时说,“我有计算学位,我认为应该有更好的方法,所以我决定写一个程序来帮我找内容。”于是,就有了世界上第一个网络爬虫。弗莱彻将他的发明命名为JumpStation。他对网页进行索引,然后使用网络爬虫进行搜索。它本质上是一个完全自动化的过程,可以编译所有链接以及它访问和索引的所有页面。直到遍历完所有内容,该程序才会停止。十天后,即1993年12月21日,JumpStation遍历了所有网页并为25,000页编制了索引。今天,谷歌索引了超过1万亿个页面。搜索的诞生Fletcher很快为索引开发了一个易于使用的搜索工具,然后将他的站点提交到Mosaic的What'sNew页面。于是,世界上第一个现代搜索引擎诞生了。“我认为他真的是‘网络搜索引擎之父’,”研究信息检索历史的皇家墨尔本理工大学教授马克桑德森说,在Web诞生之前肯定有搜索引擎,但Jonathan的搜索引擎是第一个具备现代搜索引擎的所有元素的。”然而,当联合创始人谢尔盖·布林(SergeyBrin)和拉里·佩奇(LarryPage)成为家喻户晓的Fletcher现居中国香港,他在互联网发展中的作用并没有得到太多认可。这可能与他最终放弃该项目有很大关系。随着JumpStation的发展,投资的需要——这是斯特林大学不愿意提供的。弗莱彻解释说:“它使用共享服务器,没有很多磁盘空间,而且磁盘在当时又小又贵。”控制磁盘空间到6月1994年,JumpStation索引了275,000个网页,由于存储空间有限,Fletcher只能索引网页的标题和头文件,无法索引全部内容。尽管如此妥协,JumpStation还是不堪重负,Fletcher也感到筋疲力尽。“这不是我的工作,”他说,“我的工作是让学生的实验室保持运转,并做一些系统管理和技术零工。”这时,一份来自东京的工作邀请给了他一份让弗莱彻无法拒绝的丰厚聘书。斯特灵大学几乎没有打算留住他和JumpStation。“我显然没能说服他们认识到JumpStation的潜力。”弗莱彻说,“当时我做了我认为是正确的事,但20多年来我总是时不时地回顾一下。”至今仍记得弗莱彻的斯特灵大学计算与数学系主任莱斯利·史密斯承认,JumpStation“超前于时代”。他还告诉BBC:“我在斯特林大学的同事们很高兴他的成就得到了应有的认可。”它成为所有后续搜索引擎的基础。“1993年,互联网世界还很小,”桑德森教授说。“当时接触过互联网的人都应该知道JumpStation。”“在1994年年中,人们逐渐意识到搜索引擎的重要性。谷歌直到1998年才出现,他们正在做乔纳森在1993年所做的事情。”几周前,弗莱彻在都柏林的一次会议上获得了一些认可,他出席了一个由微软(32.39,0.73,2.32%)、雅虎和谷歌代表组成的小组。但在他的演讲中,他的重点是未来。“在我看来,网络不会永远存在,”他告诉听众,“但查找信息将是一个常态。”“搜索内容和查找信息的愿望不受任何媒体的约束”他说。今天的媒体为那些追随弗莱彻脚步的人创造了巨大的财富,他并不后悔。“我的父母以我为荣,我的妻子以我为荣,我的孩子以我为荣。这些对我来说都是无价之宝,所以我很高兴。”原文链接:http://tech.sina.com.cn/i/2013-09-05/09558710214.shtml