上海金夕网络
科技有限公司 上海金夕网络
科技有限公司 上海金夕网络
科技有限公司
学习园地 -> 搜索引擎推广   -> 搜索引擎的发 展
搜索引擎的发 展
添加时间: 2008-7-16 点击次数:


发 展(1):
   世界上第一个 Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互 联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL) 。
   搜索引擎一般 由以下三部分组成:
   爬行器(机器 人、蜘蛛)
   索引生成器
   查询检索器

发 展(2):
  Excite 的历史可以上 溯到1993年2月,6个Stanford University(斯坦福大学 )大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是 一个完全投资项目,他们还发布了一个供webmasters在自己网站上 使用的搜索软件版本,后来被叫做Excite for Web Servers。
  注:Excite后来曾以概念 搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜 索引擎,改用元搜索引擎 Dogpile

发 展(3):
  1994年4月,斯坦福大 学的两名博士生,美籍华人杨致远和David Filo共同创办了  Yahoo!。随着访问 量和收录链接数的增长,Yahoo目录开始支持 简单的数据库搜索。因为Yahoo!的数据是手工 输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站 ,因为都附有简介信息,所以搜索效率明显提高。
  注:Yahoo以后陆续有 Altavista、Inktomi、Google提供搜索引擎 服务
  Yahoo!--几乎成为 20世纪90年代的因特网 的代名词。

发 展(4):
  1995年,一种新的 搜索引擎形式出现了——元搜索引擎(Meta Search Engine)。用户只需 提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。
  第一个元 搜索引擎,是Washington大学硕士生  Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎 概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

发 展(5):
  智能检索 的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最 终帮助用户获得最佳的检索效果。
  例:
(1)查询“计算 机”,与“电脑”相关的信息也能检索出来;
(2)可以进一步 缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴;
(3)还包括歧义 信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需 要的信息。

发 展(6):
  个性化趋 势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同 的搜索结果。自2004年10月yahoo推出myweb测试版,到 11月a9推出个性化功 能,到2005年Googlesearchhistory基本上都沿着 一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的,Google个性化搜索引 擎,或者yahooMindSet,或者我们都 知道的前台聚类的vivisimo。但是无论其 中的哪一种实现方式,即Google的主动选择搜 索范围,还是yahoo(http://my.yahoo.com),vivisimo的在结果中重 新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索引擎应用产品。

发 展(7):
  网格技术 (great global grid):由于没有统 一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用,形成信息孤岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。
美国全球信息 网格(Global Information Grid)
  Robot(机器人)一 词对编程者有特殊的意义。Computer Robot是指某个能以 人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序像蜘蛛 (spider)一样在网络间 爬来爬去,因此,搜索引擎的Robot程序被称为 spider程序。

  1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个 利用HTML网页之间的链 接关系来检测万维网规模的“机器人(Robot)”程序。开 始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。

  1994年4月,斯坦福大 学(Stanford University)的两名博士 生,美籍华人Jerry Yang(杨致远)和 David Filo共同创办了  Yahoo。随着访问量 和收录链接数的增长,Yahoo目录开始支持 简单的数据库搜索。因为Yahoo!的数据是手工 输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括 Fast和Altavista在内的Overture,2003年11月,Yahoo全资收购3721公司。

  1994年初,华盛顿 大学(University of Washington )的学生Brian Pinkerton开始了他的小 项目WebCrawler。1994年4月20日,WebCrawler正式亮相时仅 包含来自6000个服务器的内 容。WebCrawler是互联网上第 一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索, 摘要一般来自人工评论或程序自动取正文的前100个字。

  1994年7月,卡内基· 梅隆大学(Carnegie Mellon University) 的Michael Mauldin将John Leavitt的spider程序接入到其 索引程序中,创建了Lycos。除了相关性 排序外,Lycos还提供了前缀 匹配和字符相近限制,Lycos第一个在搜索 结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。

  1994年底,Infoseek正式亮相。其 友善的界面,大量的附加功能,使之和Lycos一样成为搜索 引擎的重要代表。

  1995年,一种新的 搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需 提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生  Eric Selberg 和 Oren Etzioni 的 Metacrawler。

  1995年12月,DEC的正式发布 AltaVista。AltaVista是第一个支持 自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND、 OR、 NOT等)。用户可以用 AltaVista搜索新闻组( Newsgroups)的内容并从 互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一 个支持用户自己向网页索引库提交或删除URL的搜索引擎, 并能在24小时内上线。 AltaVista最有趣的新功 能之一,是搜索有链接指向某个URL的所有网站。 在面向用户的界面上,AltaVista也作了大量革 新。它在搜索框区域下放了“tips”以帮助用户 更好的表达搜索式,这些小tip经常更新,这 样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图 形演示系统LiveTopics,帮助用户从 成千上万的搜索结果中找到想要的。

  1995年9月26日,加州伯克 利分校助教Eric Brewer、博士生Paul Gauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强 大的HotBot出现在世人面 前。声称每天能抓取索引1千万页以上, 所以有远超过其它搜索引擎的新内容。HotBot也大量运用 cookie储存用户的个 人搜索喜好设置。
  1997年8月,Northernlight搜索引擎正式 现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的 Current News、7100多出版物组成 的Special Collection、良好的高级 搜索语法,第一个支持对搜索结果进行简单的自动分类。
  1998年10月之前,Google只是斯坦福大 学(Stanford University)的一个小项 目BackRub。1995年博士生Larry Page开始学习搜索 引擎设计,于1997年9月15日注册了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下 ,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。 Google公司则把1998年9月27日认作自己的 生日。Google以网页级别( Pagerank)为基础,判 断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客( Geek)文化氛围、 不作恶(Don’t be evil)的理念,为 Google赢得了极高的 口碑和品牌美誉。2006年4月,Google宣布其中文名 称“谷歌”,这是Google第一个在非英 语国家起的名字。
Fast(Alltheweb)公司创立于 1997年,是挪威科 技大学(NTNU)学术研究的副 产品。1999年5月,发布了自 己的搜索引擎AllTheWeb。Fast创立的目标是 做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索 可利用ODP自动分类,支 持Flash和pdf搜索,支持多 语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极 其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索 部门被Overture收购)。
  1996年8月,sohu公司成立,制 作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉。随着互联网网站的急剧增加,这种人工编辑的分类目录已经不适应。sohu于2004年8月独立域名的 搜索网站“搜狗”,自称“第三代搜索引擎”。
  Openfind 创立于1998年1月,其技术源 自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文 搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐 被Baidu和Google瓜分。2002年6月,Openfind重新发布基于 GAIS30 Project的Openfind搜索引擎Beta版,推出多元 排序(PolyRankTM),宣布累计 抓取网页35亿,开始进入 英文搜索领域。
  2000年1月,两位北大 校友,超链分析专利发明人、前Infoseek资深工程师李 彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布Baidu.com搜索引擎Beta版(此前Baidu只为其它门户 网站搜狐新浪Tom等提供搜索引 擎),2001年10月22日正式发布 Baidu搜索引擎,专 注于中文搜索。Baidu搜索引擎的其 它特色包括:百度快照、网页预览/预览全部网页 、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划( Blitzen Project)开始后,技 术升级明显加快。后推出贴吧、知道、地图、国学、百科、文档、视频、博客等一系列产品,深受网民欢迎。2005年8月5日在纳斯达克 上市,发行价为USD 27.00,代号为BIDU。开盘价USD 66.00,以USD 122.54收盘,涨幅 353.85%,创下了5年以来美国股 市上市新股当日涨幅最高纪录。

  2003年12月23日,原慧聪搜 索正式独立运做,成立了中国搜索。2004年2月,中国搜索 发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络 猪更名为IG(Internet Gateway) 。

  2005年6月,新浪正式 推出自主研发的搜索引擎“爱问”。2007年起,新浪爱 问使用google搜索引擎。

  2007年7月1日 全面采用网易 自主研发的有道搜索技术,并且合并了原来的综合搜索和网页搜索。有道网页搜索、图片搜索和博客搜索为网易搜索提供服务。其中网页搜索使用了其自主研发的自然语言处理、分布式存储及计算技术;图片搜索首创根据拍摄相 机品牌、型号,甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,提供“文章预览”,“博客档案”等创新功能。

打印本页
关闭本页
关于我们 | 我们的服务  | 我们的产品  | 新闻中心
案例中心 | 公司博客 | 联系我们 | 加入我们 | 代 理 | 投资合作
Copyright@2009上海金夕网络 科技有限公司 版权所有 不得转载 | 使用须知 | 著作权声明 | 沪ICP备0******号
友情链接:    时时彩正规平台   统一彩票_安全购彩   时时彩官方网投注平台   彩89_安全购彩   手机彩票软件下载