资 讯

网站建设、app开发、微信开发、网络营销知识汇聚

We provide professional and all-round information services to enterprises from all levels and angles

搜索引擎的基础教程
admin 2018-08-03

搜索优化公司在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。
  现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie.虽然当时WorldWideWeb还未出现但是网络中文件的传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此AlanEmtage想到了开发一个可以文件名查找文件的系统,于是便有了Archie. Archie 是第-一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一-个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索然后Archie会告诉用户那一个FTP地址可以下载该文件。
  由于Archie深受欢迎,受其启发,Nevada System Computing Services 大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ). Jughead 是后来另一个Gopher搜索工具。
  Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的連度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序像蜘蛛(Spider)-样在网絡间爬来爬去,因此,搜索引擎的Robot程序被称为Spider(SpiderFAQ)程序。世界上第一个Spider 程序,是MIT Matthew Gray的World Wide WebWanderer,它用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
  与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB( Martijn KosterAnnounces the Availability of Aliweb) ,它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的雅虎。
  随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在W 个重要的搜索引擎。Infoseek 沿袭Yahoo!和Lycos的概念,它具有友善的用户界面和大量的附加服务,而使它成为一一个强势搜索引擎。当用户单击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,面此前由Yahoo!提供该服务。Infoseek后来曾以相关性闻名.2001年2月,Infoseck停止了自已的搜索引擎,开始改用Overture的搜索结果。
  1995年,一种新的搜索引擎形式元搜索引擎(A Meta Search Engine Roundup)出现了。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎是Washington大学硕士生Eric Selberg和Oren Etzioni的Metacrawler.元搜索引擎概念上好听,但搜家效果始終不理想,所以没有哪个元搜索引擎有过强势地位。
  1995年12月DEC的AltaVista登场亮相,大量的创新功能使它迅速到达当时搜索引擎的顶峰。AltaVista 是第一个支持自然语言搜索的搜索引擎, AltaVista是第一个实现高级搜索语法的搜索引擎,如AND. OR、NOT等。用户可以用AltaVista 搜索新闻组(Newsgroups)的内容井从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles.搜索Java applets、搜索ActiveX objects. AltaVista 是第一个支持用户自已向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。在面向用户的界面上,AltaVista也做了大量革新。在搜索框下放了tips 以帮助用户更好地表达搜索式,这些小tip 经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的有趣功能。这系列功能,逐渐被其他搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千,上万的搜索排名优化结果中找到想要的。2003年2月18日,AltaVista被Overture收购。
  1995年9月26日,加州伯克利分校Cs助教Eric Brewer .博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1000万个网页,所以有远超过其他搜索引擎的新内容。Inktomi于2002年12月23日被Yahoo!收购。
  1998年10月之前,Google只是Stanford大学的-个小项目BackRub. 1995 年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了google. com的城名.1997年底,在Sergey Brin、Scott Hassan和Alan Steremberg的共同参与下, BachRub开始提供Demo.1999年2月,Google完成了从Alpha版到Beta 版的蜕变。Google 公司则把1998年9月27日认作自己的生日。Google 在Pagerank .动态摘要、网页快照、DailyRefresh.多文档格式支持,地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,像AltaVista-一样,再一次水远改变了搜索引擎的定义。在2000年以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其他搜索引擎大,缺乏高级搜索语法所以推广并不快。直到2000年数据库升级后,又借着被Yahoo!选作搜索引擎的东风,才名声大报。Google自2000年开始提供中文搜索服务。2006年4月,Google宣布其中文名称“谷歇”,这是Google第-个在非英语国家起的名字。
  1999年5月,挪威科技大学的Fast公司发布了自己的搜索引擎AllTheWeb。Fast 创立的目标是做世界,上最大和最快的搜索引擎, Fast(Alltheweb)的网页搜索可利用ODP自搜索引擎经过十几年的发展和摸索,越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展。搜索引擎的发展趋势主要包含以下几方面的技术。
  1.自然语言检素技术
  以自然语言理解技术为基础的新一代搜索引擎,即智能搜索引擎。由于它将信息检索从目前基于关键词层面提高到基于知识<或概念)层面,对知识有一定的理解与处理能力,能够提供分词技术、同义词技术概念搜索、短语识别以及机器翻译技术等服务。因而这种搜索引擎具有信息服务的智能化、人性化特征,允许检索人员采用自然语言进行信息的检索,为他们提供更方便.更确切的搜索服务。
  智能检索利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示.最终帮助用户获得最佳的检索效果。
  例如,查询“计算机”,与“电脑”相关的信息也能检索出来。智能检索可以进一步 缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。智能检索还包括歧义信息和检索处理,如“苹果”究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库全文索引,用户检索上下文分析以及用户相关性反馈等技术结合处理.高效.准确地反馈给用户最需要的信息。
  2.目景与关键调检索相结合
  由于目滎和基于机器人的搜索引擎有各自的特点,目前它们谁也无法完全取代谁,于是很多搜索站点都同时提供这两种类型的服务。国内著名的中文网站引擎搜狐和新浪都是这种模式。Google则主要是一个基于机器人的搜索引擎,但它同时也建立了一个由人工编辑的小型目录。
  3.智能化与个性化检索技术
  传统的搜索引擎使用方法是被动搜索.未来的搜索引擎可利用智能代理技术进行主动信息检索。能够通过对用户的查询计划、意图、兴趣方向进行推理、预测并为用户提供有效的检索结果是这种系统的支柱技术。它使用自动获得的知识进行信息搜集过滤,并自动地将用户感兴趣的信息通过电子邮件或其他方式,提交给用户。智能代理具有不断学习、适应信息和用户兴趣动态变化的能力,从而提供更方便更确切更快捷的个性化搜索服务。研兖智能检索系统已是形勢所迫并成为众所关注的焦点。
  个性化趋勢是搜索引擎的一-个未来发展的重要特征和必然趋勢之
  1)纯净搜索引擎
  这类搜索引擎没有自已的信息采集系统,利用别人现有的索引数据库,主要关注检索的理念技术和机制等。
  2)元搜索引擎
  现在出现了许多的搜索引擎,其收集信息的范围、搜索机制.算法等都不同,用户不得不去学习多个搜索引擎的用法。每个搜索引擎平均只能涉及整个www资源的30%~50%,这样导致同一个搜索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。
  元搜索引擎是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统- -处理,以统- - 的格式提供给用户,因此有搜索引擎之上的搜索引擊之称。它的主要精力放在提高搜索速度智能化处理搜索结果.个性搜索功能的设置和用户检索界面的友好性上,在全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler.dopile.ixquick搜客等。
  3)集成搜索引擎
  集成搜索引擎,亦称为“多引擎同步检索系统”.是在一一个www页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,-次检索输人,多引擎同时搜索,用起来相当方便。
  集成搜索引擎无自建数据库,无须研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增刪调整和及时更新,尤其大规模专业(如FLASH MP3等)搜索引擎集成链接,深受特定用户群欢迎。
  4)垂直搜索引擎
  网站排名优化垂直搜索引擎是相对通用搜索引擎的信息量大.查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领城 某- -特定人群或某-特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深人。 分布式搜索引擎按区城、主题或其他标准创建分布式索引服务器.索引服务器之间相互可以交换中间信息,且查询可以被重新定向。如果-一个检索服务器没有满足查询请求的信息,它可以将查询请求发送到具有相应信息的检索服务器。由于分布式搜索引擎将索引数据库划分到几个分布的数据库中,每个数据库变得小一些,但所有搜索引擎覆盖的范围变大,且很少有信息重复。面作为分布式系统特性之- - 的可扩充也是分布式搜索引擎的优点之一。然而分布式搜索引擎需要多个索引数据库协同工作,实现较困难。目前尚未有真正的、实用的分布式搜索引擎。
 

  • 上一篇:搜索引擎优化还是做不好?看看这些
  • 下一篇:网站优化中SEO优化的重要性和差异性
  • © 2011-2020 www.keyrey.com 上海科睿网络科技有限公司 © 版权所有 沪ICP备12032097号-1
    友情链接 : 上海app开发 app开发公司 app制作 手机软件开发 手机软件开发公司 小程序开发 上海网站制作公司
    QQ在线咨询

    上海app开发QQ在线咨询 上海app开发QQ在线咨询
    电话咨询
    400-877-9280 app开发公司电话咨询
    即时在线咨询 手机软件开发即时在线咨询
    微信扫一扫
    添加app制作微信 上海网站制作公司微信
    科睿网络-互联网开发营销专家

    凡事有交代 件件有着落 事事有回应

    立即获取为您量身定制的开发营销方案

    咨询热线 400-877-9280