【网络信息的检索】 1、因特网的服务功能 (1)电子邮件E-mail:是最基本、最重要的服务功能,是最为便捷的全球通信工具之一。 (2)文件传输FTP:通过文件传输协议可将不同计算机之间、不同操作系统间的文件进行传递。 (3)远程登录TELNET:通过远程登录协议可将本地计算机作为远程计算机的终端进行工作,充分共享网络资源。 (4)电子公告牌系统(BBS):主要进行信息的发布和讨论。 (5)信息浏览与检索(WWW):通过浏览器可浏览信息和检索信息。 (6)电子商务(EC):通过网络进行商务数据交换和开展商务活动。 2、搜索引擎及其类型 搜索引擎指用于因特网信息查找的网络工具。按工作方式划分为:全文搜索引擎和目录搜索引擎。它们是因特网上常用的两类信息检索方式,都是综合信息检索工具。 由于目录索引类搜索引擎与全文搜索引擎检索有各自的优点和缺点,目前它们谁也无法完全取代谁,于是很多搜索网站都同时提供这两种类型的服务,例如Yahoo、Sina等。 (1)全文搜索引擎(关键字搜索引擎) 原理:使用自动索引软件(搜索器,也称“网络机器人”或“网络蜘蛛”)来搜集和标记网页资源,并将这些资源存入数据库。当用户输入检索的关键词后,它在数据库中找出与该词匹配的记录,并按相关程度排序后显示出来。
特点:由自动索引软件生成数据库,所收录的网络资源范围广、速度快、更新及时 缺点:缺乏人工干预,准确性差 代表网站:google、baidu (2)目录索引类搜索引擎(分类搜索引擎) 原理:一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。 特点:在查询信息时,事先可以没有特定的信息检索目标(关键词),通过浏览主题了解某一主题的相关资源。而且目录型搜索引擎的网页由人工精选,网页内容丰富、学术性较强。 缺点:数据库的规模相对较小,收录范围不够全面、更新周期较长,有时可能会造成链接失败。 代表网站:雅虎、搜狐、新浪、网易 (3)特色信息检索工具 例:MIDI Explorer 搜索MIDI文件 图行天下 搜索图形文件 (4)其他信息检索工具 例:FTP搜索引擎:北大天网 (5)元搜索引擎 一种搜索引擎一般适用于一项任务。为了获得较好的结果,需要为每一项任务选择恰当的搜索引擎或者把多个搜索引擎结合起来。 使用元搜索引擎,用户只需提交一次搜索请求,由元搜索引擎负责转换处理后,提交给预先选定的其他多个搜索引擎,同时检索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,如对检索结果去重、排序和标明检索结果的来源等,输出给用户。 例: DOGPILE http://www.dogpile.com 元搜索引擎优点:能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。
元搜索引擎缺点: 1、元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。 2、元搜索通常只使用简单、直接的搜索策略,一般只支持AND、OR、NOT等比较低级的通用搜索操作。 3、检索速度较慢。 (6)因特网信息检索发展趋势 1、多媒体信息检索 2、专业垂直搜索引擎(只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新)
|