77范文网 - 专业文章范例文档资料分享平台

信息检索基础完整篇

来源:网络收集 时间:2019-03-23 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

第一章 信息检索基础 第一节 信息资源概述 一、信息含义:(1)广义信息定义为:信息是事物属性的表征。

(2)狭义的信息定义:信息是指系统传输和处理的对象。 二、知识

1.概念:知识是人们通过实践对客观事物及运动过程和规律的认识。人们在认识世界和改造世界的过程中,获得大量客观事物传递的信息,即感性认识或经验,通过大脑对这些感性认识进行加工处理,形成理性认识,即知识。

2.知识与信息的联系:知识形成的过程就是人脑对客观事物传来的信息进行加工的过程,信息包含了知识,知识是信息被认识了的那部分。 3.信息、知识、文献三者关系

(1、信息是物质存在的方式、形式和运动规律的表征。

(2、人脑对事物属性的感知形成知识。人们对信息集合加工、整理形成人类社会实践的知识。知识是能够被人们所认识到的那一部分信息。 (3、知识被记录在载体上形成文献。

(4.、文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。 三、 文献

1、定义——文献是记录有知识的一切载体。(文献著录总则中定义)

它把人类知识用文字、符号、图形及声频、视频信号等方式记录在纸张、感光材料、磁性材料等载体上。

2、文献四要素——文献信息、文献载体、符号系统、记录方式是构成文献的四个基本要素。四者缺一不可。知识决定文献的内容,载体决定文献的形态,记录则是构成文献的手段。 四、 信息资源

定义——这种大量的客观存在的人们直接或间接开发利用的信息集合总称为信息资源。 五、 信息素质

1.定义:指从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。

2.具有信息素质的人应具备的能力 :运用信息工具、获取信息 、处理信息、生成信息、创造信息 、信息增效、信息协作、信息免疫

第二节 信息资源的构成 一、从文献的性质和出版形式划分

主要划分为以下十种类型,即所谓的“十大情报源”。

1.科技图书:一般是对已发表的科研成果、生产技术和科学知识的概括和总结。它通常是以一次文献为基本素材,经过作者的选择、分析、鉴别和归纳后重新组织写成的。

特点:内容比较系统、全面、成熟、可靠,有一定新颖性,是综合、积累和传递科技知识的一种重要情报源。但编辑出版时间过长,传递信息速度太慢,内容一般只是反映3-5年以前的研究水平。从情报检索角度来看,~一般不作为主要检索对象。

2.科技期刊:一般是指定期或不定期连续出版的、通常有数字或年月顺序编号的、并打算无限期出版下去的出版物。

特点:出版周期短、报道速度快,数量大、内容丰富,能及时反映世界的科技水平,是科学交流的主要工具。据统计,从期刊方面获得的科技情报约占全部情报来源的65%。

3.会议文献:在国内外各种学术会议上交流的论文,以及由此汇编成册或内部交流或公开出版的文献。

特点:传递信息及时,针对性较强,能反映当代科技最新水平和发展趋势,是科技人员的

主要参考资料。

4.专利文献:是专利制度的产物,一切与工业产权有关的文献统称为~。

广义解释包括:专利说明书、专利公报、专利检索工具及与专利有关的法律文件等;狭义仅指专利说明书。 专利说明书对工程技术人员特别是产品设计人员来说,是一种较为切合实际、又具有启发性的重要参考资料和情报源。 5.科技报告:指各国政府系统或科研及生产单位关于某项研究成果的总结报告或在研究过程中每一阶段进展情况的实际记录。 特点:比较新颖、详尽、专深。

6.学位论文:高等学校或研究机构培养的学生为获得某种学位而撰写的科学论文。

7.技术档案:在科研和生产过程中形成的、有一定对象的技术文件的总称。包括:任务书、协议书、图纸、方案等

8.产品资料:国内外各厂商为推销产品而印发的商业宣传品,包括:产品样本、产品说明书等。

9.标准文献:以文件形式出现的、经过公认的权威当局批准的标准化工作成果。又称“技术标准”或“标准”。 特点:现代工业生产与制定和运用技术标准有密切的联系。通过标准可以了解各国的经济政策、技术政策、生产水平、标准化水平等。

10.政府出版物:各国政府及其所属的各个部门所发表、出版的文件。

特点:集中反映了各国政府有关工作的观点、方针、政策,对了解某国政策、经济实况有一定参考价值。

二、按照信息加工层次划分

人们在报道和揭示信息的过程中,对信息进行了不同层次的加工,按照加工程度可将信息分为——原始文献、二次文献、三次文献)

1)一次文献:是指作者以本人的研究成果为基本素材而撰写的,并以正式出版物的形式向社会公开发表的文献。

包括:阅读性图书、期刊论文、科技报告、会议论文、专利说明书、技术标准及部分学位论文等。如学报,青年文摘。特点:记录的情报一般比较具体、详尽和系统化,是创造性劳动的结晶,有直接参考、借鉴和使用的价值。 2)二次文献:(Secondary Document)是对一次文献进行加工、提炼和压缩后所得到的产物,是为了管理和利用一次文献而编辑、出版和累积起来的工具性文献。包括:目录、题录、文摘、索引。

3)三次文献:(Tertiary Document)是指对有关的一次文献和二次文献进行广泛深入地分析研究之后综合概括而成的产物。包括:综述、述评、年鉴、文献指南等。如教材、年鉴、手册、、百科全书。

总结:一次文献带有创造性;二次文献是在一次文献基础上形成的,具有选择性、浓缩性;三次文献是在一、二次文献基础上经过分析、提炼、总结形成的,具有概括性。从一次文献到三次文献,是一个由分散到集中、由无序到有序的过程。 三、按照信息内容划分

1.按信息内容的表现形式划分:

(1)文献型信息源:~的信息内容是以语言文字的形式存储在各种不同的载体上,~是目前信息内容最丰富、人们使用最多的信息源。

(2)非文献型信息源:包括——1数值型信息源:以数据形式出现的,并存储在各种不同载体上的信息集合。

2声像型信息源:信息以声音或图像形式出现的信息源。如广播、电视、CD光盘、VCD光盘等。

3多媒体信息源:集文字、声音、图像于一体,多以光盘或因特网网上资源形式出现。 4实物及口头信息源:指实物中及口头交流中所含的信息。 第三节 信息检索概述 一、信息检索

(一)信息检索含义(Information Retrieval)

1.信息检索:~是指将信息按一定的方式组织、存储起来,并根据用户的需要找出有关信息的过程。它的全称又叫做“信息存储与检索”(Information Storage and Retrieval),这是广义的信息检索。狭义的信息检索仅指该过程的后半部分,即从信息集合中找出所需情报的过程。 信息检索根据其检索对象的不同,可分为文献检索、数据检索、事实检索,其中文献检索是三者中最基本、最主要的方式。

(1)文献检索(Document Retrieval)---凡是以文献(包括文摘、题录或全文)为检索对象的检索就叫~。

文献检索是一种相关性检索,检索结果是文献线索(文摘、题录),一般要阅读文摘后才能决定取舍。~是信息检索的基本检索,它要比数据检索和事实检索复杂而困难,文献检索主要是通过二次文献(检索工具)进行,如目录、题录、文摘、索引等。数据检索和事实检索是信息检索的派生检索,主要通过参考工具书来达到检索目的。

(2)数据检索——以数据为对象的检索,包括文献中的某一数据、公式、图表等,是直接可以利用的情报。

(3)事实检索——以事实为对象,查找某一事物发生的时间、地点及过程,也是一种确定性检索。

信息检索包含文献检索,文献检索是信息检索中最重要的类型。 二、信息检索原理

本质概括——对信息集合与需求集合的匹配与选择。 包括两个过程——

1存储过程(形成检索工具)2检索过程(利用检索工具查找所需信息) 信息检索方式

信息检索可以分为---传统信息检索(手检)和现代信息检索(机检)。

1、传统信息检索:是指手工信息检索,是检索人员利用手工检索工具靠手翻、眼看、大脑判断的方式查找所需文献信息的检索手段。其检索方法主要有以下几种:

(1)直接检索:即利用一次文献进行检索。是人们最常用的一种查找信息的方法,许多人需要信息资料时,首先想到的是去图书馆查阅各种图书、期刊及其他资料,从中找到所需信息。

这种方法要花费大量的时间和精力,在过去文献数量较少时,还能达到目的。而在当今信息大量产生的年代,用这种方法收集信息,有如大海捞针一样,但~在资料积累上还是个好方法。(2)间接检索:是利用各种检索工具获取线索,再根据线索来查找文献信息的方法,也就是常说的手工检索。在一般的信息检索书中,如果没有特殊说明,手工检索就是指间接检索而言。

2、现代信息检索:包括计算机信息检索和网络信息检索。 ~是以计算机为基础的信息存储检索,它是在手工检索、机械检索及光电检索基础上演变而来,而且还在不断向前发展。计算机检索已经从单机检索、联机检索发展到今天的网络检索,并正向着智能化方向发展。 计算机单机检索:~是计算机检索的最初形式,随着计算机存储介质的发展变化,也在不断变化。目前主要有三种形式:计算机磁盘检索、计算机磁带检索和计算机光盘检索。

计算机网络检索:~是近年发展起来的,目前主要有三种形式:图书馆局域网络的检索、联机检索系统的检索及Intetnet网上检索。

根据内容不同计算机信息检索系统分为:联机检索系统、光盘检索系统、网络检索系统。 第四节 信息检索工具 一 检索工具定义

1.检索工具是人们用来存储、报道和查找文献资料的工具,它们是图书情报部门对原始文献加工整理后编制成的二次文献或三次文献。一般来说,~必须具备下列四项条件: 1对所收录的文献的各种特征(包括外部特征和内容特征)要有详细 的描述。 2每条描述记录(即款目)都标明有可供检索用标识。 3 全部描述记录科学地组织成一个有机的整体。 4 具有多种必要的检索手段。 二、检索工具类型

提供线索的指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献) 检索工具可以从不同的角度,划分为不同的类型: (一)按收录范围划分

综合型检索工具:~收录范围广,可涉及多门学科的多种文献类型,如苏联的《文摘杂志》、美国《工程索引》等就是世界上著名的~。

专业型检索工具:收录文献的范围仅限于某一学科领域。 如美国《化学文摘》、《金属文摘》等。

单一型检索工具:只收录某一特种类型的文献,但学科范围可广可窄。 如专门检索专利文献的英国的《世界专利索引》、报道会议文献的《会议论文索引》等。 (二)按检索方法划分

手工检索工具:包括各种手工检索目录卡、各种书本式检索刊物。

机械检索工具:主要指计算机检索工具,包括各种类型的计算机检索软件。 (三)按出版形式分:(1)卡片式检索工具(2)书本式~:

期刊式~:形式与期刊一样,有统一刊名、分卷分期,包括各种定期或不定期出版的检索刊物。

单卷式~:一般以图书形式出版,也有不定期连续出版几卷后就不再出版。如专题目录、专题文摘。

附录式~:一般不单独出版,仅付于图书、期刊、论文之中或之后。如“参考文献”、“引文书目”。(3)缩微式~:缩微胶片。(4)磁带式:磁带、磁卡、磁盘、光盘、磁性材料。 (四)按编著方式划分:

在科技界人们比较习惯按编著方式来划分检索工具的类型。 ——目录型、题录型、文摘型和索引型。 1.目录型检索工具:

目录定义:以单位出版物的外部特征(如图书名称、著者、出版事项等)位著录对象,进行简单描述,获得一个目录款目,将一个个目录款目按某种方式组织起来就形成了目录。 目录特点:目录只描述出版物的基本特征,对内容揭示非常浅,因此它主要应用于查找出版单位或收藏单位是否拥有自己所需要的图书、期刊等单位出版物,难以检索出版物所包含的情报内容。从情报检索角度来讲,它不是主要的检索工具,但它是其他检索工具的基础。 目录种类

(1)按检索途径划分:

书名目录:以书名为排检标目,按书名的字顺排检。

著者目录:以著者姓名为排检标目,按著者姓名的字顺排检。 分类目录:以分类号为排检标目,检索文献比较科学、系统,能较好地满足族性检索的要求。 主题目录:以文献的主题词为排检标目,便于把分散在各学科的文献集中起来,专指性强,

但不便于族性检索。 (2)按职能分:

1)出版发行目录:包括登记性的国家书目和商业性的出版商书商目录。 国家书目:如实记载某一国家某一历史时期的图书出版状况,为图书情报部门提供了最全面最权威的图书出版情况,是有效进行图书采购、整理、利用及开展参考咨询服务的重要工具。我国目前有两种:月刊性的《全国新书目》和年刊性的《全国总书目》。

2)馆藏目录:包括两种---图书馆藏书目录:反映单个图书馆图书收藏情况。 联合目录:反映某地区或系统甚至全国的图书收藏情况。 馆藏目录是读者到图书馆查找和借阅图书的重要工具,也是检索服务查找原文及获得原文的必备工具。

3) 资料来源目录:指附属于某一检索工具或检索系统的“引用出版物目 录”,是供读者了解某一检索工具的文献收录情况和期刊演变情况,准确鉴 别文献或题录出处的辅助性工具。 2.题录型检索工具

(1)题录定义:用来描述某一文献的外部特征并由一组著录款目构成的一条文献记录。 题录通常以一个内容上独立的文献单元(如一篇文章、图书中的一部分、有时也可以是整本出版物)为基本著录单位,这是他与目录的主要区别。两者的相同点是他们都只限于描述文献的外部特征,题录实质上是一种不含文摘正文的文摘款目。在揭示文献内容的深度方面,题录比目录深一些,但又比文摘浅。主要采用题录方式来摘录和报道文献的检索工具都属于题录型检索工具。

(2)特点:虽然对文献内容的揭示深度不如文摘型检索工具,但加工容易、出版迅速,可以缩短检索工具的时差,使科技人员尽快获得最新情报,它往往是文摘型检索工具的先导和重要补充。

3.文摘型检索工具: (1)文摘:(abstract)是对一次文献的内容所做的简略、准确地描述,通常不包括对原文的补充、解释或评论。它是检索工具的主题,二次文献的核心。

文摘款目由题录部分和文摘正文组成。文摘可以帮助科技人员判断检索的文献是否符合需要,避免误检和漏检;确定原文内容与课题的相关程度,可以节约阅读时间;便于电子计算机进行全文检索,有助于提高标引质量。 (2)文摘类型:按目的和用途分类--- 报道性文摘(informative abstract):是原文内容的浓缩(尤其是创新点),向读者提供原文中的定量情报(如距离、最大值、最小值、平均值、公式等)和定性情报(发现、结果、新方法、新设备、结论等)。~基本上反映原文技术内容,信息量大,参考价值高,长度200~300字左右。

指示性文摘(indicative abstract):指示给读者原文的主题范围、研究目的、不摘录论据、方法、数据、设备、结论等内容。~适用于泛论性或评论性文章,长度100字左右,有的只有一句话,又称“解题性文摘”或“简介”。 二、检索工具的结构

都是由1编辑说明与使用凡例部分、2分类表和主题词表部分、3正文(著录)部分、4索引部分、5附录部分组成的。 第五节 信息检索语言 一.检索语言的概念

1.定义: 信息的存储和检索是两个紧密联系的过程,在这两个过程中,都要对文献信息进行标引,如果没有共同的语言来确保对文献信息标引的一致性,就会给信息检索造成极大的困难。为使检索顺利+进行,在信息存储时,标引人员用一定的语言来描述文献信息的外部特

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库信息检索基础完整篇在线全文阅读。

信息检索基础完整篇.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/541758.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: