欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    信息资源基础知识.ppt

    • 资源ID:6549800       资源大小:1.24MB        全文页数:101页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    信息资源基础知识.ppt

    信息检索课程,主讲人:朱江岭2010年,朱 江 岭 简 介,1985年自动化本科毕业,中国政法大学法硕研究生。河北科大信息检索教研室主任。河北省知识产权专家组成员。公开发表研究论文36篇,主持和承担省部级研究课题15项,编著6部,各级获奖7项。擅长:国内外信息检索、欧美、日本专利检索;专利申请等知识产权咨询。EMAIL:电话:88632068(0),课程介绍,科技文献检索是一门全校性基础课。通过教学和实践,使学生具备文献信息检索的基础知识和理论框架,熟悉本专业及相关专业文献信息资源;掌握通过多种方式获取和利用文献信息资源的基本技能;学会用科学的方法进行文献信息的收集、整理、加工和利用,提高学生在学习和工作中的自学能力和独立创新能力。,本课要求:,1.了解信息检索基本知识,网上信息特点、组织方式,信息检索原理与技术。2.掌握常用搜索引擎、网上信息检索技巧;3.掌握下载网上信息常用的浏览器使用方法4.掌握国内重要数据库 CNKI、万方、博硕论文数据库等检索方法5.熟悉三大索引6.国外重要检索数据库介绍 EI、CA、联机7.熟悉了解特种文献信息数据库检索方法8.了解社科、农林、网上图书、专业信息中心网站等 网上检索方法。9.了解国内外信息服务机构等内容。,本课教材或参考书目,朱江岭等 网络信息资源检索与利用北京:海洋出版社,2007参考书 目:余向春等,化学化工信息检索与利用大连理工大学出版社 2005科技信息检索 西南科技信息中心 出版 2002郝风素等编著,信息资源组织与检索,北京:机械工业出版社,2005朱江岭等编著,虚拟图书馆与网上信息检索,北京:海洋出版社,2005徐天秀著译,21世纪高等院校教材-信息检索 北京,科学出版社 2001,本课程的学习目的及任务:培养信息意识 掌握信息检索技能 增强信息综合运用能力考试方式:标准试卷(A、B),第一章 信息资源概论,第一节 信息资源基础知识,一、信息的概念与特征二、信息与知识、情报、文献的关系 三、信息的表现形式与类型,一、信息的概念与特征,1信息的概念信息(masege):是文献、资料、情报、知识、数据以及消息、新闻的总称。还可以理解为:信即信号,息即消息,通过信号传递的消息。我国辞海把信息解释为:信息是指对消息接受者来说预先不知道的报道。,2.信息的特征,(1)传递性:(2)共享性:(3)依附性和可处理性:(4)时效性:也称动态性,,二、信息与知识、情报、文献的关系,知识(knowledge):是人类在改造客观世界实践中所获得的认识和经验的总结。情报(information):是指那些被人们用来解决特定问题所需要并进行交流的知识。文献(Literature):以文字、图形、符号、声频、视频等手段记录和传播知识的载体。记录有知识或信息的一切载体。,三、信息的表现形式与类型,信息资源,潜在信息资源,现实信息资源,实物信息资源,文献信息资源,(网络信息资源),第二节 文献信息资源的类别,文献信息资源的类别:一、按文献的载体形式二、按文献内容的加工程度三、按文献的出版形式,一、按文献的载体形式,印刷型缩微型声像型电子型,按文献的载体形式,1.印刷型 包括铅印、油印、石印、胶印等。主要以纸张为载体,它的优点是便于阅读,便于流传;缺点是占据空间大,整理和保存起来比较困难。,2.缩微型 是以感光材料为载体,以照相复制方式,将纸张文献微缩复制在感光材料上而生成的文献,包括缩微胶卷和缩微胶片。具有体积小、重量轻、存储密度高的优点,但要借助缩微阅读器才能阅读,不大方便,也不便于携带。,按文献的载体形式,3.声象型也称视听性文献,是指以磁性材料或感光材料为载体,采用录音、录相或摄影技术直接记录声音信息或图像信息而形成的文献,包括唱片、录音带、录像带、幻灯片、电影片等。其特点是直观、真切、传递速度快、存储密度高。,按文献的载体形式,4.电子型文献又被称作机读型文献,现在电子型文献有时也统称为电子出版物。电子型文献包括电子图书、电子期刊、电子新闻、各种联机信息库和光盘数据库产品或软盘、磁带(计算机磁带)等产品,近期又出现了以网上原创作品为代表的只在网络中存在的虚拟文献(virtual document)资源。电子型文献数据库是计算机信息检索的主要对象,其优点是体积小、检索方便、直观生动,便于远距离传输;缺点是需借助计算机阅读,不大方便,费用较高。(人类知识交流与生产的第四次革命,1语言2文字3活字印刷术),按文献的载体形式,二、按内容的加工程度,一次文献二次文献三次文献,零次文献,按内容的加工程度,一次文献:原始文献,指直接从研究或劳动实践中产生并经过适当的审查后正式发表公布的文献。可以理解为:指原始的创作。如期刊论文,科技报告,专利说明书,会议论文,学位论文等。为文献检索的目的。,按内容的加工程度,二次文献:检索工具,指将大量分散无序的一次文献进行加工整理后形成的检索文件,包括目录、题录、索引、摘要等等。是检索一次文献的工具。,按内容的加工程度,三次文献:综述性文献,指对一次文献和二次文献进行综合、分析、评述等深度加工形成的文献。如学科进展综述、专题述评、预测报告,以及一些百科全书、年鉴、数据手册、词典等。,三、按文献的出版形式,1、图书2、期刊3、专利4、学位论文5、会议文献,6、科技报告7、标准8、政府出版物 9、产品资料10、技术档案或其它,1、图书,图书是正式出版且具有一定篇幅的非连续性的,其内容往往是围绕某一个题目进行全面论述出版物。内容较成熟、全面、系统、可靠。,每一种公开出版发行的图书,都有一个唯一的国际标准书号,简称ISBN。ISBN 7501125759/G966出版社号 书号 计算机校验码 中图分类号,2、期刊,期刊包括所有定期和不定期的连续出版物。特点是:数量大,品种多、内容丰富、出版周期短,报道速度快,是科研人员获取最新信息的主要来源。,公开出版发行的期刊,都有一个唯一的国际标准号,简称ISSN,如:ISSN 1671-1653。,3、专利文献(patent document),专利文献是一切与专利制度有关的专利文件的统称,包括专利说明书、专利公报、专利分类表、专利检索工具以及专利的法律性文件等。,4、学位论文(thesis,dissertation),著者为取得专业资格的学位而提出的论文,介绍其发现、调查或研究成果。常指硕博论文。,5、会议文献(conference paper),会议文献指各种学术、专题会议上发表的论文和报告。会议文献有助于及时了解本学科的最新科技动态。分为会前文献和会后文献两种。,6、科技报告(technical report),科技报告是关于科研成果或进展的报告,最著名的美国的四大报告。就是美国国家技术情报服务局出版的PB报告,由美国武装部队技术情报局出版的AD报告,由美国国家航空航天局出版的NASA报告,和由美国能源部出版的DOE报告。,7、标准(standard),技术标准是对工农业产品和工程建设的质量、规格及其检验方法等方面所作的技术规定。,分国际标准、国家标准、部颁标准和企业标准。,8、政府出版物(government document),各国政府部门及其所属机构发表的文件,分行政性文件和科技性文件两大类。,9、档案,技术档案指在生产建设和科技部门的技术活动中形成的、对一定工程对象的技术文件的总称。包括任务书、协议书、设计数据、工艺图纸等等。,10、产品资料(product literature),国内外各厂商为推销其产品而印发的商业宣传品,包括产品样本、目录、说明书、厂商介绍等第。十大情报源,本课重点:,一、信息与知识、情报、文献的概念二、文献信息资源的类型,第三节 网络信息资源概述,网络信息资源的定义网络信息资源的特点网络信息资源的类型,一、网络信息资源的定义,以网络为载体和传播介质,以超文本、数字化为组织和存在方式,通过计算机网络可以利用的各种信息资源的总和又称网络信息资源、虚拟资源、数字资源、电子信息资源、联机信息、万维网资源等。,二、网络信息资源的特点,A、从内容方面看,网络信息资源信息类型丰富,信息量大,开放性强、增长快、更新快。B、从存放位置看,信息广泛分布在不同的服务器上,而服务器上的操作系统、数据结构、字符集、处理方式等并不相同。C、从其利用方式看,网络信息资源不受时空限制,跨时空、跨行业传播。,D、从其组织方面看,网络信息资源分布离散化。E、从其质量方面看,信息发布有很大的自由度和随意性,缺乏必要的过滤、质量控制和管理机制。,网络信息资源的特点,F、时效性强,在因特网上能得到最新的资料以及某个学科和某项科研的最新动态,能检索到最近的(甚至当日的)文献。G、随机变化大,更新消亡无法预测。H、结构复杂,组织分散,零乱无序。I、还具有开放性、交互性、通用性等特点。归纳如下:,网络信息资源的特点,动态更新,毫秒处理;形式内容,丰富多彩;海量信息,全球等距;共建共享,广泛参与;分布离散,组织无序;未经评议,需要鉴别。,网络信息资源的特点,三、网络信息资源的类型,按信息的表现形式:文本信息资源超文本信息资源通过网络上各节点的链路把相关信息有机地组合在一起,检索超文本信息资源时,可以从任何一个节点开始检索、追踪信息。多媒体信息资源包括文本、图像和声音等各种信息表达的总称。超媒体信息资源是超文本和多媒体技术的结合,具有超文本和多媒体两种信息资源的特点,具有高度的交互性。,按信息交流方式:非正式出版信息:电子邮件、网络论坛、电子公告、电子会议等半正式出版信息:包括政府机构和非政府组织、学术团体、内部期刊等提供的信息。正式出版信息:有产权保护、质量稳定、利用率高的知识性、分析性信息。一次、二次、三次文献信息,也包括网上电子图书、期刊、网络数据库等。,三、网络信息资源的类型,按信息的载体和通讯方式划分联机信息资源光盘信息资源Internet中的万维网WWW信息,三、网络信息资源的类型,第二章 信息组织与检索,第一节 信息检索概述第二节 信息的组织第三节 信息检索技术第四节 信息检索策略,第一节 信息检索概述,一、信息检索概念:信息检索,从广义上说是将信息按一定方式组织和存储起来,并根据信息用户的需求找出所需的过程。即包括“信息存储”和“信息检索”。而狭义定义,就是信息的查找与索取。,二、信息检索的类型,1按存储和检索的内容划分(1)文献信息检索 检索的结果为文献信息。-相关性检索。(2)数据信息检索 检索的结果为数值性的数据。这些数据是经过科学工作者仔细挑选反复验证的 数据可靠,可供科技人员直接使用,大量节约了科研人员的时间,提高了研究工作的效率。如化学分子式、物理参数等。(3)事实数据检索以事项为检索的目的和对象,检索结果是有关某一事物的具体答案。因此它是一种确定性检索。如查找某一事物发生的时间 地点及过程等,一般要从储存的情报中检索出必要的部分后,再加以逻辑推理才能给以答案。,(1)检索工具的结构:说明:介绍检索工具的编辑方针、收录范围、总体结构、各部分的功能、体例以及使用方法等。它是使用检索工具的指南。正文(主文档):是文献条目(也称记录)的有序集合,是检索工具的主体。条目(记录)通常由文献的顺序号、篇名、著者、来源等著录项目(也称字段)组成。索引:由各种不同的索引组成,数据库中称索引文档或倒排档。它提供多种检索途径(检索入口),满足用户不同的检索需要,提高检索的速度与准确性。常见的辅助索引有著者索引、主题索引、文献号码索引等。,附录:由来源期刊一览表、缩略语与全称对照表、不同语种音译对照表等组成。它是正文的必要补充,有利于用户详细理解正文的著录内容,了解文献来源情况,根据缩写查找全称等。词表:是检索系统中文献信息整序的依据,如分类表、主题词表等。它通常独立存在,是准确选择检索的分类号和主题词的依据。,(2)检索工具的类型检索工具按照描述文献信息特征的方式不同、用途不同,可以分为目录、题录、文摘、索引。目录(Catalog):是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。一种出版物经过如此描述后形成一条记录,将所有的记录组织起来就形成了目录。比较重要的目录有:国家书目(全国总书目、全国新书目)、出版社与书店目录、馆藏目录、联合目录,题录(Bibliography):是以单篇文献(如一篇论文、书中的一章)为报道单位,描述文献各种特征的一条记录,通常由文献的分类号、文献篇名、著者及其单位、文献来源、主题词等项组成。题录揭示文献比目录更为详细。如:全国报刊索引文摘(Abstract):是指通过描述文献的各种特征,并介绍文献主要内容来报道文献的工具。它与题录型检索工具的报道单位一样,也是单篇文献,只是著录项目(字段)比题录多了一个摘要项。文摘型检索工具(简称文摘)是书目检索系统的核心,是书目检索的主要工具。,索引(Index):将某种信息集合(如目录、题录、文摘)中的一组相关信息,按照某种顺序组织并指引给用户的一种指南。它具有便于检索,揭示文献信息深入、详细的优点,在检索系统中占有重要地位。索引条目一般由检索标识和存贮地址组成。标识是索引条目所指示的文献信息某方面的特征,如主题词、著者姓名、分类号等;存贮地址是指明标识所表达的特定信息在信息集合中的地址,它通常是文献存取号(文摘号)。不同的标识系统构成不同的索引,常见的索引有以下几种:,(1)分类索引:是以分类号或类目名称作为索引标识,按照分类号排列形成的索引。提供分类检索途径,适合于族性检索。(2)主题索引:是以主题词(叙词或关键词)作为索引标识,按其字顺排列形成的索引。提供主题检索途径,适用于特性检索。(3)著者索引:是以文献上署名的著者、译者、编者等责任者的姓名或机关团体名称作为索引标识,按其字顺排列形成的索引。又可分为个人著者索引和团体著者索引。提供著者途径检索,适于检索某人、某机构发表的文章。,(4)专用索引:是以某些领域专用的名词术语或符号作为索引标识编排形成的索引。如分子式索引、生物属名索引、地名索引、报告号索引、专利号索引、标准号索引等。(5)引文索引:是以引文著者和引文的其余题录部分作为标识编制成的索引。它是建立在文献的引证和被引证关系之上,揭示文献之间相互联系的,如美国的Science Citation Index。它可用于了解某人的某篇文章被引用的情况以及检索相关文献或进行引文分析。,二、信息检索的类型,2按系统中信息的组织方式划分(1)全文检索:(2)超文本检索:超文本(Hypertext)是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户介面。(3)超媒体检索:超媒体(Hyper Media),是超文本利用引用链接其他不同类型(内含声音、图片、动画)的文件,这些具有多媒体操作的超文本.意指多媒体超文本(Multimedia Hypertext),即以多媒体的方式呈现相关文件信息。,三、信息检索的意义和作用,1.发挥知识宝库作用,有利于开发智力资源2.及时把握最新动态和趋势,作出正确决策3.借鉴前人成果 避免重复研究和投资 高能物理研究所研究的第一台高能加速器,由于借鉴了外国的经验及其他因素,它的投资比国外同类装置节省1/2,人力节省3/4。又如 苏联在研究美国航天科技情报的基础上制成的登月1号,登月2号,其中的电器自动控制系统的投资分别只有美国的1/20和1/50。阿波罗登月计划中,甲醇对钛的应力腐蚀问题。(只需在甲醇中加入5%的水即可),4.事半功倍 加快科研步伐 科研人员在一个科研项目活动中的时间分配情况:查阅文献资料的时间占整个科研时间的50.9%试验研究时间占整个科研时间的32.1%编写报告时间占整个科研时间的9.3%开始思考计划时间占整个科研时间的7.7%5拓宽知识结构 提高独立工作能力 资料显示:上世纪知识更新时间为50年,本世纪初是30年,前几年是3、5年,现在有的领域为一年,有的领域甚至是70天、一个月。,第二节 信息的组织,一、检索语言1.信息检索语言1)定义检索语言,又称标引语言、索引语言、概念标识系统等,是根据检索需要而编制的一种人工语言。是信息检索系统存储和检索信息时共同使用的一种约定性语言,以达到信息存储与检索的一致性,以提高检索效率。,2.信息检索语言的特点,具有必要的语义和语法规则,能准确地表达科学技术领域中任何标引和提问的中心内容和主题;具有表达概念的唯一性,即统一概念不允许有多种表达方式,不能模棱两可;具有检索标识和提问特征进行比较和识别的方便性;既适用于手工检索系统,又适用于计算机检索系统。,3.检索语言的类型,(1)按构成原理分:a.表述文献外表特征的语言题名语言:按文献题名字顺逐字排检,西文起首冠词一律不排。著者语言:按著者姓名,按姓前名后的字顺逐字排检。号码语言:按文献代码,如专利号、标准号、报告号、ISBN号、ISSN号等的顺序排检。,(1)按构成原理分,b.表述文献内容特征的语言分类检索语言:又称分类法,是用分类号和类名来表达信息的主题概念,并且按照知识门类的逻辑次序将信息系统地组织和划分的语言。即按照知识分类的原理,以代表类目的数字、字母符号作为文献主题标识的受控语言,分类法侧重于文献信息的分类组织。,主题检索语言:又称主题法,它是用主题词或标题词来表达文献主题概念的语言。以主题词表或标题词表作为词汇规范化的工具。是用语词来标识信息的受控语言,主题法侧重文献信息的索引和检索。还有:术语系统又称代码语言,依据事物的某一方面的特征,采用专业学科的代码系统来标识,如化学分子式、生物种属索引等。引文索引是显示科学论文之间相互引证而形成的论文信息。,规范文档是一种特殊的词典,主要在标引和检索文献过程中提高专指度。所以说,检索语言是信息加工、传播和使用的主要手段。例如中国图书馆图书分类法、杜威十进分类法、国际十进分类法、国际专利分类表。,中国图书分类法,A 马克思主义、列宁主义、毛泽东思B 哲学C 社会科学总论D 政治、法律E 军事F 经济G 文化、科学、教育、体育H 语言、文字I 文学J 艺术K 历史、地理,N 自然科学总论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药T 工业技术U 交通运输V 航空、航天X 环境科学Z 综合性图书,TB 一般工业技术TD 矿业工程TE 石油TF 冶金工业TG 金属学、金属工艺TH 机械、仪表工业TJ 武器工业TK 动力工程TL 原子能技术TM 电工技术TN 无线电电子学、电讯技术TP 自动化技术、计算技术TQ 化学工业TS 轻工业、手工业TU 建筑科学TV 水利工程,(2)按组配方式分,先组式语言:指在文献信息检索之前,表达文献信息内容的标识已经事先组配好了的信息检索语言。后组式语言:指表达文献主题概念的标识,在编制检索语言词表和标引文献时,都不曾预先规定组配关系,而是在进行检索时,用户根据检索需要,按照组配规则临时组配起来的信息检索语言。,(3)按照规范化程度分,规范化语言:又叫受控语言,是指人为地对标引词和检索词的词义进行控制和管理的语言。简单地说,规范化语言是一种有主题词表或者分类表控制的检索语言,包括主题语言中的叙词、标题词和分类语言。自然语言:是直接从原始信息中抽取出来的未经规范化处理,用以揭示信息主题概念的自由词,如关键词语言。它除一般的事物名称、科学术语外,还包括俗名、商品型号和缩写等,具有不用编制词表,及时跟上事物发展,准确表达事物新概念,选词灵活方便,专指性强,标引和检索速度快等优点,便于计算机检索。,二、网络信息资源的组织方式,1.文件方式2.数据库方式3.搜索引擎方式4.主题指南方式与虚拟图书馆方式,采用主题组织法的思想,以文件名标识信息内容,用文件夹组织信息资源,并通过网络共享实现信息传播,是成熟的文件操作技术与网络传输技术相结合的产物。其主要缺点是不能有效组织结构化信息,并且随着网络信息资源的飞速增长将不断增加网络传输负载。,数据库也是比较成熟的技术。在数据库中,数据的最小存取单位是信息项(字段),因此以数据库方式组织网络信息资源,可以根据用户需求灵活地调整查询结果集的大小,从而降低网络数据传输的负载,大大提高管理效率。数据库方式一般用于对大量的规范化数据进行管理,用户界面容易操作,如书目数据库、全文数据库等。,综合使用主题组织法与分类组织法,利用超文本链接技术将相关网络信息以节点为基本单位组织成为检索体系,其多级检索页面仿佛图书馆里详尽的多级张贴目录,但其类目用主题词标识而非传统类号。该方式的优点是屏蔽了网络信息资源相对于用户的复杂性,检索和利用界面简单易用,并且具有严密的系统性和良好的包容性和可扩充性,能较好地满足用户的族性检索要求,检准率高,特别适合建立专业性或专题性的网络信息体系。,从信息技术角度看,网络信息基本的组织形式是文件方式和数据库方式,不同文件和数据库信息之间采用超链接方式实现互联。1.文件方式。纯文本文件,以.txt为文件扩展名。Word文件,以.doc为文件扩展名。PDF文件,以.pdf为文件扩展名,要使用Adobe公司的阅读器。此外,图形、图象、音频和视频等非结构化的网络信息资源也都可以用一定的格式存储下来,如图形图象类,Adobe、Photoshop、Microsoft Painter、ACDSee;图表表格类,Microsoft Excel;音频类,Microsoft Windows、Mediaplayer、Winamp、Realplayer;视频类,Microsoft Windows、Mediaplayer、超级解霸、Realplayer等。,2.数据库方式数据库是在计算机存储设备上按一定方式,合理组织并存储的相互有关联的数据的集合,是计算机技术和信息检索技术相结合的产物,是电子信息资源的主体。例数据库主要可分为参考数据库和源数据库全文数据库和数值数据库等。,搜索引擎方式,结果主要为:超链接方式。有超文本方式和超媒体方式两种形式。超文本是一个由节点和链构成的信息网络,节点是超文本表达信息的一个基本单位,链是从一个节点指向另一个节点的指针,表示节点上存在着的信息之间的联系。用户根据信息之间的联系,顺着链路查看信息。超媒体技术是超文本技术和多媒体技术的结合,它将文字、表格、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们通过高度链接的网络结构在各种信息库中进行随意查找。,主题指南方式与虚拟图书馆方式:近些年兴起的虚拟图书馆,它的基础是数字图书馆和网络资源。,本课重点:,网络信息资源的特点与类型检索语言与信息的组织网络信息资源的组织方式作业:1、摘抄一条文摘的所有内容 2、写出一本专业书籍的中图分类号,第二章 第三节 信息检索技术,一、信息检索的基本原理 二、信息检索技术,一、信息检索的基本原理,信息检索的全过程包括信息存贮和信息检索存贮过程主要是利用检索语言对文献信息进行标引,形成文献特征标识并输入检索系统,为检索者提供有规律的检索途径。检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存贮所提供的检索途径,将检索提问标识与文献特征标识进行匹配,两标识相符或基本相符的则为命中的检索结果。,检索语言,信息检索的基本原理,二、信息检索技术,1.布尔逻辑检索2截词检索 3位置检索(邻近度检索)4限制检索,1.布尔逻辑检索,利用布尔逻辑算符进行检索词的逻辑组配,是常用的一种检索技术。常用的逻辑运算有三种:与、或、非。优先顺序为 NOT,AND,OR。若有括号,先执行括号内检索式。,“与”算符 and AND*,“与”算符用于描述概念间的交叉关系和限定关系。含义:检出文献中必须同时包含被其连接的所有词或词组。作用:缩小检索范围,提高查准率。,“或”算符 or OR+,“或”算符可描述概念间的并列关系和相关关系,用来组配同义词或相关词等。含义:检出文献中包含有被其连接的任意一个词或词组。作用:扩大检索范围,提高查全率。,“非”算符 not NOT-,“非”算符用于描述概念间的排斥关系和特殊限定关系。含义:检出文献中必须包含这个算符前的词,必须不含这个算符后的词。作用:缩小检索范围,提高查准率。,布尔逻辑检索符示意图,A and B A or B A not B,截词检索(?或*),将截词符加在检索词的前后或中间,以检索一组概念相关或同一词根的词。作用:扩大检索范围,提高文献的查全率。如:comput?computer computers computing dam*dam dams wom?n woman women,位置检索(邻近度检索),文献中词语的相对次序或位置不同,所表达的含义可能有所不同,而同样一个检索式中词语的相对次序不同,其表达的检索意图也不一样。位置算符的作用是对用作检索词的词组或短语中的各个单词之间的相对位置进行描述。常用的有(W)算符、(N)算符、(F)算符、(L)算符(N)算符等。,steel(W)pipe 表示steel pipe 而不是 pipe steelcomputer(1N)application 表示 computer application 或 application of computerN表示前后两词相邻,顺序可互换;W表示前后两词相邻,词序不可颠倒。如在N后面加上数字,表示两个词之间允许的最多词数。,限制检索,限制检索是一种附加检索条件,不能单独使用,必须与检索词检索配合使用。它是通过对文献出版日期、国别、语种、文献类型等对检索结果进行约束或压缩的方法。包括字段限制检索和范围限制检索,字段限制检索,字段限制检索指将检索词限定在特定的字段中进行。同样的检索词,选择在不同字段中进行检索,得到的结果是不同的。检索系统通常都会设置默认的检索字段,如“所有字段”。如果想指定在特定的字段中查找检索词,就需要调整检索字段,进行字段限制。,缺省字段为“篇名”,范围限制检索,指对检索词的范围(如时间、国别、语种、信息类型等)进行约束或压缩的方法,它大多通过检索系统的限制指令或菜单选择来实现。,工程索引检索界面,第四节 信息检索策略,检索策略指检索前制定的概念组配和执行顺序的方案,即将课题的提问从其检索词与检索工具的收录内容、编排特点相匹配而确定的检索方案或程序。信息检索大体分为分析研究课题、选择检索工具、确定检索途径、选择检索方法实施检索、原文的获取五个步骤。,一、分析研究课题,1 分析主题内容2 分析文献类型3.分析查找年代,二、选择检索工具,根据课题检索需要,选择相关的检索工具,如果是利用联机、光盘检索系统或数据库检索系统,则可按提示进行操作,其检索途径和功能远比手工检索工具多得多,文献线索的输出形式也可根据需要灵活选择。,三、确定检索途径,1.题名途径:利用图书、期刊、资料等的题目名称对文献进行检索的途径。2.著者途径:用文献的著作者、编者、译者的姓名或机构团体名称编制检索特定的个人或团体所生产的文献3.分类途径:以文献的内容在分类体系中的位置作为文献的检索途径,它的检索标志就是所给定的分类号码。,4.主题途径:通过表达文献的内容实质,经过规范化的名词或词组来检索文献,检索时直接按主题词的字顺,即可查到某个特定主题的文献。5.序号途径:是通过已知号码(包括序号、报告号、合同号、专利号、标准号)查找文献的一种检索方法。6.其它途径:分子式索引、地名索引、生物属性索引等。,三、确定检索途径,四、选择检索方法,A.追溯法:又称回溯法,以文献后面所附的参考文献为线索的查找方法,这种方法查全率低,目前罕有人用。B.常用法:利用文摘、题录或索引等检索工具来查找文献的方法,也称工具法。按所查文献的顺序,可分为顺查法、倒查法和抽查法三种。,顺差法由远而近,从问题发生的年代开始逐年往近查,适用于无综述性文献可参考时使用。查的文献较完整,查全率较高,但工作量大,效率不高。倒查法由近到远,重点放在近期的文献,多用于新课题,或老技术的新发展,从新情况开始查到一定的基本资料时为止。抽查法根据课题的特点和需要,选查发展旺盛时期的文献,可节约时间,但可能会漏检,C.综合法:结合追溯法和常用法,先利用检索工具查出一定时期内的一批有用文献,在利用这些文献后面的参考文献,追溯查出前一时期内的文献,如此循环交替的使用两种方法直到满足要求为止。也称循环法。,五、原文的获取,获取原文是文献检索的最后一个步骤,也是至关重要的一个步骤。获取原文一般有三个步骤:判断文献的出版类型:期刊、学位论文、专利、会议录、报告等。整理文献出处:将文献出处中有缩写、有音译刊名的还原成全称或原刊名。根据出版类型在图书馆或情报所查找馆藏目录或联合目录确定馆藏。原则上从本单位、本市、本地区、全国的顺序逐步扩大查找馆藏范围。如果是国外资料,在国内查不到馆藏,可通过国际联机向国外订购。,本课重点:1、布尔逻辑检索2、检索策略(检索分析与步骤),

    注意事项

    本文(信息资源基础知识.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开