欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第2讲 文献信息检索基本原理ppt课件.ppt

    • 资源ID:1428455       资源大小:925.50KB        全文页数:100页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第2讲 文献信息检索基本原理ppt课件.ppt

    第2讲 文献信息检索 基本理论,学习目的要求,了解信息检索系统概念了解手工信息检索系统的类型掌握手工信息检索系统的著录格式和常用的手工信息检索系统的信息检索方法掌握信息检索语言掌握信息检索语言的基本类型掌握信息检索的基本方法,一、信息的搜集与选择 1、确定收集的原则 收集的学科范围(如 机械、物理、化学等), 主题范围(机床,刀具), 覆盖面, 信息种类, 文种, 时间跨度, 收集的数量, 摘储率 2、收集的途径 3、选择所需信息,2.1 文献信息存储过程,二、信息的著录加工1、著录目的:是把一篇文献变成一条著录,压缩后必须能体现文献的外表特征和内容特征。外部特征指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名、人名、各种符号标识(专利号,标准号,文献号等)、机构名等。内容特征指表征文献实质意义的特征,如主题词(叙词,单元词、关键词)、分类号、化学符号等。2、著录内容 外表特征:篇名,作者,工作单位,号码,文种 出处:发表在什么刊物,刊号,卷,期,页数 内容特征:摘要3、著录格式, 图书著录,馆 藏 号:4418391文摘类型:RISBN号:92-828-556-S语种:Ger中图类号:TD94文献题名:NMRSpekeropie zur stofflichen Charakter is ierung von Braunkohlen bei der hydrierenden Veredlung作者:Michel,D团体作者:European Commission国别:BE缩称:CEC出版日期:1999页:164S,期刊著录,记录标识:9807001记录来源:JX文献类型:刊文献题名:机械零件组成编码频率分析及设计规范化通用标准化作者:鲍子强作者单位:长沙重型机器厂母体文献:矿山机械卷期页码:1997,No.12,p.3942出版单位:洛阳矿山机械研究所分 类 号:97*TD-3*12主 题 词:标准化,成组技术,机械零件,设计文摘:(略),专利著录,发明名称:蓖麻脱皮筛选机范畴:B07B 1/20范畴分类:27F 33A 13A国别:省市:12申 请 人:刘国喜通讯地址:(300011)天津市河西区三水南里126幢发 明 人:刘国喜代 理 人:闫俊芬代理机构:12100 天津市专利事务所专利代理服务部代理机构地址:(300051)天津市和平区成都道116号法律状态:授权说明书页数:003附图页数:02权 项 数:003文摘: (略), 会议文献著录,论文题名:从更宽阔的视野观察与思考冶金反应工程学问题作者:曲英:北京科技大学,李士琦:北京科技大学会议名称:第七届全国冶金反应工程学术会议会议届次:7会议时间:19980515会议地点:沈阳会议主办者:东北大学母体文献:东北大学学报(自然科学版)(第19卷增刊)出 版 地:沈阳出版单位:东北大学学报编辑部出版时间:19980500页码:13馆 藏 号:H043339分 类 号:TF01,N94关 键 词:反映工程,冶金,系统工程,可持续发展文摘:(略),标准文献著录,标 准 号:GB/T 1990.2-98发布日期:1998-11-13标准状态:ST实施日期:1999-05-01起草单位:中国标准化与信息分类编码研究所标准名称:质量管理和质量保证标准 第2部分:GB/T 19001、 GB/T 19002和 GB/T 19003实施通用指南正文语种:汉语英文名称:Quality management and quality assurance standards-part 2:Generic guidelines for the application of GB/T 19001、 GB/T 19002 and GB/T 19003稽 核 项:0中国标准分类号:A00,标准文献著录(续),采用关系:ISO 9000-2-97.IDT主 题 词:质量管理,质量保证,质量英文主题词:QUALITY ASSURANCEQUALITY MANAGEMENTQUALITY国别:中国申 请 号:98249276公 告 号:申 请 日:19981209公 告 日:审定公告日:19991110授 权 日:授权公告日:19991110, 学位论文著录,论文题目:自控式同步电机机端电压位置监测器数字控制作者:刘波授予学位:硕士导师姓名:李永东授予学位单位:清华大学分类号:TM762.3馆 藏 号:Y248534论文页数:97出版时间:1999.3主 题 词:自控式同步电机机端电压位置监测器数字控制文摘:(略),科技报告著录,TITLE:Human factors in aviation maintenance,phase 4Document ID:19950021275 N (95N27696)File Series:NASA Technical ReportsReport Number:DOT/FAA/AM-95/14Sales Agency&Price:CASI Hardcopy A09 CASI Microfiche A02Authors:Shepherd,William T.(Federal Aviation Administration)Published:May 01,1995Corporate Source:Federal Aviation Administration(Washington,DC,United States)Galaxy Scientific Corp.(Atlanta,GA,United states)Pages:176Contract Number:DTFA01-94-C-01013NASA Subject Category:MAN/SYSTEM TECHNOLOGY AND LIFE SUPPORT,三、信息的标引加工,1、定义 把文献的主要内容用非常简明的标识(即标志)表示出来。 标识可以是号码(分类号),也可以是科技名词或词组(主题词),也可以是其它的。2、作用 1)、相同内容的文献集中在一起,不同内容的区分开来 2)、形成有序的序列,即按一定规律排列,把存储进检索工具的著录按照一定的规律排列起来,形成有序的排检系统,这样可以提供检索途径。3、 标引加工的类型 分类法标引 用分类号作为标识 主题法标引 用代表文献主题内容的实质性的词汇作为标识,四、信息的结构编排,一般有三种排列方式 1、一条著录给一个顺序编码,号码是唯一的,按号 码顺序排列。 号码可以表示存储地址,但通过号码文献的逻辑内容体现不出来 2、分类编排,按分类号的顺序 3、按主题词的字母顺序,一、检索概念 将信息按一定的方式组织和存储起来,并从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。 信息检索包括:存储与检索 检索的本质:从已存储的文献资源中找出与需求相关 的文献。,2.2 文献信息检索基本原理,二、文献检索的基本原理,将检索提问标识与存贮在检索工具中的标引标识相比较,两者一致或信息标识包含着检索提问标识,则含有该标识的信息就从检索工具中输出;对信息的著录是按一定规则对信息的外表特征和内容特征加以简单明确的表述,信息的标引是对其内容按一定的分类表或主题词表给出分类号或主题词;检索过程则是按同样的主题词表或分类表及组配原则分析课题,形成检索提问标识,根据检索工具所提供的检索途径,从信息集合中查找与检索提问标识相符的信息特征标识的过程。,原始信息,信息分析、著录和标引,信息检索系统,检索课题,课 题 分 析,检 索语 言,检索结果,信息存贮,信息检索,提问标识,标引标识,从信息资源管理的角度讲,信息检索是从已存储 的信息资源中检索出与用户提问相关的文献、知识、事实、数据的逻辑运算和技术操作过程的总和,以文献检索为本源。是一种从大量集合的文献中查找出主题及其属性符合用户要求的情报过程。查找的对象不一定就是文献,有时也可能是正在研究中的项目,或正在进行某项工作的人员与机构,或图书馆的藏书目录等,但基本原理是一致的。,用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。如何保证存储和检索联系一致?(检索语言),三、信息检索的类型,1 按检索对象分数值检索 特征:以特定的数值为检索对象。 比如,查找某一统计数据,某一数学公式,某一材料的成分、性能,某种元件的型号、参数等。解决方案:利用手册、年鉴等参考工具书或数值型数据库来检索。,事实检索特征:以特定的事实为检索对象。 比如,查找名词术语的解释,了解某人或某机构的简况,或考证某一事件发生的前因后果等。解决方案:利用辞典、百科全书、年鉴、名录等参考工具书或事实型数据库来检索。,文献检索特征:以特定的文献为检索对象。 比如,查找有关某一研究课题的一定年限内的相关文献,或从事一项发明创造而需要文献查新等。解决方案:利用文摘、题录等各种手检工具书或书目文献型数据库来检索。,2 按检索手段分,手工检索计算机检索 -光盘检索 -联机检索 -网络检索,四、检索语言,为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。如果没有检索语言作为标引人员和检索人员的共同语言,就很难使得标引人员对文献信息内容的表达和检索人员对相同文献信息内容需求时的表达取得一致,信息检索也就不可能顺利实现。编制检索语言的目的:不但能够保证不同的标引人员描述文献特征的一致性,而且能够保证检索提问词与文献标引词的一致性。,检索语言:标引员与检索员之间的约定语言。提供检索所需的文献特征。检索标识:描述文献特征,且专门用于情报检索的符号。标引:把文献的主题内容和某些具有检索意义的特征,用检索标识表示出来的过程。,检索标识(检索语言),反映文献外部特征检索标识,反映文献内容特征检索标识,著者,文献号(如:专利号、标准号、 报告号、ISBN号、ISSN号),其他(如:题名),分类号,主题词,关键词,规范语言,自然语言,主题词语言,分类语言,1 分类语言,以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。国内外比较重要的分类语言表:国际专利分类表杜威十进分类法中国图书馆图书分类法中国科学院图书分类法等。,主要特点:按学科专业性质集中图书区分不同性质的图书;集中性质相同的图书性质;相近的放在相近的位置;按照远近亲疏的关系把图书组成为一个有条理的体系;提供从学科分类查找图书的途径。,(1)分类法中图法,将图书分为社会科学、自然科学、综合三大类。 类目展开之式见下图。分类标识即分类号,由字母和数字组成采用等级列举表达从属关系上位类目与下位类目的关系:上位类目一定能包含其各个下位类目,而下位类目一定带有上位类目的属性。分类号越长,表示的学科范围越窄。为了清楚醒目, 通常在分类号的第三位数字后,隔以,如F279.712,TQ032.4,中图法的分类原则,根据当前社会科学和自然科学所包括的学科多、发展快等特点,按图书学科内容作为分类的主要标准与依据。将图书在五个基本部类的基础上分为22个大类,分别以拉丁字母AZ表示。,R,S,T,医药、卫生,农业科学,工业技术,社会科学,自然科学,机械、仪表,建筑科学,综合,一般工业技术,矿业工程,石油,冶金工业,无线电、电子学、电讯技术,自动化计算,化学工业,轻工业、手工业,金属学,武器工业,动力工程,原子能技术,电工技术,水利工程,实例:按中图分类法检索,1 检索各类期刊目录http:/ 检索图书http:/ (赢海书店),(2)中图法索书号(call number),反映了图书的具体排列次序和存放位置组成:分类号书次号分类号:按学科分类图书书次号:区分同类图书,两种取法:种次号:按图书到馆的先后顺序给予号码。缺点:会使同一著者的同一类著作排放在不同位置。著者号:按著者名称(代码)来区分同一分类号下的不同文献。,索书号是识别一种图书的唯一标识,图书馆同一分类号的文献数量很多,为了区别相同类号的文献,在分类号的基础上,又给了一个区分符号,这个符号称之为书次号。书次号与分类号一起共同构成索书号。图书馆的文献就是按照索书号的顺序排架管理的。 中文书索书号如:TP312/ 39, 西文书索书号如:O6/ FC56,(3)中图法图书的排架顺序,按索书号排架 先顺序分类号,对位排列 再顺序书次号种次号:由数字构成,按数字大小顺序著者号:由字母和数字构成,对位排列,2 主题词语言,用文字符号表示文献主题的检索标识。 三个基本特征着眼于从事物的特性方面去提示文献主题 采用文字符号按字顺排列,(1)主题词语言种类,关键词语言直接从文献题名、文摘或正文中抽取出来的未经规范化处理的词。是一种用自然语言做标识的检索语言。单元词语言是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。叙词语言从自然语言中优选出来并经过规范化处理的名词术语。采用表示单元概念的规范化语词的组配来对文献内容主题进行描述的检索语言,是目前使用最广泛的主题语言。标题词语言最早使用的一种主题语言。以规范化的自然语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母顺序排列。表达主题的词语称为标题词。,(2)与分类语言区别,(3)关键词(keyword),直接来源于从文献篇名、正文和文摘 为具有实际意义的词语, 禁用词(stop- term)如冠词,介词,副词等除外 关键词法属自然语言,关键词问题,问题一:同义词标引-引起漏检主题 检索体系是按主题词字顺排列的,而用于标引的关键词呈现出多种字面形式同义词时,将使同一主题的文献分散到不同的字顺位置,使查全率受到影响。 例:飞机 Airplane Aircraft Planes,问题二:多义词标引引起误检 多义词 cell 电池 两个完全不同的概念 细胞 检索词 cell 查找细胞方面的文献结果: 电池、细胞两方面的文献同时被检出,关键词问题的解决方案主题词的规范化,为了避免上述现象,采用规范化的词进行标引。 所谓规范化,即词和概念一一对应,一个词表达一个概念。,(4)单元词,词义已是单元概念不可再分 规范词 例:单元词汽车,温度表,电动机 非单元词载重汽车 载重工具 汽车,(5)标题词,一组固定组配的规范化主题词组配:是指将两个或多个主题概念,按一定的规则复合起来,以表达一个更专指的主题概念 标题词有两级:主标题词:表示事物、概念副标题词:限定修饰主标题词,说明主标题所涉及的方面。 例:计算机科学发展趋势,主标题词除用单个名词或动名词外, 还有下列三种形式:正叙式倒叙式并列式,主标题词正叙式,正叙式:直接采用事物的名称、现象、方法或过程等词。 例如: COMPUTER PROGRAMMING LANGUAGES(计算机程序语言) ELECTRIC POWER SYSTEMS(电力系统) ELECTRON GUNS(电子枪) IMAGE PROCESSING(图像处理) MATERIALS SCIENCE(材料科学),主标题词倒叙式,倒叙式:将事物的名称放在前,后加修饰性的词说明其范围。 例如: COMPUTER,ANALOG(模拟计算机) COMPUTER, DIGITAL(数字计算机) OSCILLATORS,MICROWAVE(微波振荡器),主标题词并列式,并列式:将各自独立但又有某些联系的事物或概念并列起来。 例如: PATENTS AND INVENTION(专利与发明) ROCKET AND MISSILES (火箭与导弹) SILICON AND ALLOYS (硅和硅合金),标题词与关键词、单元词的不同,标题词与关键词和单元词都有明显的不同,它不是用一个词而是用一对词来表现主题概念,而且这一对词的组配关系是固定的。,(6)叙词,指采用表示单元概念的规范化词语的组合来对信息主题或内容进行描述。从自然语言中优选出来的经过规范化出来的名词术语。 来源:是指一些以概念为基础、经过规范化处理、具有组配功能的动态性的词或词组。叙词语言的最主要的特征: 规范化 概念组配,国内外常用的叙词表主国有:1.英国科学文摘使用的INSPEC叙词表2.美国工程索引使用的COMPENDEX叙词表3 .我国的汉语主题词表,(7)主题标引,赋予二次文献检索标识主题词主题标引的步骤:分析文献内容 形成主题概念 标引主题词 将标引主题词按字顺排列 使论述同一主题内容的文献集中在一起显然,一篇文献所要表达的主题概念或要涉及的问题通常不止一个,所以与分类号不同,标引一篇文献的主题词通常不止一个。,(8)主题词表,图书分类法 分类表主题标引 主题词表 单元词表、标题表、叙词表在叙词法中,文献的主题概念可以用多个叙词表示,因此可以形成任意合乎逻辑的组配和众多的检索途径。很适用于计算机情报检索。,依据,利用分类途径查找信息的步骤,分析研究所需要查找信息的内容主题;判断该主题在分类法中属于哪一大类,然后再从大类一级一级往下寻找,直到查到具体类目(或有关类目),记下类号为止;根据检索到的类号在检索工具中检索,便可查得所需信息。,利用主题途径查找信息的方法和步骤,对研究课题进行分析主题分析;将所得出的主题概念转化成主题词,利用主题词表找出相应的主题词;再按查出的主题词字顺去翻检目录、索引或输入计算机数据库;要注意选取最专指的主题词,再利用主题词找出相应的主题词;应将主标题与副标题,说明语联系起来;在使用关键词检索信息时,除了使用某一常用的关键词外,还应当使用该词的同义词、近义词作为检索入口。,五、文献检索方法,1 追溯法(回溯法) 以文献后面所附的参考文献为线索的查找方法;缺点:方法查全率低,目前罕有人用。,追溯法实施方法:从已有的文献后面所附的参考文献入手,逐一查找全文,再从这些原文后面所列的参考文献逐一追查,不断扩大检索线索,从而获得一批相关文献信息的查找方法。,2 工具法(常用法),利用文摘、题录或索引等检索工具来查找文献的方法,也称工具法。按所查文献的顺序,可分为:顺查法倒查法抽查法 手头文献日期 过去 现在 倒查 顺查,(1)顺查法以检索课题的起始年代为起点,按时间顺序由远及近的查找方法,直到查得的文献可以满足要求为止。适用于无综述性文献可参考时使用。特点:查的文献较完整,查全率较高,但工作量大, 效率不高。,(2)倒查法由近到远,重点放在近期的文献,以便掌握最近一段时间该课题所达到的水平及方向。多用于新课题,或老技术的新发展,从新情况开始查到一定的基本资料时为止。特点:省时,查全率不高。,(3)抽查法针对学科发展特点,抽出其发展迅速、发表文献较多一段时期,逐年进行检索的一种方法。(选查发展旺盛时期的文献。)适用于:对该学科或课题的发展熟悉的情况。特点:节约时间,但可能会漏检。,3 交替法(综合法),结合追溯法和常用法,先利用检索工具查出一定时期内的一批有用文献,在利用这些文献后面的参考文献,追溯查出前一时期内的文献,如此循环交替的使用两种方法直到满足要求为止。特点:检索效率高,检索效果好。,4 检索方法的选择原则,检索条件如果没有检索工具可供使用,宜采用追溯法;如果有现成检索工具可供使用,宜采用工具法。检索要求如果检索时间充裕,可采用顺查法;如果检索时间紧迫,宜采用倒查法。学科特点新兴学科,一般采用顺查法;年代久远(或无法查考)的学科,只能采用倒查法。,5 文献检索四点要求,(l)准,高的查准率。(2)全,高的查全率。搜集的资料不仅有正面的,也有反面的,既有纵向的也有横向的,既有中文的也有外文的,既全面又系统。 (3)深,占有情报的多样性及内容的专深。 (4)快,要迅速。一个准确度高、有价值的情报资料,如果检索速度慢了,耽误了时机,就会失去它的应有价值。,六、文献检索途径(检索点),1 题名途径利用图书、期刊、资料等的题目名称对文献进行检索的途径。包括文献篇名、图书书名、期刊刊名。常见的题名索引主要有篇名索引、书名索引、刊名索引等。题名索引通常按字顺排检方式,因此,检索也应该采取相应的途径。一般多用于查找图书、期刊、会议名称。常用于目录性检索工具/系统,如书名目录期刊目录期刊联合目录等。,2 著者途径用文献的著作者、编者、译者的姓名或机构团体名称编制 检索特定的个人或团体所生产的文献。检索中,著者是一个广义的概念,是对文献内容负有责任的作者、编者、译者等,可以是个人、团体、机构、组织,甚至还包括著者的单位。通过著者途径进行检索,主要可利用著者索引。所有著者索引都采用字顺排列方式,如果著者是个人,就以个人姓名字顺排列,如果著者是机构,就以机构名称字顺排列。因此,检索也应该按相应的途径。,一般检索系统都有著者(个人)索引,有的还有团体著者(机构)索引,均按字顺编排,其下为记录个数或文摘号。在利用内容途径查文献有困难时,如一些新近发展起来的学科或技术,往往难于确定类目或检索词,使用著者途径查找文献就显出其优越性,但该方法不能满足全面检索某一课题文献的需要。,使用著者途径应注意: 书写格式:姓前(全称)、名后(缩写,即用首字母) Willian Henry Harrison Harrison W H,3 分类途径以文献的内容在分类体系中的位置作为文献的检索途径,它的检索标志就是所给定的分类号码。大多数检索工具都采用分类语言作为正文编排体系的依据,分类目次通常不采用字顺排列类目和检索类目,而是按照学科专业角度的层层逻辑划分建立分类类目体系。检索时要选择合适的分类类目。,4 主题途径通过表达文献的内容实质,经过规范化的名词或词组来检索文献,检索时直接按主题词的字顺,像查字典一样,即可查到某个特定主题的文献。 主题索引大多按字母排列方式。,EI主题词表,5 关键词途径 按照文献题目或内容中具有实际意义并能表述文献的主要内容、起关键作用的词或词组,从关键词的字顺检索系统中检索的途径。 关键词是指表示文献主题意义的由作者使用的名词或词组。,示例,6 序号途径通过已知号码查找文献的途径,如报告号、专利号、标准号、会议号等。序号索引一般按照文献序号的大小顺序排列,如文献序号纯粹由数字组成,就按数字大小生序排列,如果序号包含数字和字母,就按数字大小和字母顺序升序排列。如果前面是字母后面是数字混合组成的序号,就先按字母顺序排列,字母相同,再按后面的数字大小排列。因此,序号检索也应按照同样方法。,7 引文途径文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称之为引文系统。它提供从被引论文去检索引用论文的一种途径。,8 专门项目途径 从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。,七、文献检索的常用途径,1 题名 :注意题名关键词的排序特征2 作者 :通常按姓在前名在后方式检索3 分类 :我国高校与公共图书馆的文献资料,一般采用中国图书馆图书分类法(简称中图法)进行分类。4 主题词:主题是指表征文献内容特征、经过规范化的名词术语。检索者通过检索这些规范的词语来找到所要的文献和情报。 化学化工主题词表,5 关键词:直接从文献的篇名或文摘或全文中抽取出来的非规范化检索词。6 顺序号检索:专利号,标准号,研究报告号。 7 全文检索 8 引文检索,八、选择检索途径的原则,1 从已知文献特征选择检索途径 如已知文献题名、作者姓名或文献代码等条件,则选择相应的检索途径。2 从课题检索要求选择检索途径 根据课题检索的专指程度要求来选定检索途径。,九、文献检索工具,含义:用来报道,存储和查找文献的印刷型出版物或数据库系统。文献检索工具是指对体积庞大、无序的一次文献经过加工压缩而成体积较小的二次文献,再根据一定的原理和规则编制而成的工具。可满足各种用户的不同层次的检索需求。是科学家和文献专家对原始文献进行收集、加工、分析,并给出有效的检索途径而形成的工具。,1 检索工具类型 检索工具可以依据不同的标准来划分,根据著录内容可划分为以下四种: 1)目录 ( catalog ) 目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。 目录类型: 馆藏目录:反映一个图书馆文献收藏情况的目录。 中国国家图书馆 http:/ 联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。 全国中西文期刊联合目录http:/159.226.100.50/catalog/default.htm CALIS联机公共数据库 http:/,按出版类型划分:图书目录、期刊目录、会议论文目录。按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录(OPAC ,Online Public Access Catalog )等。 目录示例: 可参照图书馆主页熟悉了解。,OPAC :是指以计算机编码形式存贮在计算机系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。,2)题录 ( bibliography 、bibliographic、citation ) 题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。 示例1:,题录示例2:Ei CPX Web (工程索引网络版记录题 录显示格式),文摘示例1:,3) 文摘 ( abstract ) 文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。,文摘示例2:Ei CPX Web (工程索引网络版记录文摘显示格式),4) 索引 ( index ) 索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点。 索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。 最常用的索引是主题索引、分类索引和著者索引等。,索引示例:Ei CPX Web (工程索引网络版索引显示格式),目录:以一件或一种完整的出版物,如一本书、一份科技报告、一种期刊等作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。题录:以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。文摘:在题录的基础上,在每条著录款目后边再加上文献内容的摘要。索引:一种广泛存在于各种检索工具以及各种文献中的附属检索工具。,网络信息检索工具 搜索引擎( Search Engine ) 含义:就是这样一些Internet上的网站,它们有自己的数据库,保存了WEB上的很多的网页的信息,用户可以访问它们的主页,通过输入和提交一些有关你想查找的信息的关键字,让它们在自己的数据库中检索,并返回给你可能感兴趣的网页地址和内容描述。与普通网站不同的是,搜索引擎网站的主要资源是它的索引数据库,收集了全世界成百万上千万个网站和网页的信息,存储在可供检索的大型服务器中,建立索引和目录服务。 主要功能:是为人们搜索Internet上信息并提供获得所需信息的途径。 “搜索引擎”也就是指充分利用各种网络自动搜索技术,对网络信息资源提供强有力检索的工具。,国内外有名的一此搜索引擎站点: 百度:http:/ 搜狐:http:/ 悠悠:http:/ 雅虎中国:http:/ 常青藤:http:/ OCLC中的WorldCatEI中的Sircushttp:/http:/ 天网资源,十、文献检索应注意的问题,注意每种检索工具的条件:收集文献的起止时间、专业范围。注意每种工具各有侧重,必须根据自己的课题或文章加以选择。不同方法的索引,如按关键词索引、主题词索引、著者索引各有优缺点。各种索引工具都有不同的索引方法,必须根据其指导。二次文献,必须找出原文,不能作为参考文献。,十一、检索作业,1.自定某一名人或某一机构,利用人名录或机构名录的数据库或网站,查其基本信息。记录网址、检索方法和检索结果。2.检索一本与你所学专业有关的图书,并写出检索步骤及该图书的外部特征。3.试查下列图书ISBN号与书名 高等教育出版社,黄梯云主编,2005 电子工业出版社,吴玲达等编著,2004,文献的特征,1 外表特征表征一篇特定文献的特征可以在文献的封面或扉页,不打开书本或看不到文献的具体内容就可以确定一篇文献。 例如: 题目 作者 作者工作单位 专利号 科技报告号,2 内容特征深入到文献内容中去才可以确定一篇文献。主题词标识:在文献中出现的频率既不高也不低的词,在文献中约320个之间,这些词与文献的主题相关度较大,称之为文献的主题词或关键词。分类标识:一篇文献按各种自然科学和社会科学的分类方法进行归类。,一般,一篇文献都是论及某一方面的特定问题的,也就是说,与论题相关的词出现的频率较大。以前的研究表明,无论哪一种类型的文献,若对文献中出现的词进行频率统计的话,会发现所有的词可分为三类:i.文献中出现频率最高的词:冠词、介词和连词等,其本身并没有具体含义,如a、an、the、this、that、or、and、with等;ii.文献中出现的频率较低的词:绝大部分词属于这种情况iii.在文献中出现的频率既不高也不低的词: 在文献中约有3-20个之间,这些词恰恰是与文献的主题相关度较大的词,我们称之为文献的主题词或关键词。,文献特征与文献的对应关系,文献的外表特征与文献是一一对应的,即一组外表特征只对应一篇唯一的文献文献的内容特征与文献却是一种模糊的对应关系,即一篇文献有多个主题词(关键词)或分类号,一个主题词(关键词)或分类号也可对应多篇甚至几百篇文献利用外表特征只能检出较少的文献,有时只用于特定情况下(如已经知道作者名等)。利用内容特征一次则能检出一批文献。,外表特征:标题、作者、作者工作单位等 精确对应文献特征 文献 主题特征:主题词、关键词等 内容特征 模糊对应 分类特征:分类号,文献特征与文献关系,

    注意事项

    本文(第2讲 文献信息检索基本原理ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开