一、计算机检索中的检索单元(论文文献综述)
俞平[1](2011)在《信息检索中文献漏检误检因素分析》文中指出文章分析了信息检索中文献漏检和误检的因素,从数据库的选择、检索词的确定、检索策略的制定等方面提出了避免漏检误检的对策。
李静[2](2009)在《基于概念匹配度模型的文献检索系统》文中进行了进一步梳理在传统的手工文献检索中,科技文献的标引和检索都是人工完成的。随着电子文献的增多,手工处理文献已经显得力不从心,为了对大量的文献进行自动处理,从文献的标引到检索都要用计算机进行处理,从而大大增加了文献处理的数量和速度。信息检索系统经过几十年的发展,取得了长足进展,从基于简单好用的布尔模型的检索系统,到基于向量空间模型、概率模型的检索系统,使信息检索的精度不断提高,但是不同的检索系统对不同的文献会显示出不同的性能。为了提高文献信息检索系统的针对性,对现有检索系统进行改进以适应中文科技文献,是很实用和必要的。如何完善网页文档的表示方法使之更加准确的表示网页的实际内容;如何改进网页文档与用户查询的匹配方法,使得文献检索返回的网页更加符合用户的要求这些都关系到了文献检索的精确率的提高。本文采用了概念格理论从概念的角度去分析网页文档的表示问题,将查询与返回的文档都映射到本体后,我们再由它们共同构成的形式背景构造出概念格,在概念格上就可以找到用户提出的问题的相应的概念节点,用概念匹配度就可以计算出任意其它概念节点与问题概念节点之间的匹配度。最后按照与概念节点的匹配度排序,从而可以找到最满足用户查询的答案。这就是本文第3章提出的基于概念匹配度模型的文献检索系统。同时考虑到为整个待查询数据库建立一个单一的大概念格,所花费时间及格之间移动开销非常大等问题。第4章中给出了一种文档的新的表示形式,从而提出了一种新的网页文档与用户查询的匹配策略——基于概念格匹配度模型的文献检索系统,提高了文献检索的查询质量。通过实例证明,改进后的匹配模型更符合人脑的思维方式,符合人们对概念的理解,具有可行性。
张丽君[3](2008)在《文献信息检索技术综述》文中研究表明介绍文献信息检索技术的发展过程,分析了网络文献信息检索的主要技术方法,以及今后文献信息检索的发展趋势。
潘瑞冰[4](2006)在《论网络信息的自然语言检索》文中研究表明分析了网络环境下信息检索在检索方法、用户和检索语言三个层面的变化,论述了现阶段自然语言在情报检索中应用的方法,剖析了现阶段自然语言检索的实质,阐述了自然语言检索的优化策略。
赵爽[5](2006)在《基于贝叶斯网络的结构化文档检索》文中进行了进一步梳理传统的基于关键词匹配的信息检索方法采用单一、表面化的模型,仅用单一的术语来对信息资源进行检索,返回的结果在查全率和查准率上都往往无法满足检索者的需求。同时大量研究结果表明,在检索过程中引入术语之间的关系可以提高检索性能。 贝叶斯网络是一种不确定性知识表达与推理模型,是现阶段处理不确定信息技术的主流,而且以其良好的知识表现形式和处理不确定性问题的能力在信息检索领域已经有了比较广泛的应用。特别是它能够精细的表示文档的结构,因此适合于应用到信息检索新的研究分支——结构化文档检索中。 本文利用共现分析方法挖掘文档集合中术语之间的相关关系,并将其引入到了结构化文档检索中,提出了一个基于贝叶斯网络的结构化文档检索模型,给出了该模型的拓扑结构,各层结点的概率估计方法以及完整的推理过程。共现分析方法是传统信息检索中建立概念空间方法的核心部分,为了使其适用于结构化文档检索,本文对该方法中一些公式进行了相应修改。最后经过实例分析表明,本文提出的模型能够有效地提高检索性能。
张彩莲[6](2005)在《网络环境下主题语言的应用》文中认为文章主要论述了网络环境下主题语言在计算机检索中的地位和作用,指出了主题语言在网络环境下的发展趋势。参考文献3。
邹瑾[7](2004)在《网络信息组织中主题组织法性能优化研究》文中研究表明新的网络信息环境不仅为信息的存取和获取提供了新的渠道,也在很大程度上改变着人们信息存取的思维与方式。在网络信息环境中,人们面临着网上数字化信息的急剧增加与用户对信息的特定需求之间的矛盾,信息组织的任务异常艰巨。将知识组织和情报检索语言的思想及原理运用到网络环境中,能使网络信息组织和检索的效率大大提高。主题组织法历来是检索语言的重要组成部分之一,应用前景十分广阔,尤其是在网络信息组织和检索领域,这与其固有的性能优势是分不开的。然而,在主题组织法的概念、类型和应用模式等发生改变的同时,其性能也在随之而改变。性能上固有的优势和积极的调整是主题组织法在网络环境下生命力不断进发的真正原因,它决定了主题组织法的不可替代性。同时,性能上的不足和缺陷更是主题组织法寻求突破的关键,找出其性能改进的切入点,对主题组织法的未来发展具有深远的意义。 本文从网络环境下主题组织法的应用现状入手,较系统、深入地探讨了网络环境对主题组织法性能的影响及主题组织法性能的发展,在进行了一系列主题组织法性能测度实验的基础上,总结了目前主题组织法性能上存在的优势和不足,并结合考察实践对当前网络信息环境下主题组织法的性能优化措施提出了实施原则及应当注意的问题。 全文共分为5个部分: 1.网络信息组织概述。网络信息资源数量急剧增加,信息组织的重要性越来越突出。然而网络环境下的信息组织已经超出了传统的非网络信息资源管理方式的覆盖范围,传统的文献组织理论和方法面临着挑战。将主题组织法运用到网络信息组织当中来,是知识组织和情报检索语言的思想及原理移植到网络环境下的成果之一。 2.网络信息组织中主题组织法发展现状。在网络信息组织中,对主题组织法理论和实践的发展而言,机遇与挑战并存。主题组织法在网络信息组织中的发展现状主要表现在以下两方面:首先,传统主题法的标题法、叙词法和关键词仍然在网络信息组织中发挥作用,其性能也大为提高;其次,主题组织法在网络环境下又有新突破,例如:检索语言一体化原理广泛使用,词表技术不断发展且类型趋向多样化。 3.网络环境下主题组织法性能研究。通过对比传统情报检索语言的基本性能、传统主题组织法的性能等,分析了在概念、类型和应用模式等发生改变的情况下,网络信息主题组织法性能的所受到的影响及其变化。 4.网络信息主题组织法性能测评实验。通过一系列的检索实验和实际上网考察,分别对网络信息组织中的搜索引擎的关键词组织法、网络联机受控词表、网络数据库中的主题组织法和一体化医学语言系统的性能进行了测度,总结了各自的性能优势和存在的不足。 5.网络信息主题组织法性能优化的措施、原则及应当注意的问题。在考察主题组织法网络信息检索性能的基础上,总结了多种性能优化措施。结合实际检索及操作的实践,提出了主题组织法性能优化的原则。最后提出了主题组织法性能优化过程中应当注意的一些问题。
李晓艳[8](2002)在《计算机检索中的检索单元》文中认为
武提荣[9](2002)在《分类语言检索率对文献利用率的影响》文中指出阐述了分类语言检索功能不能充分发挥的原因及应采取的措施 ,指出分类检索在机检系统中的应用会大大提高检索效率。
赵勇[10](1998)在《再论计算机检索技巧——兼与万碧君等同志商榷》文中提出 万碧君等同志在《计算机检索技巧的探讨》(以下简称《探讨》)一文中,介绍和总结了常用的计算机检索的技巧,这对帮助那些刚开始利用计算机检索的人员提高检索效率是很有裨益的。
二、计算机检索中的检索单元(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、计算机检索中的检索单元(论文提纲范文)
(1)信息检索中文献漏检误检因素分析(论文提纲范文)
1 数据库的选择 |
2 检索词的确定 |
2.1 同义词的检索 |
2.2 反义词的检索 |
2.3 上位词和下位词的检索 |
2.4 使用单元词检索, 慎用短语和词组 |
2.5 忌用自造词检索 |
2.6 注意错别字的检索 |
2.7 外来词的检索 |
2.8 截词检索 |
3 检索策略的制定 |
3.1 理解课题主要内容及技术路线, 弄清主题概念之间的逻辑关系 |
3.2 合理使用位置算符 |
3.3 避免地域名限制 |
3.4 检索策略的调整和优化 |
(2)基于概念匹配度模型的文献检索系统(论文提纲范文)
中文摘要 |
英文摘要 |
目录 |
第1章 绪论 |
1.1 论文选题的背景和意义 |
1.2 信息检索的类型与发展 |
1.2.1 信息检索的类型 |
1.2.2 信息检索的发展 |
1.3 国内外研究动态 |
1.3.1 文献检索的发展现状 |
1.3.2 文献检索的发展趋势 |
1.4 本文的主要工作 |
第2章 文献信息检索模型 |
2.1 文献信息检索模型的定义 |
2.2 基本概念 |
2.2.1 关键词 |
2.2.2 权值 |
2.2.3 停用词 |
2.2.4 关键词和权值的集合表示 |
2.3 文献检索原理 |
2.3.1 文献信息储存 |
2.3.2 文献信息检索 |
2.4 布尔检索模型 |
2.4.1 布尔检索模型的理论基础 |
2.4.2 布尔检索模型中文献的表示 |
2.4.3 布尔检索模型中查询的表示 |
2.4.4 布尔检索模型的匹配函数 |
2.4.5 布尔检索模型的优缺点及其改进 |
2.5 向量空间检索模型 |
2.5.1 向量空间检索模型的文献空间 |
2.5.2 标引词空间 |
2.5.3 项的权值 |
2.5.4 相似度计算 |
2.5.5 向量空间检索模型的优势与不足 |
2.6 概率检索模型 |
2.6.1 事件空间 |
2.6.2 相似度的计算 |
2.6.3 概率检索模型的优势与不足 |
2.7 本章小结 |
第3章 基于概念匹配度模型的文献检索系统 |
3.1 概念格的相关概念及应用 |
3.1.1 格论基础 |
3.1.2 概念格的基本概念 |
3.1.3 概念格的应用 |
3.2 文献检索系统概述 |
3.2.1 文献的结构分析 |
3.2.2 文献检索语言及其类型 |
3.2.3 文献检索系统及检索工具 |
3.2.4 文献检索步骤 |
3.3 基于概念匹配度模型的文献检索系统 |
3.3.1 构建频繁检索集 |
3.3.2 建立概念格 |
3.3.3 概念匹配度模型 |
3.3.4 文献检索算法 |
3.4 实例 |
3.5 本章小结 |
第4章 基于概念格匹配度模型的文献检索系统 |
4.1 文档的形式化描述 |
4.1.1 新的文档表示 |
4.1.2 一个具体例子 |
4.2 概念格匹配度模型 |
4.2.1 相关度的思想 |
4.2.2 概念格匹配度模型 |
4.2.3 文献检索算法 |
4.3 实例 |
4.4 本章小结 |
第5章 结论与展望 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(3)文献信息检索技术综述(论文提纲范文)
1 前言 |
2 文献信息检索技术的发展过程 |
2.1 手工检索方式 |
2.2 脱机检索方式 |
2.3 计算机联机检索方式 |
3.4 网络化信息检索方式 |
3 网络文献检索的技术方法 |
3.1 逐次顺序查找法 |
3.2 布尔逻辑检索技术 |
(1) 逻辑“与”, 或称逻辑“乘”, 检索表达式为“A and B”。 |
(2) 逻辑“或”, 或称逻辑“加”, “or” (“+”) : |
(3) 逻辑“非”, “NOT”: |
3.3 截词检索技术 |
3.4 加权检索技术 |
3.5 通用字符检索 |
4 文献信息检索的发展趋势 |
4.1 检索智能化 |
4.2 可视化技术的应用 |
4.3 检索多样化 |
4.4 检索简单化 |
4.5 信息提供的深入化 |
4.6 友好化进一步提高 |
4.7 检索多语种化 |
4.8 提供全文检索 |
(4)论网络信息的自然语言检索(论文提纲范文)
1 网络环境下信息检索的三大变化 |
1.1 检索方法层面:由功能单一的手工检索向功能多样的自动化检索发展 |
1.2 用户层面:不再停留在对已知文献的检索 |
1.3 标引语言和检索语言层面:由主题法 (复合词法) 系统向自然语言过渡 |
2 现阶段网络信息的自然语言检索 |
2.1 自然语言在情报检索中的应用方式 |
2.1.1 关键词索引以及以关键词为检索标识的文献题录数据库 |
2.1.2 以“关键词检索+计算机辅助文本浏览”为主要性能的全文检索系统 |
2.1.3 搜索引擎与分类浏览检索并存的网络信息检索系统 |
2.2 现阶段自然语言检索的实质 |
2.2.1 仍是以词匹配为核心的检索 |
2.2.2 同样存在着概念与标识的转换, 转换中存在情报的缺失 |
2.2.3 是基于机器自然语言理解的近似自然语言检索 |
2.3 自然语言在情报检索中应用面临的难题 |
3 自然语言检索方法的优化 |
3.1 基于关键词的网络信息检索的优化 |
3.2 人机结合完善自动标引 |
3.3 使用后控词表 |
3.4 基于语义空间网络的概念检索 |
(5)基于贝叶斯网络的结构化文档检索(论文提纲范文)
第1章 引言 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.3 本文工作和论文组织 |
第2章 信息检索概述 |
2.1 信息检索定义及基本过程 |
2.1.1 信息检索 |
2.1.2 信息检索基本过程 |
2.2 信息检索经典模型 |
2.2.1 基础知识 |
2.2.2 布尔(Boolean)模型 |
2.2.3 向量(Vector)模型 |
2.2.4 概率模型 |
2.3 结构化文档检索 |
2.4 语义检索 |
第3章 贝叶斯网络理论与用于信息检索的贝叶斯网络 |
3.1 贝叶斯网络理论 |
3.1.1 贝叶斯网络的发展历史 |
3.1.2 贝叶斯概率的相关概念 |
3.1.3 贝叶斯网络定义及特性 |
3.1.4 贝叶斯网络的构建方法 |
3.1.5 贝叶斯网络的研究现状 |
3.2 用于信息检索的贝叶斯网络 |
3.2.1 推理网络模型 |
3.2.2 信念网络模型 |
3.2.3 贝叶斯网络检索模型 |
第4章 基于贝叶斯网络的结构化文档检索模型 |
4.1 结构化文档的表示方法 |
4.2 共现分析方法简介 |
4.3 模型的网络拓扑结构描述 |
4.4 结构化文档检索模型中术语权重值的计算 |
4.5 共现分析方法挖掘术语之间的关系 |
4.6 网络中节点条件概率估计 |
4.7 检索过程:网络推理 |
第5章 模型性能分析 |
5.1 数据收集 |
5.2 数据处理 |
5.3 索引过程 |
5.4 推理过程 |
5.5 结果修正 |
5.6 测试结果及分析 |
第6章 总结与展望 |
参考文献 |
攻读硕士学位期间发表论文情况 |
致谢 |
(6)网络环境下主题语言的应用(论文提纲范文)
1 网络环境对传统主题语言的冲击 |
1.1 信息种类繁多、内容复杂 |
1.2 用户成份和检索行为的变化 |
2 主题检索不可取代的地位和作用 |
2.1 自然语言检索和主题检索的比较 |
2.2 网络环境下主题检索的重要地位和作用 |
3 主题语言在网络环境下的应用 |
3.1 主题检索应成为高层次搜索引擎的重要角色 |
3.2 主题检索语言与自然语言检索相结合, 是计算机检索智能化的重要步骤 |
(7)网络信息组织中主题组织法性能优化研究(论文提纲范文)
中文摘要 |
英文摘要 |
0 引言 |
0.1 选题缘起和意义 |
0.2 研究现状 |
0.3 论文研究内容、研究方法与创新之处 |
1 网络信息组织概述 |
1.1 网络环境下信息组织现状 |
1.2 传统情报检索语言在网络信息组织中的应用 |
1.2.1 分类法在网络信息组织中的应用 |
1.2.2 主题组织法在网络信息组织中的应用 |
2 网络信息组织中的主题组织法 |
2.1 网络信息组织对传统主题组织法的冲击 |
2.1.1 网络信息组织要求主题组织法作出新的调整 |
2.1.2 网络环境下主题组织法面临其它信息组织方法的竞争 |
2.2 主题组织法在网络环境下的发展现状 |
2.2.1 关键词法成为广泛运用的“大众化”检索语言 |
2.2.2 标题法的应用实例 |
2.2.3 叙词法的应用实例 |
2.3 主题组织法在网络环境下发展的新趋势 |
2.3.1 检索语言一体化原理的广泛使用 |
2.3.2 词表技术的发展及其类型的多样化 |
3 网络环境下主题组织法性能研究 |
3.1 传统情报检索语言的性能描述 |
3.2 传统主题组织法的性能及指标的研究现状 |
3.2.1 词表性能及其评价指标 |
3.2.2 主题组织法应用性能的评价指标 |
3.3 网络环境对主题组织法性能的影响 |
3.3.1 对联机受控词表性能的影响 |
3.3.2 对主题组织法检索性能的影响 |
3.4 网络环境下对主题组织法进行性能测评应当注意的问题 |
4 网络信息主题组织法性能测评 |
4.1 搜索引擎关键词法的性能测评 |
4.1.1 搜索引擎关键词法检索性能的发展概况 |
4.1.2 搜索引擎关键词法性能测度实验 |
4.2 网络联机受控词表性能测评 |
4.2.1 网络联机受控词表性能指标 |
4.2.2 网络联机受控词表性能测评 |
4.3 网络数据库主题组织法性能测评 |
4.3.1 网络联机数据库主题组织法性能概况 |
4.3.2 网络联机数据库主题组织法性能指标 |
4.3.3 网络联机数据库检索性能测评实例 |
4.4 一体化医学语言系统(UMLS)性能测评 |
4.4.1 一体化医学语言系统(UMLS)的构成及其性能特点 |
4.4.2 一体化医学语言系统(UMLS)的性能测度实验 |
5 网络信息主题组织法的性能优化 |
5.1 网络信息主题组织法性能优化措施 |
5.1.1 文本检索的词汇控制技术 |
5.1.2 后控制词表技术 |
5.1.3 基于因特网数据库的联机词表辅助检索技术 |
5.1.4 一体化原理的扩展及应用 |
5.1.5 网络信息关键词索引技术的发展 |
5.1.6 网络信息检索工具的概念检索 |
5.2 网络信息主题组织法性能优化原则 |
5.2.1 以人为“本”原则 |
5.2.2 适用原则 |
5.2.3 完备原则 |
5.2.4 易用原则 |
5.2.5 简明原则 |
5.3 网络信息主题组织法性能优化中应当注意的问题 |
5.3.1 主题组织新技术新方法的理论归纳 |
5.3.2 网络联机词表更新与保持基本稳定的平衡 |
5.3.3 多媒体素材增加与网络传输质量保障的平衡问题 |
5.3.4 一体化语言系统建设实践 |
5.3.5 积极开展网络信息主题组织法的用户宣传、教育和引导 |
5.3.6 保持主题组织法性能特色与标准化、规范化的平衡 |
5.3.7 主题组织法多样化发展趋势的继续保持 |
5.3.8 主题组织法词表的兼容 |
5.3.9 通过一体化原理的应用加强主题组织法的人工控制 |
参考文献: |
附录: 论文图表索引 |
四、计算机检索中的检索单元(论文参考文献)
- [1]信息检索中文献漏检误检因素分析[J]. 俞平. 情报科学, 2011(08)
- [2]基于概念匹配度模型的文献检索系统[D]. 李静. 西南交通大学, 2009(03)
- [3]文献信息检索技术综述[J]. 张丽君. 四川冶金, 2008(06)
- [4]论网络信息的自然语言检索[J]. 潘瑞冰. 图书馆学刊, 2006(05)
- [5]基于贝叶斯网络的结构化文档检索[D]. 赵爽. 河北大学, 2006(12)
- [6]网络环境下主题语言的应用[J]. 张彩莲. 高校图书馆工作, 2005(05)
- [7]网络信息组织中主题组织法性能优化研究[D]. 邹瑾. 武汉大学, 2004(04)
- [8]计算机检索中的检索单元[J]. 李晓艳. 图书馆学刊, 2002(S1)
- [9]分类语言检索率对文献利用率的影响[J]. 武提荣. 情报杂志, 2002(10)
- [10]再论计算机检索技巧——兼与万碧君等同志商榷[J]. 赵勇. 情报杂志, 1998(05)