搜索文献-EPS

用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响，自动标引中运用的词典查找算法有其自身的特点，符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后，提出了一种通用而高效的词典组织方法。采用这种方法的词典，其体积可以减小到原来的０．４倍，分词速度提高到原来的２．５倍。

关键词：自动标引时间效率自动分词字串结构研究中文词分词方法空间效率索引文件组织结构

汉语文献字处理抽词

[期刊] 情报理论与实践 [作者] 欧金森

论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手，利用语法关系去掉目标词外围的词和字，同时注意区分去留字和词间的切分点，从而提高抽词效果。这种字处理运行机制的算法，为汉语主题抽调提出了新方法，并可与位控赋词并联运行，构成一整套字处理取词系统。

关键词：自动抽词,自动标引,汉语文献,计算机辅助标引

基于EM算法的汉语自动分词方法

[期刊] 情报学报 [作者] 李家福张亚非

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。

关键词：分词汉语 EM算法语料库 HMM

基于神经网络的汉语自动分词系统的设计与分析

[期刊] 情报学报 [作者] 尹锋

应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手，阐述了基于神经网络的汉语自动分词系统的设计方法，较详细地介绍了该系统的实验结果，并给出了必要的分析。

关键词：神经网络,汉语分词

汉语分词技术综述

[期刊] 图书情报工作 [作者] 熊回香夏立新

首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。

关键词：汉语自动分词中文全文检索文献自动标引自然语言检索

基于CRFs和词典信息的中古汉语自动分词

[期刊] 数据分析与知识发现 [作者] 王晓玉李斌

【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词

关键词： CRFs模型分词一致性中古汉语自动分词

基于两字词簇的汉语快速自动分词算法

[期刊] 情报学报 [作者] 郭祥昊钟义信杨丽

本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占７５％的统计规律，提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理，也就是把长词的扫描范围限定在词汇量很小的词簇内，从而不仅提高了分词速度，而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外，本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现

关键词：自然语言处理,分词算法,切分歧义

全文检索中的汉语自动分词及其歧义处理

[期刊] 中国图书馆学报 [作者] 熊回香

歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。

关键词：全文检索汉语自动分词歧义处理 t-信息差专家系统

基于知识评价的快速汉语自动分词系统

[期刊] 情报学报 [作者] 张民李生王海峰赵铁军王铁志

汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个，一个是切分的速度，一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法，可大大提高系统的切分速度，而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后，本文对消歧提出了一些设想。

关键词：汉语自动分词,歧义,平价函数,词规则

文献题名自动抽词——分类标引系统

[期刊] 图书馆杂志 [作者] 张琪玉

本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。

关键词：汉语自动抽词标引系统自然语言检索法

浅析现代物流技术发展趋势

[期刊] 物流技术 [作者] 王成林任亚男

随着整个社会经济形态的转变,社会对物流产业的需求定位也在不断地发生变化,同时对物流产业内涵和外延理解也进一步地深入。目前物流产业已经成为国民经济的重要战略支撑产业和先导性产业,是现代服务业的重要组成部分,通过物流产业带动、促进、推的

关键词：产业内涵先导性产业现代物流技术需求定位装卸搬运设备战略支撑物联网立体仓库测绘科学交通运输工程

汉语文本结构的自动分析

[期刊] 情报学报 [作者] 薛翠芳郭炳炎

本文试图运用向量空间模型来确定文本段落之间内容的相关性 ,从而实现文本主题的自动分析 ,找出构成文本大主题的各个小主题 ,从这些小主题入手来实现自动文摘 ,可为自动文摘技术探索一条新途径。另一方面 ,通过文本结构的自动分析 ,可确定文本结构的类型 ,也为全文检索等信息处理技术提供一些有用的信息

关键词：文本结构向量空间模型自动文摘

浅析地方文献的分类标引——以首都图书馆为例

[期刊] 图书馆杂志 [作者] 郑春蕾

从比较地方文献与普通文献的差异入手,对地方文献的分类标引特点进行了分析阐述;并以首都图书馆采用《北京地方文献分类表》对北京地方文献的分类标引实践为例,分析其利弊,并针对存在的问题提出相应的改进措施。

关键词：北京地方文献分类标引事物型分类

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于支持向量机和核心特征词的科技文献自动标引研究先秦两汉语文教育的历史发展研究——评《先秦两汉语文教育史》汉语词切分标引算法的改进中文文献主题的自动标引基于词形的汉语文本切分方法受控标引在文献数据库中应用和发展的调查分析浅析文化词在少数民族汉语教学中的地位及意义——以汉语熟语为例面向领域文献的无监督中文分词自动优化方法汉语文古籍文献目录资源的共建共享——CALIS古籍联合目录系统汉语文古籍文献书目数据库建设管见