- 年份
- 2024(2440)
- 2023(3830)
- 2022(3264)
- 2021(3194)
- 2020(2624)
- 2019(6029)
- 2018(6034)
- 2017(10771)
- 2016(6404)
- 2015(7228)
- 2014(7443)
- 2013(7169)
- 2012(7085)
- 2011(6327)
- 2010(6736)
- 2009(6241)
- 2008(6732)
- 2007(6215)
- 2006(5573)
- 2005(5059)
- 学科
- 济(23229)
- 经济(23191)
- 管理(17180)
- 业(14795)
- 企(12495)
- 企业(12495)
- 方法(10515)
- 数学(8572)
- 数学方法(8338)
- 学(7845)
- 财(6547)
- 中国(6445)
- 农(6205)
- 理论(5750)
- 制(5033)
- 业经(4836)
- 务(4222)
- 财务(4209)
- 财务管理(4195)
- 贸(4178)
- 贸易(4174)
- 教育(4105)
- 教学(4067)
- 地方(4058)
- 易(4032)
- 农业(4021)
- 银(4011)
- 银行(3988)
- 企业财务(3965)
- 融(3923)
- 机构
- 大学(97614)
- 学院(95385)
- 研究(34880)
- 济(31392)
- 管理(30600)
- 经济(30522)
- 中国(26215)
- 理学(25585)
- 理学院(25137)
- 科学(24526)
- 管理学(24233)
- 管理学院(24058)
- 京(22157)
- 农(20137)
- 所(19374)
- 研究所(17497)
- 江(16451)
- 财(16177)
- 农业(16106)
- 中心(16050)
- 业大(16042)
- 范(14860)
- 师范(14645)
- 北京(13931)
- 州(12979)
- 财经(12575)
- 技术(12304)
- 院(12303)
- 省(11989)
- 师范大学(11865)
- 基金
- 项目(59994)
- 科学(45360)
- 基金(42278)
- 研究(40793)
- 家(38504)
- 国家(38162)
- 科学基金(31136)
- 社会(23873)
- 省(23168)
- 社会科(22416)
- 社会科学(22407)
- 基金项目(21719)
- 自然(21304)
- 自然科(20847)
- 自然科学(20837)
- 自然科学基金(20454)
- 划(20202)
- 教育(20188)
- 资助(18344)
- 编号(16638)
- 成果(15358)
- 重点(13886)
- 部(12915)
- 课题(12291)
- 计划(11888)
- 发(11834)
- 创(11627)
- 科研(11616)
- 大学(11326)
- 创新(10939)
共检索到152805条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 情报学报
[作者]
牛耘 朱献有
针对目前汉语自动分词系统中切分歧义的难点,本文提出利用神经网络模式识别的方法帮助消歧。介绍了所建立的实验系统,并进行了实验分析。
关键词:
切分歧义,神经网络,模式识别
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 情报学报
[作者]
张翠英 亢临生
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上,根据大量的真实语料中出现的歧义现象,把可能产生歧义切分的词进行特性分类,对每类确定一组规则进行处理
关键词:
歧义,分词特性,分词系统
[期刊] 图书情报工作
[作者]
王丹 杨晓蓉
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。
[期刊] 情报理论与实践
[作者]
颜端武 任婷 陶志恒
[目的/意义]为了增进知识交流、知识共享,避免专利侵权,研究了基于双语词典和歧义消解的中英双语专利信息检索方案,并将其应用到实际系统开发中。[方法/过程]通过基于双语词典的提问式翻译实现双语专利检索,利用基于潜语义分析的提问式消歧策略进行歧义消解,结合布尔检索模型与向量空间模型构建检索表达式,与专利索引库进行匹配,生成检索结果。[结果/结论]选取"3D打印"领域中英双语专利语料为样本,通过检索实验证明方案的有效性。
关键词:
专利信息 信息检索 双语词典 歧义消解
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 情报理论与实践
[作者]
陆勇 侯汉清
为了提高同义词自动挖掘的效率,本文提出了从词典释义中自动识别和挖掘同义词的方法,使用超链接分析算法和模式匹配算法,从不同的角度提取同义词:第一部分是把词汇之间注释与被注释的关系看成是一种链接关系,对给定的词汇进行分析,把与给定词汇具有链接关系的所有相关词汇构造一个词汇图,图中的每一个节点代表相关词,每条弧代表了词汇之间注释与被注释的关系。利用超链接分析方法并结合PageRank算法,计算词汇的PageRank值,把PageRank值看成是体现词汇之间语义相似性的衡量指标,最后为每一个词汇生成候选同义词集,并通过一定的筛选原则和方法,推荐出最佳的同义词。第二部分是利用词汇定义模式,对词汇的释义方...
[期刊] 情报理论与实践
[作者]
刘华梅 侯汉清
随着计算机的飞速发展,自然语言越来越广泛地应用于情报检索,同义词控制问题也成为情报学的研究热点。本文提出一种识别同义词的方法,这种方法基于检索网络搜索得到的统计数据,使用Dice测度方法测量两个词的相关度,相关度在给定的阈值内就可以认为是同义词。通过分析测试结果,验证这种方法的可行性,并提出了这种方法的优缺点及其应用。
关键词:
信息检索 搜索引擎/同义词识别
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 情报学报
[作者]
王源 秦聿昌 刘滨
提出了汉字全文检索系统的新的数据结构、建库和检索的算法,完成了程序设计、用于对中国化学文献数据库标题和文摘的检索,测定了索引建立时间、空间消耗和检索的响应时间,计算了每篇文献的长度在不同范围时的高频字数和索引空间消耗,讨论了索引膨胀比与文献长度的关系
关键词:
全文检索,算法研究,数据结构,文献数据库
[期刊] 情报理论与实践
[作者]
汤艳莉 耿骞
对汉语自然语言检索中的句法分析方法进行了探讨。自然语言检索中的一项重要工作就是对用户提问进行处理 ,而句法分析既是对用户提问进行处理的必须环节 ,也是对源文本分析的一个重要方法。本文探讨了基于局部分析的方法 ,并给出了相关的数据结构和处理流程。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除