- 年份
- 2024(6990)
- 2023(10271)
- 2022(8828)
- 2021(7904)
- 2020(6652)
- 2019(15486)
- 2018(15269)
- 2017(29213)
- 2016(15885)
- 2015(18194)
- 2014(18776)
- 2013(18870)
- 2012(18353)
- 2011(16904)
- 2010(17294)
- 2009(15913)
- 2008(16155)
- 2007(15031)
- 2006(13271)
- 2005(12276)
- 学科
- 济(77349)
- 经济(77280)
- 业(46215)
- 管理(44560)
- 企(35042)
- 企业(35042)
- 方法(29873)
- 数学(25983)
- 数学方法(25773)
- 中国(23150)
- 农(22601)
- 地方(22136)
- 业经(16761)
- 技术(16612)
- 财(15864)
- 农业(15635)
- 学(15527)
- 贸(14409)
- 贸易(14399)
- 易(13881)
- 制(12973)
- 银(12719)
- 银行(12685)
- 融(12490)
- 金融(12487)
- 地方经济(12367)
- 行(12257)
- 和(12007)
- 发(11777)
- 环境(11690)
- 机构
- 学院(242518)
- 大学(241195)
- 济(101472)
- 经济(99195)
- 管理(88979)
- 研究(88323)
- 理学(74677)
- 理学院(73737)
- 管理学(72502)
- 管理学院(72031)
- 中国(66913)
- 科学(55141)
- 京(53057)
- 所(46928)
- 农(46297)
- 财(45059)
- 研究所(42276)
- 中心(40680)
- 江(39851)
- 业大(37237)
- 农业(36351)
- 财经(34850)
- 北京(34227)
- 范(34201)
- 师范(33857)
- 州(31830)
- 经(31371)
- 院(31132)
- 经济学(30857)
- 省(29009)
- 基金
- 项目(151978)
- 科学(117629)
- 研究(112324)
- 基金(106105)
- 家(92580)
- 国家(91749)
- 科学基金(76726)
- 社会(69524)
- 社会科(65894)
- 社会科学(65872)
- 省(61638)
- 基金项目(56199)
- 划(51406)
- 教育(51118)
- 自然(47813)
- 编号(47036)
- 自然科(46641)
- 自然科学(46626)
- 自然科学基金(45765)
- 资助(43391)
- 发(39031)
- 成果(38912)
- 重点(34702)
- 部(33201)
- 课题(33128)
- 创(31969)
- 发展(31299)
- 展(30768)
- 创新(30015)
- 科研(28708)
共检索到384536条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
林春实 方燕 全吉成
本文将汉语自动分词与标引技术的研究归结为机械分词、语义分词和基于神经网络的智能分词三大系列,分析了阻碍汉语自动分词研究发展的问题,并确认了自动分词研究的发展方向。
关键词:
自动分词,自动标引
[期刊] 情报理论与实践
[作者]
王玮 刘丹
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
关键词:
汉语文献,自动分词,文献标引
[期刊] 情报学报
[作者]
刘永丹
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。
[期刊] 情报理论与实践
[作者]
欧金森
论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手,利用语法关系去掉目标词外围的词和字,同时注意区分去留字和词间的切分点,从而提高抽词效果。这种字处理运行机制的算法,为汉语主题抽调提出了新方法,并可与位控赋词并联运行,构成一整套字处理取词系统。
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 物流技术
[作者]
王成林 任亚男
随着整个社会经济形态的转变,社会对物流产业的需求定位也在不断地发生变化,同时对物流产业内涵和外延理解也进一步地深入。目前物流产业已经成为国民经济的重要战略支撑产业和先导性产业,是现代服务业的重要组成部分,通过物流产业带动、促进、推的
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文试图运用向量空间模型来确定文本段落之间内容的相关性 ,从而实现文本主题的自动分析 ,找出构成文本大主题的各个小主题 ,从这些小主题入手来实现自动文摘 ,可为自动文摘技术探索一条新途径。另一方面 ,通过文本结构的自动分析 ,可确定文本结构的类型 ,也为全文检索等信息处理技术提供一些有用的信息
关键词:
文本结构 向量空间模型 自动文摘
[期刊] 图书馆杂志
[作者]
郑春蕾
从比较地方文献与普通文献的差异入手,对地方文献的分类标引特点进行了分析阐述;并以首都图书馆采用《北京地方文献分类表》对北京地方文献的分类标引实践为例,分析其利弊,并针对存在的问题提出相应的改进措施。
关键词:
北京地方文献 分类标引 事物型分类
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除