- 年份
- 2024(6694)
- 2023(9857)
- 2022(8550)
- 2021(8111)
- 2020(7083)
- 2019(16553)
- 2018(16552)
- 2017(32058)
- 2016(17155)
- 2015(19634)
- 2014(19809)
- 2013(19356)
- 2012(17659)
- 2011(15774)
- 2010(15316)
- 2009(14242)
- 2008(13837)
- 2007(12308)
- 2006(10074)
- 2005(8803)
- 学科
- 济(70641)
- 经济(70572)
- 管理(50071)
- 业(48096)
- 企(40162)
- 企业(40162)
- 方法(39016)
- 数学(34945)
- 数学方法(34470)
- 财(18467)
- 农(17905)
- 中国(15747)
- 业经(14198)
- 学(14171)
- 贸(13463)
- 贸易(13459)
- 易(13101)
- 地方(12499)
- 务(12442)
- 财务(12390)
- 财务管理(12359)
- 农业(11817)
- 企业财务(11695)
- 制(11615)
- 理论(11471)
- 和(10885)
- 技术(10824)
- 环境(10158)
- 银(9764)
- 银行(9737)
- 机构
- 大学(246279)
- 学院(245501)
- 管理(99507)
- 济(97929)
- 经济(95877)
- 理学(87084)
- 理学院(86185)
- 管理学(84502)
- 管理学院(84052)
- 研究(74152)
- 中国(55621)
- 京(50356)
- 科学(46976)
- 财(43311)
- 农(39861)
- 业大(38430)
- 中心(37079)
- 所(36052)
- 财经(35832)
- 江(35174)
- 研究所(33174)
- 经(32601)
- 农业(31775)
- 范(31027)
- 北京(30770)
- 师范(30646)
- 经济学(29987)
- 州(28078)
- 经济学院(27373)
- 财经大学(26862)
- 基金
- 项目(171719)
- 科学(135653)
- 基金(126157)
- 研究(122119)
- 家(109880)
- 国家(109041)
- 科学基金(94815)
- 社会(77225)
- 社会科(73308)
- 社会科学(73286)
- 基金项目(67538)
- 省(67453)
- 自然(63626)
- 自然科(62208)
- 自然科学(62189)
- 自然科学基金(61071)
- 教育(57940)
- 划(56872)
- 资助(52083)
- 编号(49540)
- 成果(38677)
- 重点(38441)
- 部(38345)
- 创(35999)
- 发(35628)
- 科研(33949)
- 创新(33642)
- 教育部(33068)
- 课题(32987)
- 大学(32804)
共检索到336271条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 情报学报
[作者]
唐雪梅 苏祺 王军 杨浩
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary (OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》 3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 情报学报
[作者]
牛耘 朱献有
针对目前汉语自动分词系统中切分歧义的难点,本文提出利用神经网络模式识别的方法帮助消歧。介绍了所建立的实验系统,并进行了实验分析。
关键词:
切分歧义,神经网络,模式识别
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 情报理论与实践
[作者]
贾君枝 杨洁 卫荣娟
《汉语主题词表》是我国第一部大型综合性的广泛使用的叙词检索语言词表,如何实现该词表与其他词表的互操作,促进其在语义网环境下的应用发展具有重要意义。本文利用W3C组织颁布的简单知识组织系统(SKOS)的研究成果,讨论《汉语主题词表》的SKOS表示方法。为提高表示效率,运用Java技术,在定义《汉语主题词表》数据库结构和各个数据表之间逻辑关系的基础上,明确了从数据库向SKOS语言表示的自动转换思路,并设计代码完成转换。
关键词:
汉语主题词表 简单知识组织系统 语义网
[期刊] 情报学报
[作者]
林春实 方燕 全吉成
本文将汉语自动分词与标引技术的研究归结为机械分词、语义分词和基于神经网络的智能分词三大系列,分析了阻碍汉语自动分词研究发展的问题,并确认了自动分词研究的发展方向。
关键词:
自动分词,自动标引
[期刊] 中国特殊教育
[作者]
琚四化 钟经华 徐琴 施海燕 李圆梦 刘奕彤 梁惠燕 王炜杰
分词连写能力影响盲文书写能力,事关盲生的语言文字运用能力。采用听写的方式,使用汉语盲文语料库中的语段对129名盲生的汉语盲文分词连写能力进行测验,结果发现:盲生盲文分词连写错误较多,分词连写能力偏低;小学高年级段、初中段和高中段三个学段的盲生之间没有显著差异;不同性别盲生之间没有显著差异。盲生分词连写错误集中于大类上的词组分词连写错误;集中在小类上的“结构助词”“副词+动词”等8小类错误。未来,应重视盲生的分词连写能力,加强盲校分词连写教学,完善分词连写规则。
关键词:
分词连写 盲文 盲生 汉语盲文语料库
[期刊] 中国特殊教育
[作者]
琚四化 鲁明辉 张居晓 刘春玲 徐琴
分词连写规则是当前我国大陆地区书写汉语盲文时必须遵守的书写规范。针对分词连写规则,研究着重探讨了分词连写对汉语盲文阅读的促进作用,以及分词连写规则存在的条目过多、内容过度依赖汉语语法和部分规则内容不够明确三个方面的问题,并提出了调整、简化和取消三类改进措施。未来可展开针对分词连写功能的比较研究、针对分词连写规则问题的调查研究和针对具体改进措施的实验研究。
关键词:
盲文 分词连写 语法
[期刊] 情报理论与实践
[作者]
王玮 刘丹
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
关键词:
汉语文献,自动分词,文献标引
[期刊] 华中师范大学学报(自然科学版)
[作者]
张子涵 梁伟
复杂网络的Laplacian矩阵的特征值和特征向量包含了其拓扑和集体行为等重要信息.该文研究了演化的汉语语言网络的Laplacian矩阵的谱密度、谱排序和特征向量等.研究发现特征值集中分布在区间[0,3]上,并且随着网络规模的增加,[0,3]上的谱密度之和逐渐减小;如果将特征值按降序排列,那么排在最前面的特征值及其序号之间满足幂律分布,其它较大的特征值与中间部分的特征值则满足指数分布;网络的度与前三大特征值对应的特征向量有关,但两者的变化趋势又不尽相同.此外,还将上述结论与邻接矩阵的结果进行了比较.
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除