- 年份
- 2024(5704)
- 2023(8283)
- 2022(7084)
- 2021(6647)
- 2020(5745)
- 2019(13103)
- 2018(12937)
- 2017(25083)
- 2016(13121)
- 2015(14786)
- 2014(14226)
- 2013(13643)
- 2012(12409)
- 2011(10831)
- 2010(10204)
- 2009(9077)
- 2008(8341)
- 2007(6833)
- 2006(5619)
- 2005(4614)
- 学科
- 济(51070)
- 经济(51015)
- 管理(39460)
- 业(36554)
- 企(31118)
- 企业(31118)
- 方法(28313)
- 数学(25369)
- 数学方法(25008)
- 财(14927)
- 农(12230)
- 中国(11686)
- 业经(11217)
- 学(10802)
- 务(10454)
- 财务(10416)
- 财务管理(10392)
- 企业财务(9968)
- 贸(8581)
- 贸易(8579)
- 理论(8510)
- 易(8373)
- 技术(8325)
- 农业(8291)
- 地方(8090)
- 和(7889)
- 制(7645)
- 环境(7460)
- 划(6687)
- 信息(6670)
- 机构
- 大学(178153)
- 学院(175270)
- 管理(73090)
- 济(69838)
- 经济(68632)
- 理学(64190)
- 理学院(63573)
- 管理学(62384)
- 管理学院(62070)
- 研究(54766)
- 中国(40502)
- 京(36071)
- 科学(34770)
- 财(31031)
- 农(29694)
- 业大(28387)
- 中心(27244)
- 所(25849)
- 财经(25830)
- 江(24272)
- 研究所(23924)
- 经(23812)
- 农业(23739)
- 经济学(21754)
- 范(21417)
- 北京(21409)
- 师范(21080)
- 院(20525)
- 经济学院(19801)
- 财经大学(19648)
- 基金
- 项目(131760)
- 科学(104737)
- 基金(98638)
- 研究(92820)
- 家(87453)
- 国家(86798)
- 科学基金(75483)
- 社会(59796)
- 社会科(56780)
- 社会科学(56764)
- 基金项目(52492)
- 自然(50997)
- 省(50363)
- 自然科(49891)
- 自然科学(49873)
- 自然科学基金(49002)
- 划(43297)
- 教育(42978)
- 资助(39983)
- 编号(36857)
- 重点(29676)
- 部(29322)
- 成果(28572)
- 创(27954)
- 发(27449)
- 科研(26419)
- 创新(26206)
- 国家社会(25681)
- 教育部(25374)
- 计划(24999)
共检索到240123条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
唐雪梅 苏祺 王军 杨浩
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary (OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》 3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 图书情报工作
[作者]
常娥 张长秀 侯汉清 惠富平
借鉴现代汉语词义消歧的研究成果,提出一种改进的向量空间模型词义消歧方法,即在古汉语义项词语知识库的支持下,将待消歧多义词上下文与多义词的义项映射到向量空间模型中,完成语义消歧任务。以中国农业古籍全文数据库为统计语料,对10个典型古汉语多义词,共29个义项、1 836条待消歧上下文进行义项标注的实验,消歧平均正确率达到79.5%。
关键词:
向量空间模型 词义消歧 古汉语
[期刊] 长江大学学报(社科版)
[作者]
李华平
古汉语中有一类同义词本义不同而引申义相同或相近,如"愚-昧""浅-陋""回-复"等。这类同义词是在隐喻思维基础上构成的,可称为隐喻同义词。其有单向和双向两种类型,产生必须同时满足两个条件:第一,两词表现的概念必须具有相同的意象图式,体现在词义上就是具有相同的元义素;第二,必须有触发隐喻投射的动因,可以是语言内部的,如意义的相通相近、语音相同相近,也可以是语言外部的,如因语义空白而引起的词义引申、特殊的语用目的等。
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 图书情报工作
[作者]
黄水清 王东波 何琳
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
[期刊] 北京师范大学学报(社会科学版)
[作者]
郭燕妮 黄易青
戴震《转语二十章序》取虚词为例,按照意义和古音两条系联标准,用平行互证的方法重点证明了上古时地音变的一种类型——"位同",即发音部位发生了演变而发音方法保持不变。在"义同"的前提下,这种平行互证法可以证明上古发生过规律性音变、字形也发生过相应改变的虚词同源词。平行互证法是一种科学的、具有严密的推理逻辑的方法,戴震的平行互证具有由表及里的多层次证明逻辑。运用戴震的这种方法和结论对九组常用虚词的语源和声转渠道的规律性进行探讨,发现上古汉语虚词的声纽相通渠道主要有泥匣相转、泥喻相转、匣/疑与喻相转,韵转渠道主要有鱼之相转、歌鱼相转、歌通过鱼与之相转。
关键词:
戴震 位同 词源 上古汉语 转语 虚词
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 图书馆理论与实践
[作者]
王阳
《古汉语常用字字典》作为一部普及型较强的语文辞书,迄今已历五次修订,虽然在修订的过程中纠正了不少失误之处,但是仍有一些不足需要订正。今以第五版为考察对象,对其在释义、注释、例证、标点、用字等方面的问题加以辨正。
关键词:
《古汉语常用字字典》 释义 例证 订正
[期刊] 图书馆杂志
[作者]
袁雪梅
《史记》是汉语史研究中的重要语料,也是《汉语大词典》的重要书证来源。但《汉语大词典》对《史记》的利用依然存在一些问题,需要加以注意。
关键词:
史记 汉语大词典 书证
[期刊] 图书馆杂志
[作者]
董运来
本文继《汉语大词典拾补》一书和有关期刊关于《汉语大词典》书证的论文之后,举出《汉语大词典》书证首例时代偏晚三十一条,为修订该书及汉语词汇史建设准备。
关键词:
汉语大词典 书证 时代
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除