- 年份
- 2023(1804)
- 2022(1661)
- 2021(1677)
- 2020(1455)
- 2019(3302)
- 2018(3323)
- 2017(6631)
- 2016(3656)
- 2015(4211)
- 2014(4382)
- 2013(4385)
- 2012(4234)
- 2011(3824)
- 2010(4056)
- 2009(3761)
- 2008(3945)
- 2007(3741)
- 2006(3518)
- 2005(3492)
- 2004(3194)
- 学科
- 济(13465)
- 经济(13432)
- 管理(10417)
- 业(10043)
- 企(7823)
- 企业(7823)
- 中国(5138)
- 农(5019)
- 财(4769)
- 制(4531)
- 方法(3891)
- 学(3682)
- 银(3470)
- 银行(3468)
- 和(3381)
- 行(3291)
- 农业(3194)
- 业经(3178)
- 地方(3064)
- 贸(3025)
- 贸易(3023)
- 数学(2979)
- 易(2923)
- 数学方法(2847)
- 融(2842)
- 金融(2841)
- 税(2765)
- 体(2713)
- 理论(2686)
- 务(2648)
- 机构
- 大学(54886)
- 学院(53611)
- 济(21159)
- 经济(20551)
- 研究(20334)
- 管理(19110)
- 中国(17494)
- 理学(15064)
- 理学院(14861)
- 管理学(14535)
- 管理学院(14426)
- 京(12646)
- 财(11799)
- 科学(11578)
- 所(11101)
- 中心(9828)
- 江(9463)
- 研究所(9457)
- 北京(8849)
- 范(8714)
- 师范(8687)
- 财经(8452)
- 农(7986)
- 州(7804)
- 经(7507)
- 师范大学(6971)
- 院(6923)
- 省(6716)
- 业大(6275)
- 系(6211)
共检索到99010条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
王玮 刘丹
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
关键词:
汉语文献,自动分词,文献标引
[期刊] 情报学报
[作者]
林春实 方燕 全吉成
本文将汉语自动分词与标引技术的研究归结为机械分词、语义分词和基于神经网络的智能分词三大系列,分析了阻碍汉语自动分词研究发展的问题,并确认了自动分词研究的发展方向。
关键词:
自动分词,自动标引
[期刊] 情报学报
[作者]
刘永丹
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。
[期刊] 情报理论与实践
[作者]
欧金森
论述一种采用字处理方式用计算机从汉语文献中抽词的方法。该方法从目标词的外部着手,利用语法关系去掉目标词外围的词和字,同时注意区分去留字和词间的切分点,从而提高抽词效果。这种字处理运行机制的算法,为汉语主题抽调提出了新方法,并可与位控赋词并联运行,构成一整套字处理取词系统。
[期刊] 情报学报
[作者]
李家福 张亚非
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
关键词:
分词 汉语 EM算法 语料库 HMM
[期刊] 数据分析与知识发现
[作者]
王晓玉 李斌
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报
[作者]
郭祥昊 钟义信 杨丽
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词:
自然语言处理,分词算法,切分歧义
[期刊] 中国图书馆学报
[作者]
熊回香
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 情报学报
[作者]
尹锋
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:
神经网络,汉语分词
[期刊] 情报学报
[作者]
张民 李生 王海峰 赵铁军 王铁志
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
关键词:
汉语自动分词,歧义,平价函数,词规则
[期刊] 数据分析与知识发现
[作者]
倪维健 孙浩浩 刘彤 曾庆田
【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,
关键词:
领域文献 中文分词 分词优化 词频偏差
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 大学图书馆学报
[作者]
谢琴芳
探讨在当前信息技术和网络环境下,如何选择古籍文献书目记录的元数据格式,如何建立适应古籍文献编目对象特点的编目环境和如何实现资源共享等问题。
[期刊] 情报理论与实践
[作者]
王超 黄水清 杨小莉
本文针对信息表示和信息检索中的文外频率加权和逆文献频率加权进行定量分析。以《软件学报》2004年发表的166篇计算机类的文献为测试集,通过计算机切词,统计词频,分别计算出各种语词加权方式不同的权重,并进行比较分析,得出了逆文献频率加权优于文外频率加权法,对文献频率取对数的逆文献频率加权公式优于不取对数的加权公式的结论。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除