标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(74)
2023(117)
2022(103)
2021(85)
2020(93)
2019(204)
2018(204)
2017(364)
2016(186)
2015(206)
2014(207)
2013(190)
2012(190)
2011(176)
2010(148)
2009(156)
2008(121)
2007(110)
2006(103)
2005(96)
作者
(648)
(522)
(491)
(460)
(293)
(253)
(207)
(190)
(187)
(184)
(183)
(181)
(181)
(164)
(153)
(150)
(148)
(140)
(135)
(132)
(130)
(129)
(121)
(120)
(118)
(112)
(112)
(112)
(110)
(109)
学科
统计(258)
图书(237)
书馆(231)
图书馆(231)
(228)
(225)
经济(224)
管理(222)
方法(219)
理论(216)
自动(200)
自动化(197)
(175)
网络(175)
文献(174)
(174)
网络化(173)
(168)
情报(167)
(164)
研究(155)
教学(152)
(150)
(142)
编目(142)
资料(141)
分析(138)
(138)
情报资料(137)
标引(130)
机构
大学(2730)
学院(2541)
研究(897)
管理(882)
(844)
中国(775)
信息(747)
科学(717)
理学(684)
理学院(664)
管理学(608)
管理学院(599)
(571)
(545)
经济(539)
业大(499)
(495)
北京(493)
(459)
图书(455)
师范(455)
研究所(455)
中心(453)
技术(451)
农业(436)
(430)
书馆(428)
图书馆(428)
(427)
工程(405)
基金
项目(1812)
科学(1377)
基金(1302)
研究(1256)
(1190)
国家(1183)
科学基金(1000)
社会(705)
社会科(672)
社会科学(671)
成果(665)
自然(654)
基金项目(640)
自然科(640)
自然科学(640)
编号(626)
自然科学基金(623)
资助(565)
(559)
(559)
教育(515)
项目编号(499)
(496)
研究成果(407)
之一(386)
国家社会(371)
重点(371)
计划(354)
科研(327)
(326)
期刊
学报(991)
图书(795)
情报(752)
研究(617)
大学(596)
中国(573)
统计(568)
书馆(523)
图书馆(523)
学学(477)
(399)
科学(384)
(364)
决策(359)
(358)
经济(358)
教育(347)
技术(320)
理论(306)
实践(305)
(305)
(289)
农业(278)
管理(240)
工作(224)
业大(221)
情报工作(220)
图书馆学(205)
农业大学(177)
(164)
共检索到4417条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书馆杂志  [作者] 张琪玉  
自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢的重要原因之一,并具体列举了一些相关问题。
[期刊] 情报理论与实践  [作者] 杨建林  张国梁  
An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...
[期刊] 图书情报工作  [作者] 钱智勇  周建忠  童国平  苏新宁  
研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。
[期刊] 情报学报  [作者] 潘有能  
本文介绍一个自动分词分类系统的实现过程。该系统采用“后控词表分词法” ,解决了词典分词法中词典构造困难、更新滞后的问题 ,提高了主题词标引的质量和效率 ,并通过对词表分类法的完善和优化 ,使自动分类的结果达到了实用水平
[期刊] 情报学报  [作者] 李家福  张亚非  
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
[期刊] 数据分析与知识发现  [作者] 王晓玉  李斌  
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报  [作者] 郭祥昊  钟义信  杨丽  
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
[期刊] 图书馆杂志  [作者] 张琪玉  
本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。
[期刊] 情报学报  [作者] 张翠英  亢临生  
歧义问题是自动分词系统中要解决的主要问题之一。本文介绍一种在最大匹配法基础上,根据大量的真实语料中出现的歧义现象,把可能产生歧义切分的词进行特性分类,对每类确定一组规则进行处理
[期刊] 中国图书馆学报  [作者] 熊回香  
歧义处理是汉语自动分词的核心问题,汉语自动分词是中文信息检索的基础性课题。目前有基于词典的分词方法、基于统计的分词方法、基于语义的分词方法和基于人工智能的分词方法。自动分词的歧义处理,目前主要有:利用“长词优先”排歧,利用特征词消歧,利用“互信息”和“t-信息差”消歧,利用专家系统分词消歧。参考文献15。
[期刊] 图书情报工作  [作者] 奉国和  郑伟  
认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
[期刊] 情报学报  [作者] 尹锋  
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
[期刊] 情报学报  [作者] 张民  李生  王海峰  赵铁军  王铁志  
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
[期刊] 情报理论与实践  [作者] 王玮  刘丹  
详细分析了目前汉语文献自动分词存在的问题,即词法的复杂性、切分的模糊性和语法分析问题。然后提出了汉语文献自动分词的发展趋向。
[期刊] 情报理论与实践  [作者] 白振田  侯汉清  
本文借鉴了关键词轮排原理,结合相关统计模型,从正反两个方面对原始抽词词典进行压缩和优选,以达到降维和准确表达主题的目的;并基于海量新闻文本进行了自动分类测试,结果表明该约简算法在构造核心关键词词典方面是可行的。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除